TASS 2019: Data Augmentation and Robust Embeddings for Sentiment Analysis
abstract
主要任务是在西班牙tweet中进行情感分类,主要使用到bags-of-words,bag-of-characters和tweet embedding。
尤其是训练了单词前缀embedding(subword-aware word embedding)的鲁棒性和使用权重均衡策略(weighted-averageing strategy)计算了tweet的表示法。使用两种数据增强技术来处理数据稀缺性问题。双向交叉增强(two-way-translation)和实例交叉增强(instance crossover augmentation),一种结合一半tweet生成新的实例的新技术。
训练了线性分类器和集成模型。
Introduction
- 任务
- 数据集
- 基本思路:分成两个子任务,在单语言子任务中,系统必须在同一数据集上进行训练和测试。在交叉语言任务中,系统必须使用非用于测试国家的语言数据集进行测试。
- 介绍数据怎么处理,技术大概有哪些
- 其他工作
Techniques and Resources
- 数据处理
- Bags of words and characters
- Word Embeddings
- Tweet Embeddings
- Data Augmentation witg Two-Wag Translation
- Data Augmentation with Instance Crossover
Experiments
介绍使用的环境,模型,包等等。
- System Development:系统的构建,探索模型的好坏,超参数的设置,实验结果:分类报告,混淆矩阵
- Subtask 1: Monolingual Experiments:
- Subtask 2: Crosslingual Experiments
- Ablation Tests :控制变量法
Conclusions
TASS 2019: Data Augmentation and Robust Embeddings for Sentiment Analysis相关推荐
- Virtual Data Augmentation: 虚拟数据扩增技术
听说过数据扩增(Data Augmentation),也听说过虚拟对抗训练(Virtual Adversarial Traning),但是我没想到会有人将其结合,谓之虚拟数据扩增(Virtual Da ...
- 语音识别(ASR)论文优选:A comparison of streaming models and data augmentation methods for robust speech recog
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵.搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html.语音合成领域论文列表请访问h ...
- 【Hide-and-Seek】《Hide-and-Seek: A Data Augmentation Technique for Weakly-Supervised Localization xxx》
ICCV-2017 文章目录 1 Background and Motivation 2 Related Work 3 Advantages / Contributions 4 Method 5 Ex ...
- 讨论数据增强(data augmentation)的有效性
讨论数据增强(data augmentation)的有效性 FesianXu 20210216 at Baidu intern 前言 在知乎上遇到了一个问题并且进行了简单的回答,如何证明数据增强(Da ...
- (ICASSP 19)AUTOMATIC GRAMMAR AUGMENTATION FOR ROBUST VOICE COMMAND RECOGNITION
会议:ICASSP 2019 论文:AUTOMATIC GRAMMAR AUGMENTATION FOR ROBUST VOICE COMMAND RECOGNITION 作者:Yang Yang ; ...
- Sentiment Analysis at SEPLN (TASS)-2019: Sentiment Analysis at Tweet Level Using Deep Learning
Abstract 本文描述了Sentiment Analysis at SEPLN (TASS)-2019这个任务的系统,这个任务包括对西班牙语tweet进行情感分析,这些tweet包含了使用不同西班 ...
- 【Data augmentation in NLP】——1
前两周学校内上鉴萍老师的"智能工程计算实践"课程,讲到"真实场景下的应用"方面,讲了一些数据增强方法,觉得很有实际意义.因此在这里想深入学习一下. 本文为数据增 ...
- Medical Image Synthesis for Data Augmentation and Anonymization
Medical Image Synthesis for Data Augmentation and Anonymization Using Generative Adversarial Network ...
- tf torch keras 数据增强 data augmentation
数据增强 data augmentation 2017年11月14日 22:19:27 阅读数:7964
最新文章
- WPF:Animation动画--AnimationTiming动画时机
- flask web开发的相关博文学习
- 英语口语 week11 Friday
- Windows监听进程是否退出C++
- 居家隔离14+7天的第三天 2021年8月1日15:49:09
- Android/Linux boot time分析优化
- 对JavaScript解析JSON格式数据的理解
- 2019常用的几种编程语言的简单介绍和特点以及应用领域
- JDY-24M钥匙标签使用说明
- 计算机游戏软件制作,游戏制作软件,制作游戏的软件
- 直播功能引入微信小程序
- 抓取微信小程序数据加密内容
- 使用Android Studio开发widget安卓桌面插件
- SequoiaDB巨杉数据库成为唯一入选 “硅谷2016 大数据地形图”中国厂商, 企业级市场超越MongoDB等海外产品
- 留着以后慢慢做的计算几何(题表)
- gis服务器上怎么新建文件夹,上传服务定义 (服务器)
- 简单记录下安卓程序GPStest
- 三年308%投资回报!IDC点评戴尔科技存储家族
- Oracle I/O问题解析
- 微信小程序蓝牙调试助手源码