abstract

主要任务是在西班牙tweet中进行情感分类,主要使用到bags-of-words,bag-of-characters和tweet embedding。

尤其是训练了单词前缀embedding(subword-aware word embedding)的鲁棒性和使用权重均衡策略(weighted-averageing strategy)计算了tweet的表示法。使用两种数据增强技术来处理数据稀缺性问题。双向交叉增强(two-way-translation)和实例交叉增强(instance crossover augmentation),一种结合一半tweet生成新的实例的新技术。

训练了线性分类器和集成模型。

Introduction

  • 任务
  • 数据集
  • 基本思路:分成两个子任务,在单语言子任务中,系统必须在同一数据集上进行训练和测试。在交叉语言任务中,系统必须使用非用于测试国家的语言数据集进行测试。
  • 介绍数据怎么处理,技术大概有哪些
  • 其他工作

Techniques and Resources

  • 数据处理
  • Bags of words and characters
  • Word Embeddings
  • Tweet Embeddings
  • Data Augmentation witg Two-Wag Translation
  • Data Augmentation with Instance Crossover

Experiments

介绍使用的环境,模型,包等等。

  • System Development:系统的构建,探索模型的好坏,超参数的设置,实验结果:分类报告,混淆矩阵
  • Subtask 1: Monolingual Experiments:
  • Subtask 2: Crosslingual Experiments
  • Ablation Tests :控制变量法

Conclusions

TASS 2019: Data Augmentation and Robust Embeddings for Sentiment Analysis相关推荐

  1. Virtual Data Augmentation: 虚拟数据扩增技术

    听说过数据扩增(Data Augmentation),也听说过虚拟对抗训练(Virtual Adversarial Traning),但是我没想到会有人将其结合,谓之虚拟数据扩增(Virtual Da ...

  2. 语音识别(ASR)论文优选:A comparison of streaming models and data augmentation methods for robust speech recog

    声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵.搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html.语音合成领域论文列表请访问h ...

  3. 【Hide-and-Seek】《Hide-and-Seek: A Data Augmentation Technique for Weakly-Supervised Localization xxx》

    ICCV-2017 文章目录 1 Background and Motivation 2 Related Work 3 Advantages / Contributions 4 Method 5 Ex ...

  4. 讨论数据增强(data augmentation)的有效性

    讨论数据增强(data augmentation)的有效性 FesianXu 20210216 at Baidu intern 前言 在知乎上遇到了一个问题并且进行了简单的回答,如何证明数据增强(Da ...

  5. (ICASSP 19)AUTOMATIC GRAMMAR AUGMENTATION FOR ROBUST VOICE COMMAND RECOGNITION

    会议:ICASSP 2019 论文:AUTOMATIC GRAMMAR AUGMENTATION FOR ROBUST VOICE COMMAND RECOGNITION 作者:Yang Yang ; ...

  6. Sentiment Analysis at SEPLN (TASS)-2019: Sentiment Analysis at Tweet Level Using Deep Learning

    Abstract 本文描述了Sentiment Analysis at SEPLN (TASS)-2019这个任务的系统,这个任务包括对西班牙语tweet进行情感分析,这些tweet包含了使用不同西班 ...

  7. 【Data augmentation in NLP】——1

    前两周学校内上鉴萍老师的"智能工程计算实践"课程,讲到"真实场景下的应用"方面,讲了一些数据增强方法,觉得很有实际意义.因此在这里想深入学习一下. 本文为数据增 ...

  8. Medical Image Synthesis for Data Augmentation and Anonymization

    Medical Image Synthesis for Data Augmentation and Anonymization Using Generative Adversarial Network ...

  9. tf torch keras 数据增强 data augmentation

    数据增强 data augmentation 2017年11月14日 22:19:27 阅读数:7964

最新文章

  1. WPF:Animation动画--AnimationTiming动画时机
  2. flask web开发的相关博文学习
  3. 英语口语 week11 Friday
  4. Windows监听进程是否退出C++
  5. 居家隔离14+7天的第三天 2021年8月1日15:49:09
  6. Android/Linux boot time分析优化
  7. 对JavaScript解析JSON格式数据的理解
  8. 2019常用的几种编程语言的简单介绍和特点以及应用领域
  9. JDY-24M钥匙标签使用说明
  10. 计算机游戏软件制作,游戏制作软件,制作游戏的软件
  11. 直播功能引入微信小程序
  12. 抓取微信小程序数据加密内容
  13. 使用Android Studio开发widget安卓桌面插件
  14. SequoiaDB巨杉数据库成为唯一入选 “硅谷2016 大数据地形图”中国厂商, 企业级市场超越MongoDB等海外产品
  15. 留着以后慢慢做的计算几何(题表)
  16. gis服务器上怎么新建文件夹,上传服务定义 (服务器)
  17. 简单记录下安卓程序GPStest
  18. 三年308%投资回报!IDC点评戴尔科技存储家族
  19. Oracle I/O问题解析
  20. 微信小程序蓝牙调试助手源码

热门文章

  1. 【全源码及文档】基于Java面向对象开发的房屋中介管理系统
  2. gif动图怎么制作?视频转gif在线制作方法
  3. android 仿小红书标签,Android 仿小红书图片标签
  4. linux下tomcat的安装
  5. MySQL数据库命令
  6. vue基础二(组件)
  7. 大学什么时候考合适计算机二级证
  8. 老婆和老妈同时掉在了水里的答案
  9. linux播放器安卓系统下载软件,linux系统如何安装在线播放器和QQ?等常用软件?
  10. 计算机专业的大学生vlog日常,【干货分享】手把手教你拍好在校大学生的VLOG