论文地址:AEDA: An Easier Data Augmentation Technique for Text Classification

文章目录

  • 论文阅读
    • 论文介绍
    • AEDA Augmentation
    • 总结和未来工作

论文阅读

论文介绍

本文提出了AEDA(一种更简单的数据增强)技术来帮助提高文本分类任务的性能。为了构建性能良好的文本分类器,训练数据需要足够大,以便模型能够泛化到看不见的数据。简而言之就是对于文本分类任务来说,在句子中插入一些标点符号是最强的数据扩增方法。

AEDA Augmentation

插入标点符号的个数为,从序列1到三分之一中随机选择一个数字表示为执行插入的次数。然后,序列中的位置也被随机指定,与前面步骤中选择的数字相同。最后,对于每个选择的位置,从{“.”, “;”, “?”, “:”, “!”, “,”}中的六个标点符号中随机抽取一个标点符号。
扩充例子如下:

原论文做了大量文本分类任务的实验,并且与 EDA 方法进行了比较,首先看下面一组图,作者在 5 个数据集上进行了对比(模型为 RNN)

在 BERT 上的效果如下表所示,

总结和未来工作

本文提出了一种简单的文本分类任务的数据增强技术。未来的工作将集中于开发所提出的方法,即哪些标点符号可以产生更大的影响,哪些可以添加或丢弃哪些,以及有多少标点符号可以用来获得更好的性能。此外,还将研究标点符号是否应该随机插入或某些位置更有效的问题。

AEDA: An Easier Data Augmentation Technique for Text Classification相关推荐

  1. 小样本学习记录————文本中特征空间的数据增强MEDA: Meta-Learning with Data Augmentation for Few-Shot Text Classification

    MEDA: Meta-Learning with Data Augmentation for Few-Shot Text Classification 出发点 数据增强 球合成器 合成模块Synthe ...

  2. MEDA: Meta-Learning with Data Augmentation for Few-Shot Text Classification

    目录 1. Introduction 2. Related Work 3. Preliminaries 4. MEDA 4.1 Ball Generator 4.2 Hybrid Loss 4.3 T ...

  3. 【Hide-and-Seek】《Hide-and-Seek: A Data Augmentation Technique for Weakly-Supervised Localization xxx》

    ICCV-2017 文章目录 1 Background and Motivation 2 Related Work 3 Advantages / Contributions 4 Method 5 Ex ...

  4. Dual Contrastive Learning: Text Classification via Label-Aware Data Augmentation 阅读笔记

    Dual Contrastive Learning: Text Classification via Label-Aware Data Augmentation PyTorch实现:https://g ...

  5. 《Learn to Augment: Joint Data Augmentation and Network Optimization for Text》

    论文原文,答辩PPT,读书报告,实现代码​​​​​​​增强学习:文本识别的联合数据增强和网络优化.-CSDN下载 CVPR2020论文: <Learn to Augment: Joint Dat ...

  6. [UDA]Unsupervised Data Augmentation for Consistency Training

    目录 Abstract 1 Introduction 2 Unsupervised Data Augmentation (UDA) Discussion Augmentation Strategies ...

  7. WS-DAN:Weakly Supervised Data Augmentation Netowrk for Fine-Grained Visual Classification

    See Better Before Looking Closer: Weakly Supervised Data Augmentation Netowrk for Fine-Grained Visua ...

  8. 【Data augmentation in NLP】——1

    前两周学校内上鉴萍老师的"智能工程计算实践"课程,讲到"真实场景下的应用"方面,讲了一些数据增强方法,觉得很有实际意义.因此在这里想深入学习一下. 本文为数据增 ...

  9. Virtual Data Augmentation: 虚拟数据扩增技术

    听说过数据扩增(Data Augmentation),也听说过虚拟对抗训练(Virtual Adversarial Traning),但是我没想到会有人将其结合,谓之虚拟数据扩增(Virtual Da ...

最新文章

  1. 学习全基因组测序数据分析2:FASTA和FASTQ
  2. 用ffmpeg把H264数据流解码成YUV420P
  3. 许家印大笔押注新能源:恒大集团1200亿沈阳投资建厂造车
  4. 此计算机缺少vc2005_spl_with_atl_fix_redist解决问题
  5. 最精确的噪音测试软件,关于噪音测试App的选择与使用
  6. spring data jpa 之初体验
  7. 泛微E8、E9二次开发、泛微开发获取流程文档主、明细表单值,提供泛微ecology8二次开发完整项目下载,泛微把流程文档内容推送HR、ERP、SAP操作,泛微与ERP、SAP、HR集成
  8. 采集插件,自动采集伪原创发布插件
  9. 数学文化——数论之美
  10. 高版本Ubuntu(如22.02)修改apt源,快速安装低版本gcc/g++
  11. 百度语音识别之拼音识别
  12. 基于VMware12虚拟机的Hadoop3.1.2伪分布式安装(含各软件百度云下载地址、安装过程中各类问题的解决方案)
  13. HAUT2021蓝桥杯专题练习第四周记录——贪心
  14. matlab中ARCH效应检验步骤,请教一下各位大神!如何判断ARCH效应(附ARCH-LM检验结果)...
  15. 浏览器打开一个网站可能经历哪些步骤
  16. 信息系统项目管理:项目经理担任什么样的角色?
  17. itunes iphone 同步的操纵。。
  18. x64dbg和IDA pro 配置PDB 符号文件symbols
  19. python第三方插件pip是什么_什么是pip,如何安装管理第三方模块
  20. 小蓝同学的前端之旅--HTML\CSS集成复习

热门文章

  1. ubuntu 16.04极速安装ROS-Kinetic,以及常见错误处理
  2. Xilinx不再是以前的Xilinx
  3. 【转】情牵牛仔裤 情色一生
  4. zcmu-1599 卡斯丁狗的炉石传说
  5. PAC 代理自动发现简介
  6. 思考的方法--张五常(1984 年 1 月 3 日)
  7. python lambda函数for 字符串_Python Lambda
  8. kettle学习教程
  9. 公司开发者账号申请分享
  10. python程序写诗_万能的 LSTM:可以写代码可以写诗还能做文本情感分析