AEDA: An Easier Data Augmentation Technique for Text Classification
论文地址:AEDA: An Easier Data Augmentation Technique for Text Classification
文章目录
- 论文阅读
- 论文介绍
- AEDA Augmentation
- 总结和未来工作
论文阅读
论文介绍
本文提出了AEDA(一种更简单的数据增强)技术来帮助提高文本分类任务的性能。为了构建性能良好的文本分类器,训练数据需要足够大,以便模型能够泛化到看不见的数据。简而言之就是对于文本分类任务来说,在句子中插入一些标点符号是最强的数据扩增方法。
AEDA Augmentation
插入标点符号的个数为,从序列1到三分之一中随机选择一个数字表示为执行插入的次数。然后,序列中的位置也被随机指定,与前面步骤中选择的数字相同。最后,对于每个选择的位置,从{“.”, “;”, “?”, “:”, “!”, “,”}中的六个标点符号中随机抽取一个标点符号。
扩充例子如下:
原论文做了大量文本分类任务的实验,并且与 EDA 方法进行了比较,首先看下面一组图,作者在 5 个数据集上进行了对比(模型为 RNN)
在 BERT 上的效果如下表所示,
总结和未来工作
本文提出了一种简单的文本分类任务的数据增强技术。未来的工作将集中于开发所提出的方法,即哪些标点符号可以产生更大的影响,哪些可以添加或丢弃哪些,以及有多少标点符号可以用来获得更好的性能。此外,还将研究标点符号是否应该随机插入或某些位置更有效的问题。
AEDA: An Easier Data Augmentation Technique for Text Classification相关推荐
- 小样本学习记录————文本中特征空间的数据增强MEDA: Meta-Learning with Data Augmentation for Few-Shot Text Classification
MEDA: Meta-Learning with Data Augmentation for Few-Shot Text Classification 出发点 数据增强 球合成器 合成模块Synthe ...
- MEDA: Meta-Learning with Data Augmentation for Few-Shot Text Classification
目录 1. Introduction 2. Related Work 3. Preliminaries 4. MEDA 4.1 Ball Generator 4.2 Hybrid Loss 4.3 T ...
- 【Hide-and-Seek】《Hide-and-Seek: A Data Augmentation Technique for Weakly-Supervised Localization xxx》
ICCV-2017 文章目录 1 Background and Motivation 2 Related Work 3 Advantages / Contributions 4 Method 5 Ex ...
- Dual Contrastive Learning: Text Classification via Label-Aware Data Augmentation 阅读笔记
Dual Contrastive Learning: Text Classification via Label-Aware Data Augmentation PyTorch实现:https://g ...
- 《Learn to Augment: Joint Data Augmentation and Network Optimization for Text》
论文原文,答辩PPT,读书报告,实现代码增强学习:文本识别的联合数据增强和网络优化.-CSDN下载 CVPR2020论文: <Learn to Augment: Joint Dat ...
- [UDA]Unsupervised Data Augmentation for Consistency Training
目录 Abstract 1 Introduction 2 Unsupervised Data Augmentation (UDA) Discussion Augmentation Strategies ...
- WS-DAN:Weakly Supervised Data Augmentation Netowrk for Fine-Grained Visual Classification
See Better Before Looking Closer: Weakly Supervised Data Augmentation Netowrk for Fine-Grained Visua ...
- 【Data augmentation in NLP】——1
前两周学校内上鉴萍老师的"智能工程计算实践"课程,讲到"真实场景下的应用"方面,讲了一些数据增强方法,觉得很有实际意义.因此在这里想深入学习一下. 本文为数据增 ...
- Virtual Data Augmentation: 虚拟数据扩增技术
听说过数据扩增(Data Augmentation),也听说过虚拟对抗训练(Virtual Adversarial Traning),但是我没想到会有人将其结合,谓之虚拟数据扩增(Virtual Da ...
最新文章
- 学习全基因组测序数据分析2:FASTA和FASTQ
- 用ffmpeg把H264数据流解码成YUV420P
- 许家印大笔押注新能源:恒大集团1200亿沈阳投资建厂造车
- 此计算机缺少vc2005_spl_with_atl_fix_redist解决问题
- 最精确的噪音测试软件,关于噪音测试App的选择与使用
- spring data jpa 之初体验
- 泛微E8、E9二次开发、泛微开发获取流程文档主、明细表单值,提供泛微ecology8二次开发完整项目下载,泛微把流程文档内容推送HR、ERP、SAP操作,泛微与ERP、SAP、HR集成
- 采集插件,自动采集伪原创发布插件
- 数学文化——数论之美
- 高版本Ubuntu(如22.02)修改apt源,快速安装低版本gcc/g++
- 百度语音识别之拼音识别
- 基于VMware12虚拟机的Hadoop3.1.2伪分布式安装(含各软件百度云下载地址、安装过程中各类问题的解决方案)
- HAUT2021蓝桥杯专题练习第四周记录——贪心
- matlab中ARCH效应检验步骤,请教一下各位大神!如何判断ARCH效应(附ARCH-LM检验结果)...
- 浏览器打开一个网站可能经历哪些步骤
- 信息系统项目管理:项目经理担任什么样的角色?
- itunes iphone 同步的操纵。。
- x64dbg和IDA pro 配置PDB 符号文件symbols
- python第三方插件pip是什么_什么是pip,如何安装管理第三方模块
- 小蓝同学的前端之旅--HTML\CSS集成复习