数据增强让有限的数据产生更多的数据,增加训练样本的数量以及多样性(噪声数据),提升模型鲁棒性,一般用于训练集。神经网络需要大量的参数,许许多多的神经网路的参数都是数以百万计,而使得这些参数可以正确工作则需要大量的数据进行训练,但在很多实际的项目中,我们难以找到充足的数据来完成任务。随机改变训练样本可以降低模型对某些属性的依赖,从而提高模型的泛化能力。

数据增强方法:

例如,我们可以对图像进行不同方式的裁剪,让物体以不同的实例出现在图像的不同位置,这同样能够降低模型对目标位置的敏感性。此外,调整亮度、对比度、饱和度和色调 等因素来降低模型对色彩的敏感度。再有,随机裁剪、随机反转、随机对比度增强、颜色变化等等。一般来讲随机反转和一个小比例的random resize,再接随机裁剪比较常用。NLP中将字和词连接起来就形成了一个新样本,也属于数据增强。

数据增强的分类:

数据增强可以分为两类,一类是离线增强,一类是在线增强。

· 离线增强 : 直接对数据集进行处理,数据的数目会变成增强因子乘以原数据集的数目,这种方法常常用于数据集很小的时候。

· 在线增强 : 这种增强的方法用于,获得批量(batch)数据之后,然后对这个批量(batch)的数据进行增强,如旋转、平移、翻折等相应的变化,由于有些数据集不能接受线性级别的增长,这种方法长用于大的数据集,很多机器学习框架已经支持了这种数据增强方式,并且可以使用 GPU 优化计算。

什么是数据增强(Data Augmentation)相关推荐

  1. tf torch keras 数据增强 data augmentation

    数据增强 data augmentation 2017年11月14日 22:19:27 阅读数:7964

  2. Dataset之DA:数据增强(Data Augmentation)的简介、方法、案例应用之详细攻略

    Dataset之DA:数据增强(Data Augmentation)的简介.方法.案例应用之详细攻略 目录 DA的简介 DA的方法 DA的案例应用 DA的简介 数据集增强主要是为了减少网络的过拟合现象 ...

  3. 吴恩达神经网络和深度学习-学习笔记-38-使用开源的方案+迁移学习+数据增强data augmentation

    使用别人的开源成果 想要用现成的网络,最好在网络上找到开源的实现,这要比从头开始实现快得多. 比如:直接在Google上搜索resnets github,找到合适的后点击下载会得到URL,然后在cmd ...

  4. 数据增强 data augmentation

    有人称为数据扩充,不过更多按原意翻译为:数据增强(补充:数据增广更准确) 数据增强的方法种类 一些常见方法,如裁剪/缩放/彩色变换/翻转等,可参考:https://www.cnblogs.com/zh ...

  5. 【方法】数据增强(Data Augmentation)

    在训练过程中,网络优化是一方面,数据集的优化又是另一方面.数据集会存在各类样本不均匀的情况,也就是各类样本的数量不一样,有的甚至差别很大.为了让模型具有更强的鲁棒性,采用Data Augmentati ...

  6. 深度学习图像数据增强data augmentation

    本文转自:http://www.cnblogs.com/gongxijun/p/6117588.html 在图像的深度学习中,为了丰富图像训练集,更好的提取图像特征,泛化模型(防止模型过拟合),一般都 ...

  7. 使用 imgaug 对图像进行数据增强 Data Augmentation

    所谓数据增强,就正如 imgaug 库对自己的介绍: This python library helps you with augmenting images for your machine lea ...

  8. 【深度学习】数据扩充 (Data Augmentation)

    Introduction 数据扩充(data augmentation),又名 数据增强 / 数据增广. 其本质即: 缺少海量数据时,为了保证模型的有效训练,一分钱掰成两半花. 数据扩充方法包括: 简 ...

  9. NLP:数据增强/Data Argumentation【词汇替换、随机Mask、回译、添加噪声】

    数据增强技术在计算机视觉中应用的比较广泛,但是在 NLP 中却很少能得到有效的应用.本质原因在于图像中的一些数据增强方法,比如将图像旋转几度或将其色度转换为灰度,在增强数据的同时并不会改变图像本身的含 ...

  10. 深度学习: 数据扩充 (Data Augmentation)

    https://blog.csdn.net/JNingWei/article/details/79219838 Mixup Cutout CutMix Mosaic Data_Augmentation ...

最新文章

  1. cache.config配置文件解读
  2. Spring+Quartz实现定时任务的配置方法
  3. FPGA篇(三)基于FPGA的几种排序算法
  4. 【杂谈】GAN对人脸图像算法产生了哪些影响?
  5. linux安装RabbitMQ和amqp扩展(这个安装rabbitmq通过了但是代码测试没有通过)
  6. mysql中update實現子查詢的方法
  7. HUST软工1506班第2周作业成绩公布
  8. pythonifnotnone_使用 if x is not None 还是if not x is None
  9. Kotlin学习笔记 第二章 类与对象 第一节类与继承(补)
  10. freertos 创建互斥量_freertos任务通信
  11. 把excel每一行中的数据输出为一个txt文档的VBA函数
  12. 使用PDF-XChange Editor为PDF文件添加签名(图片+签名)
  13. 家庭宽带搭建个人服务器
  14. (七)HyperledgerFarbic1.4- Fabric的SDK使用
  15. 原来这就是 UI 设计师的门槛
  16. Aspose Word常用操作
  17. python 安装PIL模块,并且查看图片大小
  18. 由电影Matrix(骇客帝国)联想到的操作系统知识
  19. 在excel图表上添加数据标签
  20. 嵌入式单片机及其相关博客及教程

热门文章

  1. qt GraphicsScene添加背景
  2. 【Docker 那些事儿】如何安全地停止、删除容器
  3. 中柏平板u盘启动_中柏笔记本一键U盘重装系统教程图解
  4. 蚁人2:黄蜂女现身全集百度云资源
  5. 检验新买内存条的真假
  6. java 回合制抛物线游戏_回合制抛物线射击游戏《坦克总动》重磅来袭!
  7. Playrix《梦想小镇》为何能成为10亿美元独角兽?
  8. zabbix 应用日志监控报警
  9. idea文件名颜色的区别
  10. 女友升级到老婆的过程中发生的bug