1 背景

在许多领域,受限于数据获取难度大,标注成本高等原因,往往难以获得充足的训练数据,这样训练得到的深度学习模型往往存在过拟合的问题,进而导致模型泛化能力差,测试精度不高等。

数据扩充的作用:扩大样本集,提高模型泛化能力。

2 定义

数据增广,又称数据增强(data augmentation),是一种增加有限数据的数据量多样性的策略,试图从样本训练不足这一根本原因出发解决过拟合问题

3 方法

3.1 单数据变形

操作对象:单个数据

通过各种变换操作改变原始数据的表现形态,以产生不同于原始数据的新数据。

3.1.1 几何变换(geoneteic transformations)

原理:通过旋转、镜像、平移、裁剪、缩放和扭曲等变换方式生成新样本。

相当于在数据集上增加视角、位置方面的偏差以增强鲁棒性。

  • 优势:简单易实现,在大多数情况可以保留图像原有的语义标注。
  • 缺点:对数据重复记忆、增加信息量有限

【例】手写体识别:LeNet-5(LeCun等,1998)对MNIST数据集进行了四种仿射变换方式(平移、缩放、挤压、水平裁剪),将测试机错误率由0.95%降低到了0.8%。在本例中,仿射变换不会改变图像原本的语义标注。

注意点:选用的变换方法是否会改变图像原本的语义信息。对于现实生活物体或场景的数据集,如CIFAR-10、ImageNet,图像的纵向像素往往具有一定的语义,因此垂直镜像和过度旋转会完全改变图像原本的语义标注;而对于遥感图像,各方向的镜像都能保留语义信息。

CIFAR-10是一个包含10类物体的更接近普适物体的彩色图像数据集

Taylor和Nitschke(2017)的实验表明,对于生活中的物体图像:

  • 可旋转和镜像的程度有限,可增加的图像数量有限
  • 裁剪可得到更多的图像,且可以为模型引入物体在不同视角位置的更多信息。

3.1.2 色域变换(color space transormations)

原理:在图像各通道上进行亮度变换的生成方式。通过对数据集增加各种光照亮度偏差,增强模型在不同光照条件下的鲁棒性。

色域变换可保证模型在不同光照条件下的稳定性。

  • 色域变换没有增加图像中物体的空间信息
  • 可能丢失一些重要的颜色信息从而丢失图像的语义信息。

实现:

第一种,通道分段线性变换。根据RGB三通道,分离出三幅单色图像,分别进行分段线性变换。

第二种,直方图变换。通过改变图像的直方图来进行色彩变换。

第三种,PCA抖动(fancy PCA)。对原图像进行主成分分析(PCA),求得协方差矩阵,然后对主成分的特征值施加一个均值为0的随机扰动,再反变换回去。类似于给图像加了一个滤镜。

Taylor和Nitschke(2017)的实验表明:

  • 对于图像分类任务,空间几何信息比色彩信息更重要

3.1.3 清晰度变换

又被称为“核滤波器(kernel filters)”,与CNN的卷积核类似。

原理:通过滑动的n×m的矩阵对图像进行锐化和模糊处理,实现清晰度变换。

  • 模糊:高斯滤波器 --> 应对运动模糊
  • 锐化:高对比度的水平或垂直的边缘滤波器(edge filter) --> 突出物体更多细节信息

3.1.4 噪声注入(noise injection)

  • 模拟自然噪声
  • 人工设计噪声
    • 对抗噪声:用于对抗训练,针对对对抗样敏感的任务
    • 标签扰动:随机替换一些样本的标

3.1.5 局部擦除

原理:随机或人为对局部区域所有像素值信息的丢失,可视为一种再数据空间的dropout,相当于再图像上增加一些遮挡。

缺点:随机擦除可能篡改图像原有的语义信息。如“7”和“8”有可能因为局部信息的丢失,被篡改为“1”、“6”。

3.2 多数据混合

操作对象:多幅图像

3.2.1 图像空间的数据混合

SamplePairing

SamplePairing 从训练集中随 机抽取两幅图像,分别经过基础数据增广操作(如 随机裁剪、水平翻转等)处理后,以像素值取平均值 的形式叠加两幅图像合成一个新的样本,标签为原样本标签中的一种。

论文笔记 | 深度学习图像数据增广方法研究相关推荐

  1. 深度学习图像数据增广方法总结

    参考:Data Augmentation | How to use Deep Learning when you have Limited Data-Part 2 文章目录 1. 数据增广(Data ...

  2. 【深度学习】基于深度学习的数据增广技术一览

    ◎作者系极市原创作者计划特约作者Happy 周末在家无聊,偶然兴心想对CV领域常用的数据增广方法做个简单的调研与总结,重点是AI时代新兴的几种反响还不错的方法.各种第三方与官方实现代码等.那么今天由H ...

  3. 基于深度学习的数据增广技术一览

    周末在家无聊,偶然兴心想对CV领域常用的数据增广方法做个简单的调研与总结,重点是AI时代新兴的几种反响还不错的方法.各种第三方与官方实现代码等.那么今天由Happy来跟大家聊一聊深度学习中那些常用的数 ...

  4. 深度学习 之 数据增广(包含源码及注释文件更改)

    数据增广:平移,水平/垂直翻转,旋转,缩放,剪切,对比度,色彩抖动,噪声  #coding=utf-8 ################################################ ...

  5. 深度学习-MATLAB数据增广

    图片数据增广 对文件夹及其子文件夹下的图片数据进行简单的增广,四个方面,翻转,平移,增加高斯噪声,对比度增强,保存在当前文件夹中,命名为图片原名+ -1.-2.-3.-4,代表四个类. p=genpa ...

  6. 【深度学习】利用一些API进行图像数据增广

    [深度学习]利用一些API进行图像数据增广 文章目录 [深度学习]利用一些API进行图像数据增广 1 先送上一份最强的翻转代码(基于PIL) 2 Keras中的数据增强API种类概述 3 特征标准化 ...

  7. 【工大SCIR笔记】自然语言处理领域的数据增广方法

    点击上方,选择星标或置顶,每天给你送干货! 作者:李博涵 来自:哈工大SCIR 1.摘要 本文介绍自然语言处理领域的数据增广方法.数据增广(Data Augmentation,也有人将Data Aug ...

  8. 深度学习——day38 读论文:基于深度学习的数据竞争检测方法(DeleRace计算机研究与发展 2022)

    基于深度学习的数据竞争检测方法 chap0 Introduction 本文贡献: 原文及笔记下载 chap1 DeleRace 1.1 检测框架 1.2 选取实际应用程序 1.3 特征提取 1.3.1 ...

  9. 自然语言处理领域的数据增广方法

    1.摘要 本文介绍自然语言处理领域的数据增广方法.数据增广(Data Augmentation,也有人将Data Augmentation翻译为"数据增强",然而"数据增 ...

最新文章

  1. esl8266开发之旅_从ESL老师到越南软件开发人员的旅程
  2. CCNA配置试验之三 EIGRP协议的配置
  3. 26 行 ABAP 代码使用 HTTP_GET 函数下载百度网站的首页数据
  4. java分布式对象(RMI+部署使用RMI的程序)
  5. zemax微透镜阵列示例_阵列反向! Ruby中的示例方法
  6. Docker容器硬盘热扩容-centos6
  7. 关于jedis2.4以上版本的连接池配置,及工具类
  8. 在DataGridView中显示合计,并且合计始终在最后一行
  9. SAP NetWeaver 平台介绍
  10. Oracle 客户端连接server 的方法
  11. CentOS切换网易云镜像
  12. 关于CC2541蓝牙开发板的学习笔记
  13. ST-LINK烧录stm32程序步骤
  14. 一般试卷的纸张大小是多少_试卷字体多大合适 标准试卷的字体大小
  15. 海康摄像头拍照(java版,拿走即用)
  16. 服务器高端系统恢复工具,EASEUS Todo Backup Advanced Server高级数据备份恢复工具
  17. 第二周学习前端总结与感悟(一)
  18. 《iOS开发进阶》读书笔记
  19. Deepin-TIM / QQ / WeChat调整界面DPI字体大小的方法
  20. 单目相机三维姿态解算

热门文章

  1. idc服务器租用和虚拟主机区别,云主机与虚拟主机及IDC(托管服务器)的区别
  2. 技术不能抛开的飞鸽传书绿色版
  3. Linux内核开发——内核镜像文件及启动过程
  4. java swing外文文献_Java Swing英文本pdf教程(Java Swing (O'Reilly))
  5. 华硕灵耀 X 双屏 Pro 评测
  6. 云计算机房建设方案,服务器机房建设方案
  7. oracle 如何导入txt,Oracle中导入TXT并进行处理
  8. day13_雷神_前端01
  9. day15_雷神_前端03
  10. 在线PPT、EXCEL、JPG、WORD与PDF互转——Smallpdf