数据增强早已被广泛应用在提升模型泛化能力上,通过"创造"额外的样本输入给模型使得模型更加鲁棒。近期又有隐式数据增强,不是通过直接创造样本来提高模型效果,那隐式数据增强究竟是怎么做的呢?

我们知道,模型在训练集和测试集表现的的差异,主要来自于这两个样本数据分布的差异,所以模型就在训练集上表现更好而在测试集上欠佳,特别是NN类的模型,更容易过拟合。显式的数据增强很明显会增加训练成本,因为使用无监督方法创造了更多的样本,而隐式数据增强能够实现相似的效果或更好的正则化效果,而且不用提高训练成本。

数据增强方法

数据:

数据增强的目的就是增加额外样本,使得训练数据分布更接近测试数据。除了直接调整输入数据,直接在encoding层后的隐层空间做操作,可以导致更加线性可分的特征空间。在隐层空间直接采样,在观测值中间做插值,可以沿着方差最大的维度进行插值,以提高可解释性。此外也可以对样本进行扰动,在隐层空间生成比较hard的对抗样本。

网络结构:

模型结构定义了从输入数据到输出预测的信息流。现在,我们不再生成不同版本的训练数据,而是在相同的训练数据上使用不同版本的网络结构。网络结构引入的随机噪声,类似dropout,防止过度依赖网络的特定部分,使模型更加鲁棒,对数据中的噪声不那么敏感。同时也可以引入多个版本的数据和网络结构。

Loss函数:

适当的加入正则化并给个合适的系数,例如norm-based的惩罚项像是Lasso,通过在特征空间中隐式引入随机扰动,会增强模型鲁棒性。基于协方差的惩罚项也可以作为隐式数据增强技术。因此,在loss函数中引入正则项影响是比较大的,此外,对系数的调整大多是即时的、一步到位的,这并不能保证它在长期内是最优的。对系数进行多步惩罚似乎可以在短期和长期效果之间进行权衡,就像在强化学习的训练过程。

优化算法:

随机梯度下降是训练神经网络中最常用的算法,它被证明是一种隐式正则化器。这意味着,对于相同的输入数据,与每次迭代的一批样本相比,当分别对每个样本进行训练时,模型可能更具泛化能力。还有些其他方法,例如小权重初始化和大初始学习率,也能够隐式地正则化模型。这些方法主要关注输入数据与权重的交互方式,并将其呈现给权重进行持续更新。在这方面,我们期望在输入数据和权重之间的这种交互机制方面有更多创新性的研究进展。例如,可以对权重更新中每个输入数据点的相对贡献进行插值以生成额外的伪更新,这对应于生成更多的训练样本。

不加样本就能做数据增强?还能提效?

不加样本就能做数据增强?还能提效?相关推荐

  1. 【随笔】深度学习的数据增强还分在线和离线?

    之前看深度学习的文章,基本都在数据预处理部分进行了数据增强. 什么旋转.跳跃.我不停歇~ 不对,不对.是旋转.平移.裁剪等操作. 所以最近在做目标检测时,废话不多说,先把数据增强的代码整上去! fro ...

  2. 深度学习和目标检测系列教程 9-300:TorchVision和Albumentation性能对比,如何使用Albumentation对图片数据做数据增强

    @Author:Runsen 上次对xml文件进行提取,使用到一个Albumentation模块.Albumentation模块是一个数据增强的工具,目标检测图像预处理通过使用"albume ...

  3. 海量、安全、高可靠的华为云对象存储服务OBS,助力企业数据存储降本提效

    在信息化.数字化时代,企业的数据量日渐增长,对存储的需求也在不断变化,企业自建存储服务器受限于搭建存储服务器时使用的硬件设备,如果存储量不够,需重新购买存储硬盘,进行人工扩容,而且人力物力成本较高,为 ...

  4. GAN作用——在我做安全的看来,就是做数据拟合、数据增强

    from:https://www.zhihu.com/question/56171002/answer/155777359 GAN的作用,也就是为什么GAN会火了(有部分原因可能是因为Lecun的赞赏 ...

  5. 【NLP】哈工大|NLP数据增强方法?我有15种

    十一假期过的太快了,不知道你们缓过来没有,没有的话今天我们就来一起读一篇综述缓缓,弥补假期没学习的遗憾. 这篇40多页的综述出自哈工大车万翔老师的团队,一共总结了15种NLP可以用到的数据增强方法.优 ...

  6. NLP中数据增强的综述,快速的生成大量的训练数据

    作者:amitness编译:ronghuaiyang 导读 深度学习视觉领域的增强方法可以很大程度上提高模型的表现,并减少数据的依赖,而NLP上做数据增强不像在图像上那么方便,但还是有一些方法的. 与 ...

  7. 没有足够多的数据怎么办?计算机视觉数据增强方法总结

    ©PaperWeekly 原创 · 作者|燕皖 单位|渊亭科技 研究方向|计算机视觉.CNN 当没有足够多的数据量时该怎么办?学者们针对这一问题已经研发看各种巧妙的解决方案,以避在深度学习模型中数据少 ...

  8. 哈工大|NLP数据增强方法?我有15种

    文 | rumor 源 | 李rumor 卷友们好,我是rumor. 十一假期过的太快了,不知道你们缓过来没有,没有的话今天我们就来一起读一篇综述缓缓,弥补假期没学习的遗憾. 这篇40多页的综述出自哈 ...

  9. 【动手学深度学习PyTorch版】27 数据增强

    上一篇请移步[动手学深度学习PyTorch版]23 深度学习硬件CPU 和 GPU_水w的博客-CSDN博客 目录 一.数据增强 1.1 数据增强(主要是关于图像增强) ◼ CES上的真实的故事 ◼ ...

最新文章

  1. 12个深度学习面试问题
  2. JSONPlaceholder使用
  3. c标签判断true false jsp_北京尚学堂卓越班252天[第042天]——Jsp
  4. adfs服务器获取信息失败,在ADFS服务器上SAML LogOutRequest处理失败
  5. go mysql id为0_go 语言中mysql操作200万数据时应该如何写?
  6. 必须要掌握的七种谈话技巧
  7. MultCloud – 支持数据互传的网盘管理
  8. Pandas系列(八)字符串处理
  9. Oracle SQL查询,日期过滤条件要注意的一点
  10. 重庆铜梁中学空调计量项目远程预付费电能管理系统的设计与应用
  11. 【工控入门】组态软件概念科普与基本构架描述
  12. 【君思智慧园区】园区物业管理系统,物业管理系统解决方案
  13. [noip2011]铺地毯(carpet)解题报告
  14. mysql explain不准确_mysql explain预估剖析
  15. 微信小程序WXS的使用
  16. 7个技巧帮助你进行更有吸引力的脉动/脉搏调查
  17. 解决Ubuntu系统下启动root账户后Linux版本edge浏览器无法启动
  18. 邮箱注册,登录及激活
  19. Parameter 'arg0' not found. Available parameters are [xxx, xxx, param1, param2]
  20. 亚洲房地产投资信托基金(REITs)研究报告——附下载链接

热门文章

  1. Python之路【第七篇】:初识Socket
  2. GPUImage API 文档之GPUImagePicture类
  3. 【算法30】从数组中选择k组长度为m的子数组,要求其和最小
  4. 如何在ashx页面获取Session值
  5. Ubuntu 下 Git 服务器的安装和初级配置
  6. 转:C# Thread
  7. matlab z变换离散化_MATLAB作图从入门到熟练
  8. 一文攻破结构体-C语言
  9. 如何用Graphpad Prism 9作时间轴图
  10. 超级全的 SCI 写作句式模板