1、问题描述

收集数据准备微调深度学习模型时,经常会遇到某些分类数据严重不足的情况,另外数据集过小容易造成模型的过拟合。

本文参考一些网友对于数据增强方法的一些tips,后续会附上自己实现的C++代码;

2、data augmentation常用方法

  • Color Jittering:对颜色的数据增强:图像亮度、饱和度、对比度变化(此处对色彩抖动的理解不知是否得当);
  • PCA  Jittering:首先按照RGB三个颜色通道计算均值和标准差,再在整个训练集上计算协方差矩阵,进行特征分解,得到特征向量和特征值,用来做PCA Jittering;
  • Random Scale:尺度变换;
  • Random Crop:采用随机图像差值方式,对图像进行裁剪、缩放;包括Scale Jittering方法(VGG及ResNet模型使用)或者尺度和长宽比增强变换;
  • Horizontal/Vertical Flip:水平/垂直翻转;
  • Shift:平移变换;
  • Rotation/Reflection:旋转/仿射变换;
  • Noise:高斯噪声、模糊处理;
  • Label shuffle:类别不平衡数据的增广,参见海康威视ILSVRC2016的report;另外,文中提出了一种Supervised Data Augmentation方法,有兴趣的朋友的可以动手实验下。

参考:

海康威视研究院ImageNet2016竞赛使用的数据增强方法;

知乎小白在闭关对数据增强的理解;

深度学习之图像的数据增强;

--------------------- 作者:Bicelove 来源:CSDN 原文:https://blog.csdn.net/u010555688/article/details/60757932?utm_source=copy 版权声明:本文为博主原创文章,转载请附上博文链接!

data augmentation 数据增强方法总结相关推荐

  1. 没有足够多的数据怎么办?计算机视觉数据增强方法总结

    ©PaperWeekly 原创 · 作者|燕皖 单位|渊亭科技 研究方向|计算机视觉.CNN 当没有足够多的数据量时该怎么办?学者们针对这一问题已经研发看各种巧妙的解决方案,以避在深度学习模型中数据少 ...

  2. 各种 AI 数据增强方法,都在这儿了

    来源 | 算法进阶 责编 | 寇雪芹 头图 | 下载于视觉中国 数据.算法.算力是人工智能发展的三要素.数据决定了Ai模型学习的上限,数据规模越大.质量越高,模型就能够拥有更好的泛化能力. 然而在实际 ...

  3. 只讲关键点之兼容100+种关键点检测数据增强方法

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 作者丨DefTruth 编辑丨极市平台 本文介绍了已有的几种关键点检测数据增强的方法,将其的优缺点进行 ...

  4. 【技术综述】深度学习中的数据增强方法都有哪些?

    很多实际的项目,我们都难以有充足的数据来完成任务,要保证完美的完成任务,有两件事情需要做好:(1)寻找更多的数据.(2)充分利用已有的数据进行数据增强,今天就来说说数据增强. 作者 | 言有三 编辑 ...

  5. [综述类] 一文道尽深度学习中的数据增强方法(上)

    今天带来一次有关于深度学习中的数据增强方法的分享. 00 什么是数据增强 在深度学习项目中,寻找数据花费了相当多的时间.但在很多实际的项目中,我们难以找到充足的数据来完成任务. 为了要保证完美地完成项 ...

  6. 【NLP】哈工大|NLP数据增强方法?我有15种

    十一假期过的太快了,不知道你们缓过来没有,没有的话今天我们就来一起读一篇综述缓缓,弥补假期没学习的遗憾. 这篇40多页的综述出自哈工大车万翔老师的团队,一共总结了15种NLP可以用到的数据增强方法.优 ...

  7. 最新综述:用于文本分类的数据增强方法

    ©PaperWeekly 原创 · 作者 | 王馨月 学校 | 四川大学本科生 研究方向 | 自然语言处理 概要 数据增强,即通过转换为机器学习人工创建训练数据,是跨机器学习学科广泛研究的研究领域.它 ...

  8. ACL’22 | 为大模型定制的数据增强方法FlipDA,屠榜六大NLU 数据集!

    文 | ZenMoore 编 | 小轶 今天由一篇清华大学发表于 ACL'22 的最新论文说起,一起探讨一下:大模型时代,我们该如何进行数据增强? 大家可能都多少了解一些传统的数据增强方法,比如回译. ...

  9. 哈工大|NLP数据增强方法?我有15种

    文 | rumor 源 | 李rumor 卷友们好,我是rumor. 十一假期过的太快了,不知道你们缓过来没有,没有的话今天我们就来一起读一篇综述缓缓,弥补假期没学习的遗憾. 这篇40多页的综述出自哈 ...

最新文章

  1. 数据结构与算法:03 C#面向对象设计 I
  2. python刷题一亩三分地_手把手教你用python抓网页数据【一亩三分地论坛数据科学版】...
  3. OTA:目标检测中的最优传输分配
  4. 学python需要什么基础知识-学习Python需要知道哪些基础入门知识?
  5. 又一金融科技巨头入局,智慧出行的竞争靠什么胜出?
  6. java super object,java学习记录笔记--继承,super,Object类
  7. java想要生成 字符串,如何在Java中“优雅地”生成String?
  8. labview高级编程与虚拟仪器工程应用 代码_用labview自己编程控制专用的声发射仪器...
  9. 吴恩达深度学习2.2笔记_Improving Deep Neural Networks_优化算法
  10. LeetCode 33. Search in Rotated Sorted Array
  11. CSS Reset的相关概念及实例
  12. 武汉纺织大学计算机科学校区在哪,武汉纺织大学阳光校区在哪 环境好不好
  13. Java pdf图书下载网站整理
  14. 教你如何关闭Surface Go的触摸键盘?
  15. unity获取电磁笔压感_电磁笔的分类和特性
  16. python中文字符串比较模块_python比较字符串相似度,原创度检测工具
  17. 深入Android应用开发_核心技术解析与最佳实践
  18. 鸿蒙 OS 2.0 公测!已适配多款机型
  19. PDF如何修改文件字体大小
  20. 小胖 机器人作文_作文《我的小机器人》,学生:这是我自己写的!老师:写的不错...

热门文章

  1. boost::shared_future相关的测试程序
  2. boost::ratio_multiply相关的测试程序
  3. bgi::detail::is_valid用法的测试程序
  4. Boost:使用find_if()算法来检测两个向量交叉的点
  5. Boost:异步操作,涉及重新打包多个操作,但选择仅调用其中一个的测试程序
  6. Boost:与容器相关的BOOST_TEST_EQ测试
  7. VTK:可视化之SideBySideViewports
  8. OpenCV运行对象检测深度学习网络的实例(附完整代码)
  9. OpenCV蒙版图像make mask image的实例(附完整代码)
  10. Qt Creator设置场景环境