之前看深度学习的文章,基本都在数据预处理部分进行了数据增强。

什么旋转、跳跃、我不停歇~

不对,不对。是旋转、平移、裁剪等操作。

所以最近在做目标检测时,废话不多说,先把数据增强的代码整上去!

from paddlex.det import transforms
train_transforms = transforms.Compose([transforms.RandomDistort(),#transforms.RandomExpand(),transforms.RandomCrop(),transforms.RandomHorizontalFlip(),transforms.Normalize(),#transforms.ResizeByShort(short_size=800, max_size=1333),transforms.Padding(coarsest_stride=32)
])eval_transforms = transforms.Compose([transforms.Normalize(),#transforms.ResizeByShort(short_size=800, max_size=1333),transforms.Padding(coarsest_stride=32),
])

上面这段代码是 paddle 框架中的数据增强接口,用了几天发现有点不对劲,这货一通操作后,具体把样本扩充到多少张了?

这是个问题。

所以咨询了 paddle 的开发人员后,发现这个数据增强接口 并没有做数据扩充,只是对图片进行变换,你大妈已经不是你大妈了,但是你最终还是只有一个大妈。

如果数量不变的话,数据增强有什么意义呢?菜鸡的我又去 Github 上问了下。

“将训练的epoch数增大,就等价于扩充了训练时的图像数量”,这句话很有哲理。

在一番搜索之后,这其实说的是 在线数据增强,一般常见的是 离线数据增强,也是就一次性把数据扩充好,用这个大数据集进行模型训练。

而这样的方式,在数据集很大时,就比较耗费空间,所以这时就可以采用 “在线数据增强”,也就是说在每个epoch进行训练前,对数据集进行旋转、平移等变换。等到下一次epoch时,只要数据增强方式够多,并且每个方式都包含随机因子,那么就可以保证每个epoch训练的数据都是不一样的,也就是说有多少轮epoch,我们就把数据扩充了多少倍。

本节炼丹小课堂就结束了,同学们下节课见~

猜你喜欢:

【随笔】深度学习的数据增强还分在线和离线?相关推荐

  1. 深度学习图像数据增强data augmentation

    本文转自:http://www.cnblogs.com/gongxijun/p/6117588.html 在图像的深度学习中,为了丰富图像训练集,更好的提取图像特征,泛化模型(防止模型过拟合),一般都 ...

  2. 深度学习之数据增强库imgaug使用方法

    参考:https://www.jianshu.com/p/99450dbdadcf 在深度学习项目中,寻找数据花费了相当多的时间.但在很多实际的项目中,我们难以找到充足的数据来完成任务.为了要保证完美 ...

  3. 深度学习炼丹-数据增强

    一,数据增强概述 二,opencv 图像增强-几何变换 三,pytorch 图像增强 四,imgaug 图像增强 参考资料 一,数据增强概述 数据增强(也叫数据扩增)的目的是为了扩充数据和提升模型的泛 ...

  4. 深度学习之数据增强方案和TensorFlow操作

    一.数据增强的方法介绍 增加训练数据, 则能够提升算法的准确率, 因为这样可以避免过拟合, 而避免了过拟合你就可以增大你的网络结构了. 当训练数据有限的时候, 可以通过一些变换来从已有的训练数据集中生 ...

  5. 《预训练周刊》第17期:深度迁移学习与数据增强改善2型糖尿病预测、钢琴补谱应用...

    No.17 智源社区 预训练组 预 训 练 研究 观点 资源 活动 关于周刊 超大规模预训练模型是当前人工智能领域研究的热点,为了帮助研究与工程人员了解这一领域的进展和资讯,智源社区整理了第17期&l ...

  6. 【深度学习】基于深度学习的数据增广技术一览

    ◎作者系极市原创作者计划特约作者Happy 周末在家无聊,偶然兴心想对CV领域常用的数据增广方法做个简单的调研与总结,重点是AI时代新兴的几种反响还不错的方法.各种第三方与官方实现代码等.那么今天由H ...

  7. 浅说深度学习(4):增强学习

    浅说深度学习(4):增强学习 这是本系列第四篇,这一篇中让我们一起深入学习一种让agent在环境中通过动作来最大化奖励的的机器学习方法----增强学习. 增强学习 还记得你是如何学会骑自行车的吗?一般 ...

  8. 论文阅读笔记(15):Deep Subspace Clustering with Data Augmentation,深度子空间聚类+数据增强

    论文阅读笔记(15):Deep Subspace Clustering with Data Augmentation,深度子空间聚类+数据增强 摘要 1 介绍 2 相关工作 带增强的聚类方法 具有一致 ...

  9. 吴恩达深度学习ppt_【深度学习】吴恩达谈深度学习:数据科学家需要知道这些...

    数据科学家需要什么深度学习知识?吴恩达 (Andrew Ng)用机器看图说话,机器问答等实例告诉大家.本文是吴恩达在2015年12月在ExtractConf上的演讲摘录,含20分钟视频与ppt. An ...

最新文章

  1. leetcode:Search in Rotated Sorted Array
  2. 静态方法static 的了解
  3. Ignoring unused library classes...java.io.IOException: You have to specify '-keep' options for the s
  4. php控制器和路由机制,自制PHP框架之路由与控制器
  5. 最大化窗口设置_BetterTouchTool的几个实用设置
  6. 你对博客中提到的评分规则有何意见和建议?
  7. 数据结构-二叉树层次遍历
  8. 前端学习(2167):前端路由和后端路由
  9. python如何遍历二维数组的列元素_for循环获取二维数组的元素时的bug
  10. 计算机发展史较为重大的事件,图说:15件计算机发展史中的重大事件(7)
  11. c语言中extern关键字
  12. Hadoop1.1.2开发笔记(一)
  13. 阶段3 3.SpringMVC·_01.SpringMVC概述及入门案例_05.入门程序之入门代码编写
  14. 关于Android项目隐藏标题栏的方法总结
  15. tlwn823n无线网卡驱动 linux,centos 6.5安装 TP-link TL-wn823n驱动
  16. 超好用的内网穿透工具【永久免费不限制流量】
  17. html中border的作用,border在html中是什么意思
  18. 【Python】半次元COS图爬取
  19. vscode能写winform窗体吗_vs code 写C#心得
  20. 测试高考体育成绩的软件,2020年新版高考体育测试成绩100分值对照表.docx

热门文章

  1. c# LUA 互通,相关资料收集
  2. 关于.net core http error 502.5 - process failure
  3. 【转载】突然觉得今年的时间过得太快了,不知不觉中还剩下四个多月就步入2017年了,回首一下,好像什么都还没做呢。...
  4. Linux内核驱动之延时---内核超时处理【转】
  5. 【HDOJ】1890 Robotic Sort
  6. 51`CTO下载中心——我的新爱
  7. 需求分析的定义(转)
  8. [转] 有什么郁闷的就看看这驴!
  9. hdu 5587(数学规律)
  10. Python获取控制台输入