【随笔】深度学习的数据增强还分在线和离线?
之前看深度学习的文章,基本都在数据预处理部分进行了数据增强。
什么旋转、跳跃、我不停歇~
不对,不对。是旋转、平移、裁剪等操作。
所以最近在做目标检测时,废话不多说,先把数据增强的代码整上去!
from paddlex.det import transforms
train_transforms = transforms.Compose([transforms.RandomDistort(),#transforms.RandomExpand(),transforms.RandomCrop(),transforms.RandomHorizontalFlip(),transforms.Normalize(),#transforms.ResizeByShort(short_size=800, max_size=1333),transforms.Padding(coarsest_stride=32)
])eval_transforms = transforms.Compose([transforms.Normalize(),#transforms.ResizeByShort(short_size=800, max_size=1333),transforms.Padding(coarsest_stride=32),
])
上面这段代码是 paddle 框架中的数据增强接口,用了几天发现有点不对劲,这货一通操作后,具体把样本扩充到多少张了?
这是个问题。
所以咨询了 paddle 的开发人员后,发现这个数据增强接口 并没有做数据扩充,只是对图片进行变换,你大妈已经不是你大妈了,但是你最终还是只有一个大妈。
如果数量不变的话,数据增强有什么意义呢?菜鸡的我又去 Github 上问了下。
“将训练的epoch数增大,就等价于扩充了训练时的图像数量”,这句话很有哲理。
在一番搜索之后,这其实说的是 在线数据增强,一般常见的是 离线数据增强,也是就一次性把数据扩充好,用这个大数据集进行模型训练。
而这样的方式,在数据集很大时,就比较耗费空间,所以这时就可以采用 “在线数据增强”,也就是说在每个epoch进行训练前,对数据集进行旋转、平移等变换。等到下一次epoch时,只要数据增强方式够多,并且每个方式都包含随机因子,那么就可以保证每个epoch训练的数据都是不一样的,也就是说有多少轮epoch,我们就把数据扩充了多少倍。
本节炼丹小课堂就结束了,同学们下节课见~
猜你喜欢:
【随笔】深度学习的数据增强还分在线和离线?相关推荐
- 深度学习图像数据增强data augmentation
本文转自:http://www.cnblogs.com/gongxijun/p/6117588.html 在图像的深度学习中,为了丰富图像训练集,更好的提取图像特征,泛化模型(防止模型过拟合),一般都 ...
- 深度学习之数据增强库imgaug使用方法
参考:https://www.jianshu.com/p/99450dbdadcf 在深度学习项目中,寻找数据花费了相当多的时间.但在很多实际的项目中,我们难以找到充足的数据来完成任务.为了要保证完美 ...
- 深度学习炼丹-数据增强
一,数据增强概述 二,opencv 图像增强-几何变换 三,pytorch 图像增强 四,imgaug 图像增强 参考资料 一,数据增强概述 数据增强(也叫数据扩增)的目的是为了扩充数据和提升模型的泛 ...
- 深度学习之数据增强方案和TensorFlow操作
一.数据增强的方法介绍 增加训练数据, 则能够提升算法的准确率, 因为这样可以避免过拟合, 而避免了过拟合你就可以增大你的网络结构了. 当训练数据有限的时候, 可以通过一些变换来从已有的训练数据集中生 ...
- 《预训练周刊》第17期:深度迁移学习与数据增强改善2型糖尿病预测、钢琴补谱应用...
No.17 智源社区 预训练组 预 训 练 研究 观点 资源 活动 关于周刊 超大规模预训练模型是当前人工智能领域研究的热点,为了帮助研究与工程人员了解这一领域的进展和资讯,智源社区整理了第17期&l ...
- 【深度学习】基于深度学习的数据增广技术一览
◎作者系极市原创作者计划特约作者Happy 周末在家无聊,偶然兴心想对CV领域常用的数据增广方法做个简单的调研与总结,重点是AI时代新兴的几种反响还不错的方法.各种第三方与官方实现代码等.那么今天由H ...
- 浅说深度学习(4):增强学习
浅说深度学习(4):增强学习 这是本系列第四篇,这一篇中让我们一起深入学习一种让agent在环境中通过动作来最大化奖励的的机器学习方法----增强学习. 增强学习 还记得你是如何学会骑自行车的吗?一般 ...
- 论文阅读笔记(15):Deep Subspace Clustering with Data Augmentation,深度子空间聚类+数据增强
论文阅读笔记(15):Deep Subspace Clustering with Data Augmentation,深度子空间聚类+数据增强 摘要 1 介绍 2 相关工作 带增强的聚类方法 具有一致 ...
- 吴恩达深度学习ppt_【深度学习】吴恩达谈深度学习:数据科学家需要知道这些...
数据科学家需要什么深度学习知识?吴恩达 (Andrew Ng)用机器看图说话,机器问答等实例告诉大家.本文是吴恩达在2015年12月在ExtractConf上的演讲摘录,含20分钟视频与ppt. An ...
最新文章
- leetcode:Search in Rotated Sorted Array
- 静态方法static 的了解
- Ignoring unused library classes...java.io.IOException: You have to specify '-keep' options for the s
- php控制器和路由机制,自制PHP框架之路由与控制器
- 最大化窗口设置_BetterTouchTool的几个实用设置
- 你对博客中提到的评分规则有何意见和建议?
- 数据结构-二叉树层次遍历
- 前端学习(2167):前端路由和后端路由
- python如何遍历二维数组的列元素_for循环获取二维数组的元素时的bug
- 计算机发展史较为重大的事件,图说:15件计算机发展史中的重大事件(7)
- c语言中extern关键字
- Hadoop1.1.2开发笔记(一)
- 阶段3 3.SpringMVC·_01.SpringMVC概述及入门案例_05.入门程序之入门代码编写
- 关于Android项目隐藏标题栏的方法总结
- tlwn823n无线网卡驱动 linux,centos 6.5安装 TP-link TL-wn823n驱动
- 超好用的内网穿透工具【永久免费不限制流量】
- html中border的作用,border在html中是什么意思
- 【Python】半次元COS图爬取
- vscode能写winform窗体吗_vs code 写C#心得
- 测试高考体育成绩的软件,2020年新版高考体育测试成绩100分值对照表.docx
热门文章
- c# LUA 互通,相关资料收集
- 关于.net core http error 502.5 - process failure
- 【转载】突然觉得今年的时间过得太快了,不知不觉中还剩下四个多月就步入2017年了,回首一下,好像什么都还没做呢。...
- Linux内核驱动之延时---内核超时处理【转】
- 【HDOJ】1890 Robotic Sort
- 51`CTO下载中心——我的新爱
- 需求分析的定义(转)
- [转] 有什么郁闷的就看看这驴!
- hdu 5587(数学规律)
- Python获取控制台输入