深度学习论文: KeepAugment: A Simple Information-Preserving Data Augmentation Approach及其PyTorch实现
深度学习论文: KeepAugment: A Simple Information-Preserving Data Augmentation Approach及其PyTorch实现
KeepAugment: A Simple Information-Preserving Data Augmentation Approach
PDF: https://arxiv.org/pdf/2011.11778.pdf
PyTorch代码: https://github.com/shanglianlm0525/CvPytorch
PyTorch代码: https://github.com/shanglianlm0525/PyTorch-Networks
1 概述
KeepAugment 提出了一种简单但高效的方法,称为"保持增强",以提高增强图像的保真度。KeepAugment 首先使用显著图来检测原始图像上的重要区域,然后在增广过程中保留这些信息区域。这种信息保存策略使我们能够生成更多保真的训练样本。
2 KeepAugment
KeepAugment主要可以分为(1)计算saliency map(2)保留重要的矩形区域这两个步骤
2-1 Saliency map
KeepAugment 通过 vanilla gradient 方法获取saliency map,具体来说,给定图像x及其对应标签logit value ly(x)l_{y}(x)ly(x),KeepAugment 将gij(x,y)g_{ij}(x, y)gij(x,y)设为vanilla gradients的绝对值∣∇xly(x)∣| ∇x l_{y}(x)|∣∇xly(x)∣。对于RBG图像,采用通道最大值,以获取每个像素(i,j)的单个显着性值。重要性得分定义的公式如下所示:
2-2 Selective-Cut
KeepAugment对于区域级的数据增强方法(如:cutout), 通过确保被切割的区域不会具有较大的重要性得分来控制数据增强的保真度。即随机采样要切割的区域S,直到其重要性得分I(S,x,y)小于给定的阈值τ。
2-3 Selective-Paste
图像级变换共同修改了整个图像,所以我们通过粘贴具有较高重要性的随机区域来确保变换的保真度。即对满足阈值τ的I(S, x, y)>τ的区域S进行均匀采样,然后将原始图像x的regionS粘贴到x’。
3 Efficient Implementation of KeepAugment
KeepAugment要求在每个训练步骤中通过反向传播来计算 saliency map。直接计算的话会导致计算成本增加两倍。因此作者提出两种不同的近似策略。
Low resolution based approximation: 对于给定的图像x,首先生成一个低分辨率副本,然后计算其saliency map;将低分辨率saliency map映射到其相应的原始分辨率。
**Early head based approximation:**在网络前面层添加loss,然后用此loss来生成saliency map。
深度学习论文: KeepAugment: A Simple Information-Preserving Data Augmentation Approach及其PyTorch实现相关推荐
- 深度学习论文: Conv2Former: A Simple Transformer-Style ConvNet for Visual Recognition及其PyTorch实现
深度学习论文: Conv2Former: A Simple Transformer-Style ConvNet for Visual Recognition及其PyTorch实现 Conv2Forme ...
- 深度学习论文: MicroNet: Improving Image Recognition with Extremely Low FLOPs及其PyTorch实现
深度学习论文: MicroNet: Improving Image Recognition with Extremely Low FLOPs及其PyTorch实现 MicroNet: Improvin ...
- 深度学习论文: LRNnet: a light-weighted network for real-time semantic segmentation及其PyTorch实现
深度学习论文: LRNnet: a light-weighted network with efficient reduced non-local operation for real-time se ...
- 深度学习论文: TPH-YOLOv5: Improved YOLOv5 Based on Transformer Prediction Head 及其PyTorch实现
深度学习论文: TPH-YOLOv5: Improved YOLOv5 Based on Transformer Prediction Head for Object Detection on Dro ...
- 深度学习论文: ICNet for Real-Time Semantic Segmentation on High-Resolution Images及其PyTorch实现
ICNet: ICNet for Real-Time Semantic Segmentation on High-Resolution Images (2018) PDF: https://arxiv ...
- Github标星24k,127篇经典论文下载,这份深度学习论文阅读路线图不容错过
作者 | Floodsung 翻译 | 黄海广 来源 | 机器学习初学者(ID:ai-start-com) [导读]如果你是深度学习领域的新手,那么你可能会遇到的第一个问题是"我应该从哪篇 ...
- 深度学习论文阅读路线图
https://www.toutiao.com/a6703859415763649031/ 作者:floodsun编译:ronghuaiyang 这是作者一年前整理的东西,有些最新的论文没有包含进去, ...
- 126篇殿堂级深度学习论文分类整理 从入门到应用 | 干货
如果你有非常大的决心从事深度学习,又不想在这一行打酱油,那么研读大牛论文将是不可避免的一步.而作为新人,你的第一个问题或许是:"论文那么多,从哪一篇读起?" 本文将试图解决这个问题 ...
- 126篇殿堂级深度学习论文分类整理 从入门到应用(上)
如果你有非常大的决心从事深度学习,又不想在这一行打酱油,那么研读大牛论文将是不可避免的一步.而作为新人,你的第一个问题或许是:"论文那么多,从哪一篇读起?" 本文将试图解决这个问题 ...
最新文章
- pylons中常用的paster命令
- ISME:宏基因组探究美洲河狸粪便微生物
- 解决Python报错UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 658: illegal multibyte
- python手机端下载-Python3,x:如何进行手机APP的数据爬取
- mysql字段是否存在_mysql判断列是否存在
- python 自动运维架构师_运维架构师-Python 自动化运维开发-013
- 使用Sandcastle创建你的类库文档
- Fedora 31 及以后版本将不再支持 32 位内核已实锤
- android删除未知字符,如何删除Android Studio中所有配置的未使用字符串资源?
- QuartusII-项目工程的功能仿真
- ICS工业控制安全类方向赛题简单总结
- VBA 数据透视表的创建
- 常见图片格式及其区别小结
- 直播知识点实录|百度大脑EasyDL产业应用系列 安全生产专场
- 什么是二极管钳位电路
- HIR夏季挑战赛作品紧急优化
- 两成开发者月薪超1.7万,算法工程师最紧缺
- 字符串转化为RTF格式-RTF研究系列
- SIEM、SOC、MSS三者的区别与联系
- [电脑]拆解DELL 2007FPb液晶显示器
热门文章
- 7-2 长度质量计量单位换算 (5 分)
- 小工具:用C++读取TGA并输出数据到文本
- linux 下opencv 安装的问题
- 软件开发工具有哪些?(9.29)
- 下机数据处理:拼接、过滤和去嵌合
- 京东商品图片下载工具1.0 springboot版
- Module not found: Error: Can‘t resolve ‘path‘
- Call to undefined function imagecreatefromjpeg()
- Nginx知识点整理
- API勾取实现进程隐藏