点击我爱计算机视觉标星,更快获取CVML新技术


深度学习实践中,数据的增广有很多种方法,比如在计算机视觉任务中除了常规的对单样本进行缩放、颜色扰动、旋转、镜像等外,也可以通过对两个样本进行混合,生成新的虚拟样本训练集。这类方法被称为样本混合数据增广(Mixed Sample Data Augmentation,MSDA),比如MixUp。

MixUp 方法公式

通过对两个样本标签和输入向量的加权,生成新的虚拟训练样本。

前天新出的论文Understanding and Enhancing Mixed Sample Data Augmentation,来自英国南安普顿大学的研究学者从信息论的角度试图理解这种方法的原理,并提出了新的数据增广方法FMix,在多个数据集上均表现SOTA。

FMix是在CutMix的启发下对方法的推广。

我们先看看看CutMix做了什么。

Mixup是在全图上进行加权,CutMix是在图像上取方块的位置再加权混合像素,CutMix取得了更好的效果。

作者们提出的FMix则是对图像按照高频和低频区域进行二值化区分区域,然后使用此Mask进行分像素的加权。

如下图:

论文的实验在图像分类(CIFAR-10、CIFAR-100、Fashion、ImageNet)、文本分类(Toxic)等任务中显示,FMix取得了一致的性能提升,是目前最先进的样本混合数据增广方法。

论文中还进行了理论分析,作者也已经将代码开源了,欢迎大家试用!

论文地址:

https://arxiv.xilesou.top/pdf/2002.12047.pdf

代码地址:

https://github.com/ecs-vlc/FMix

在我爱计算机视觉公众号后台回复“FMix”,即可收到论文下载地址。


加群交流

关注最新最前沿的图像标注与数据增广技术,欢迎加入交流群群,扫码添加CV君拉你入群,(如已为CV君其他账号好友,请直接私信)

(请务必注明:数据):

喜欢在QQ交流的童鞋可以加52CV官方QQ群:805388940。

(不会时时在线,如果没能及时通过还请见谅)


长按关注我爱计算机视觉

青出于蓝而胜于蓝,超越MixUp、CutMix的样本混合数据增广新算法FMix相关推荐

  1. PRML第十一章读书笔记——Sampling Methods 拒绝采样/重要性采样/采样重要性重采样/数据增广IP算法、Metropolis算法/MH算法/吉布斯、切片采样、混合MC、估计配分函数

    (终于把第十章读完了,这一章应该相对轻松.但这两天状态有待调整,所以没咋认真读) 目录 11.1 Basic Sampling Algorithms P526 标准概率分布 P528 拒绝采样 P53 ...

  2. PaddleClas-图像分类中的8种数据增广方法(cutmix, autoaugment,..)

    本文主要来源于PaddleClas这个代码仓库中的数据增广文档:https://github.com/PaddlePaddle/PaddleClas/blob/master/docs/zh_CN/ad ...

  3. Mixup vs. SamplePairing:ICLR2018投稿论文的两种数据增广方式

    在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果. 点击本文底部的「阅读原文」即刻加入社区 ...

  4. 深度学习训练中关于数据处理方式--原始样本采集以及数据增广

    版权声明:本文为博主原创文章,未经博主允许不得转载. https://blog.csdn.net/SMF0504/article/details/78695908 好久没有写博客,一直想重新调整自己的 ...

  5. 论文阅读九:yolov4的各种数据增广技术random erasing、cutout、mixup、cutmix、mosaic等

       yolov4的发布,让很多做工程的都很兴奋,但其实静下来仔细研究,发现yolov4其实是一个成功的调参例子,作者用到了大量前人的技术,加以组合,实现了速度和精度的完美平衡,读yolov4的论文会 ...

  6. 数据增强_开源算法FMix:用于深度学习中增强混合样本数据增强

    作者 介绍 近来混合样本数据增强(MSDA)受到越来越多的关注,其中包括许多成功的变体,例如MixUp和Cut-Mix. 作者在论文中提出了FMix,它是一种MSDA,它使用将阈值应用于从傅立叶空间采 ...

  7. ​戴尔科技集团+微软Azure Stack HCI:引领混合云上云新范式

    目前混合云正在成为企业上云的主流选择,这是因为混合云的优势在于能够适应不同的部署需求,既能提供私有云的安全性,也能提供公有云的开放性,因此这也让混合云架构被越来越多的企业所认可并采用. 值得注意的是, ...

  8. 全新数据增强 | TransMix 超越Mix-up、Cut-mix方法让模型更加鲁棒、精度更高

    点击上方"计算机视觉工坊",选择"星标" 干货第一时间送达 作者丨ChaucerG 来源丨集智书童 基于Mixup的数据增强已经被证明在训练过程中对模型进行泛化 ...

  9. 【论文学习】mixup系列(mixup、cutMix、manifold mixup、patchUp、saliencyMix、puzzleMix、co-Mixup、FMix)

      mixup是一种简单而又有效的数据增强方法,涨点利器,该方法在图像.文本.语音.推荐.GAN.对抗样本防御等多个领域都能显著提高效果.mixup论文被ICLR2018收录,后续又出现了一系列改进方 ...

最新文章

  1. 机器学习数据预处理之缺失值:插值法填充+多项式插值
  2. redis-集群分片
  3. 5.慎重选择删除元素的方法
  4. java 委托_java 能不能自己写一个类叫 java.lang.System/String 正确答案
  5. mysql 5.5 client 字符集_rhel4 mysql5.5 字符集_character set
  6. PHP服务Fcgi进程及PHP解析优化
  7. linux内存操作--ioremap和mmap
  8. 学了python能干啥举例-学了Python可以做哪些有趣的东西
  9. 力扣——分数排名(数据库的题
  10. Atitit 怎么阅读一本书 消化 分析 检索 attilax总结 1. 读书的本质 是数据的处理,大量的数据,处理能力有限的大脑 2 2. ETL数据清洗转换 摘要,缩小数据规模 2 2.1
  11. zsh fg: no job control in this shell.
  12. 一个将汉字转换成拼音的npm包
  13. python课程设计的心得体会_数据库课程设计心得体会精选篇
  14. Proxmark3教程2:用Pm3Gui_Pro V5.2 新功能 IC卡匠数据维护
  15. UMLChina公众号文章精选(20220602更新精选)
  16. 如何用Deep Learning为股票定价
  17. 分治法实现寻找数组最大最小值
  18. github博客迁移——图床搭建
  19. 餐厅点餐系统GUI——Java大作业
  20. 人身三流指什么_三教九流指的是什么 都有哪些人

热门文章

  1. Unity uGui RawImage 渲染小地图
  2. Struts2访问Servlet的三种方式
  3. toj 4608 Ball in a Rectangle
  4. F. 张胖胖玩多米诺骨牌 (南阳理工oj—21新生第二场招新赛)
  5. python正弦波和等腰三角波_51proteus仿真:生成方波、正弦波、锯齿波和三角波
  6. java script 月日年转年月日_javasrcipt日期一些方法和格式转化
  7. 自然语言处理模型_ICLR 2020 「自然语言处理」【Prosus AI】金融情感分析FinBERT模型(含源码)!...
  8. 安装启动gui卡住_为Kali Linux中的Sqlmap配置 WEB-GUI 界面
  9. 【script】lambda的使用
  10. Linux 光盘 远程拷贝,Linux远程拷贝scp命令