理解《Charting the Right Manifold: Manifold Mixup for Few-shot Learning》
摘要:小样本学习算法目标是学习模型参数,使其能够适应于少量有标签的未见类样本分类。最近,正则化方法——流形混合算法(Manifold Mixup),集中于学习广泛的表示,以适应数据分布的小变化;另一方面,自监督学习是仅利用数据内在结构学习语义特征。针对小样本任务,本文利用自监督和正则化技术,研究学习相关特征流形。
注释:流形混合算法(Manifold Mixup)作用是使网络对输入数据进行变换/嵌入后,更加平滑和均匀,从而使得系统的泛化,性能得到改善。
1. 主要贡献:
1)发现Manifold Mixup的正则化技术,对数据分布的小变化具有鲁棒性,增强小样本任务的性能;
2)在训练处理过程增加自监督损失,能够对语义特征稳定学习,推动小样本分类的重大进步。在自监督任务中使用旋转(rotation[18])和标本(exemplar[11])。(了解自监督可参考解读自监督学习(Self-Supervised Learning)几篇相关paper - 知乎)
3)运用Manifold Mixup的正则化技术在特征流形上,利用自监督任务,可以进一步改善小样本任务性能。
2. 方法
2.1基本情况
考虑典型的小样本学习问题。:大量有标签样本集,共
类;
:少量有标签样本(支撑集S)和无标签样本(查询集Q),类别共
新类。
- 学习的第一步是训练
类的神经网络分类器:
是卷积特征,
是余弦分类器,
是模型的超参数。
- 学习的第二部是:fine-tuning模型,冻结特征层,训练
类余弦分类器。该模型(S2M2)如图1所属。
该方法关键是借助自监督和规则技术学习通常目的的表示来解决小样本任务。自监督方法是采用文献[18]的旋转和文献[11]的exemplar来得到适合的特征流形,之后使用Manifold Mixup的正则化[62]来提供稳定的特征提取架构。
2.2 Manifold Mixup for Few-shot Learning
在神经网络分类器高层表示经常看作是有意义的流形,提供数据相关几何特征,可以解决某个具体任务。因此,空间上特征向量的线性插值与分类相关。依据这一出发点,Manifold Mixup借助神经网络线性插值可有助于训练模型泛化性。
假设Manifold Mixup在基类上,训练损失表示如下:
式中,:分别是输入
和
的第l层特征,损失L:标准交叉熵,混合系数
是从β分布中取样。
训练损失函数Lmm是为了激励模型预测,更少地信任隐含层表示的线性插值。
2.3 Charting the Right Manifold
2.3.1 Self-Supervision: Towards the Right Manifol
(1)旋转
在该自监督任务里,输入图像旋转不同角度,模型的附属目的是预测旋转量。在图像分类中,附属损失被加到标准类损失来学习更一般的表示。
在本文中,使用了4类线性分类器来,预测属于4类中哪一个。线性分类器位于特征表示倒数第二层,其中特征表示为图像x旋转了4个角度
。
(2)Exemplar
Exemplar训练目的是使特征表示对于广泛的图像变形(平移、尺度、旋转、对比度和色彩变换)具有不变性。在某个小批次M,每个图像通过随机增量产生4个副本,这4个副本是图像的正例,该批次的其他图像是负例。之后,在特征上使用硬批次三元组损失和软边界,使得正例特征表示更接近。
损失表示如下:
式中,D是特征表示空间f的欧式距离,是x中类别i的第k个示例,exp项是图像与正示例间最大距离,我们希望其减小。min距离是指图像与负示例间的距离,我们希望其最大化。
2.3.2 S2M2
小样本学习场景依赖于学习稳定性和特征泛化能力来区分基类(base classes)和新类(novel classes)。为了这个目的,重要的方法是使用更宽的决策边界来划分基类表示,这样允许模型对新类具有泛化性。Manifold Mixup提供有效方法使已知类扁平表示变得更紧凑。可是,文献[62]声称Manifold Mixup能处理小的分布变化,但是当基类和新类差距较大时就无能为力了。因此,本文使用自监督方法,当训练基类时附加损失提供了特征表示的更丰富的决策边界,允许模型更适应新类。
流程如下,具体包括两个步骤:
- 步骤1:自监督训练:利用自监督的附加损失训练模型,计算分类损失;
- 步骤2:混合流形的精调:利用混合模型损失精调步骤1的模型。
- 得到训练好的网络,利用余弦分类器适应小样本任务。
- 代码链接:https://github.com/nupurkmr9/S2M2 fewshot
- 文章链接:http://arxiv.org/abs/1907.12087v2
小样本学习的前提是训练样本集有大量样本,目标是解决少量未见样本的分类。但是,有很多领域,训练样本集也缺少。怎么办?
理解《Charting the Right Manifold: Manifold Mixup for Few-shot Learning》相关推荐
- 理解《Deblurring Text Images via L0-Regularized Intensity and Gradient Prior》
L0-regularized prior based on intensity and gradient 基于强度(亮度?像素值大小)和梯度(强度与渐变?)的L0正则化先验. 图像先验源于观察文本图像 ...
- matlab 防抖,防抖算法小结
https://blog.csdn.net/nachoe/article/details/51383221 最近研究了一下防抖算法,总结如下,欢迎大家交流.防抖算法我总结一下三个方向:deconv m ...
- (十四:2020.08.28)CVPR 2014 追踪之论文纲要(译)
CVPR 2020 追踪之论文纲要(修正于2020.08.28) 讲在前面 论文目录 讲在前面 论坛很多博客都对论文做了总结和分类,但就医学领域而言,对这些论文的筛选信息显然需要更加精细的把控,所以自 ...
- 从CVPR 2014看计算机视觉领域的最新热点
从CVPR 2014看计算机视觉领域的最新热点 编者按:2014年度计算机视觉方向的顶级会议CVPR上月落下帷幕.在这次大会中,微软亚洲研究院共有15篇论文入选.今年的CVPR上有哪些让人眼前一亮的研 ...
- 超简单理解L0、L1、L2范数原理及作用
L0,L1,L2范数在机器学习中的应用个人理解 博文针对L0.L1.L2范数原理及在机器学习中作用进行了非常通俗易懂的解释,为博主了解相关概念后自我理解,相信对于看完本篇分析的读者来说对理解这几个范数 ...
- 2016~2022 文字生成图像 Text to image(T2I)论文整理 阅读路线和阅读指南
2016~2021 文字生成图像 Text to image(T2I)论文汇总 阅读路线和阅读指南 综述类 部分最新重要研究成果 发展与往年经典模型 综述类 1.Adversarial Text-to ...
- 基于Core Text实现的TXT电子书阅读器
本篇文章的项目地址基于Core Text实现的TXT电子书阅读器. 最近花了一点时间学习了iOS的底层文字处理的框架Core Text.在网上也参考很多资料,具体的资料在文章最后列了出来,有兴趣的可参 ...
- 小白学tkinter(Text组件)
text组件主要用于显示多行文本,但也常常用作简单的文本编辑器和网页浏览器. 一.实现最基本的功能以及插入文本.图片和window组件,可以使用windows_create()和image_creat ...
- CTPN模型详解--Detecting Text in Natural Image with Connectionist Text Proposal Network
文章目录 Abstract 1 Introduction 1.1 Contributions 2 Related Work 3 Connectionist Text Proposal Network ...
- 通过源码发现nltk.Text.similar相似度衡量标准
1. 如何用nltk来找到text中相似的word 如果我们想搜索某一篇文章(text)中相似的词(word),可以使用nltk这个强大的NLP模块.下面以nltk自带的shakespeare数据集来 ...
最新文章
- java现有一个泛型类 提供数组排序功能,java编程思想读书笔记 第十六章 数组
- 来看看BAT在AR领域的布局,你给打几分?
- linux mysql 健康检查_Linux下检查MySQL的Slave是否正常
- C语言visual studio警告:取消对NULL指针“p”的引用
- Vue指令篇_v-for_列表渲染
- mysql ondelete_MySQL on delete cascade语句
- 为移动端网页构造快速响应按钮
- docker安装配置gitlab详细过程
- python文件都是脚本吗_脚本语言系列之Python | Python文件IO
- Android Studio的Gradle的加速
- linux ssh freeradius,配置FreeRADIUS提供AAA服务
- 图片转Excel表格在线工具,分享几款不错的工具!
- 计算机考研数据库题库
- MIT License探讨
- 自制H桥有刷电机驱动板
- 猫哥教你写爬虫 042--session的用法
- 【IoT】加密与安全:动态密码 OTP 算法详解
- 天正双击墙体不能编辑_【插件辅助下BIM正向设计】天正建筑 VS Revit
- 2018全美程序员薪资报告新鲜出炉!
- 黑苹果alc269声卡仿冒id_10.10中我的ALC269VC依旧无声?学习并尝试制作了仿冒声卡,依然无声。...