一、补充知识

什么是自监督学习？
自监督学习主要是利用辅助任务(pretext task)从大规模的无监督数据中挖掘自身的监督信息，通过这种构造的监督信息对网络进行训练，从而可以学习到对下游任务有价值的表征。其本质是一个feature提取器。

自监督学习所利用的pretext task层出不穷，主要介绍一下本文所采用的Rotation和Exemplar。
论文链接：Rotation
文章提出，通过训练ConvNets来识别输入图像的2D旋转来学习图像特征。在质量和数量上证明了这个看似简单的任务，实际上为语义特征学习提供了非常强大的监督信号。
论文链接：Exemplar
文章的思路是将无标签的图像进行旋转、平移、增强等操作，组成不同的数据集合（同一图像生成的图像为同一数据集合），利用CNN将不同数据集合区分开。其目的是区分不同图像并保证旋转、平移等变换的鲁棒性。

什么是Manifold Mixup?
论文链接：Manifold Mixup
是对mixup数据增强算法的一种改进算法，把输入数据混合扩展到对中间隐层输出混合。
在数据传输到了中间第k层的时候对数据进行mixup，输出混合后的融合向量和新的label（当然实际上其操作的是向量，下图是对mixup的可视化）：

其具有三个优势：1.平滑决策边界 2.拉大低置信空间 3.展平隐层输出的数值。

二、概述

本文发现，通过regularizing feature manifold和self-supervised techniques 可以有效提升小样本学习的性能。并且分别在CIFAR-FS、CUB、mini-ImageNet三个数据集上进行了相关实验，都取得了很好的效果，

三、主要贡献

regularization technique of Manifold Mixup 对数据分布的小变化具有鲁棒性并且可以提高小样本任务的性能。
在训练过程中增加自我监督损失（本文使用rotation和exemplar）可以实现语义特征学习，并且显著改善小样本分类任务。
在通过自我监督任务丰富的特征流形上应用Manifold Mixup正则化，可以进一步提高小样本任务性能。这就是本文提出的方法S2M2。

三、模型图

第一阶段：在base dataset上训练一个Nb-way的分类器，在该阶段有两个损失，一个是分类损失classification loss一个是额外损失auxiliary loss。额外损失（auxiliary loss）来自Manifold Mixup regularization和self-supervision task of rotation and exemplar.

第二阶段：在novel dataset上进行微调模型，冻结特征提取层，然后训练一个新的Nn-way的分类器，在该阶段只有classification loss.

四、对比实验结果

本文在mini-ImageNet、tiered-ImageNet、CUB、CIFAR-FS四个数据集上进行了比较，可以看出S2M2取得了新的state-of-the-art。

五、原文链接

链接: link

读论文：Charting the Right Manifold:Manifold Mixup for Few-shot Learning相关推荐

论文阅读笔记《Attentive Weights Generation for Few Shot Learning via Information Maximization》
小样本学习&元学习经典论文整理||持续更新核心思想本文提出一种基于权重生成的小样本学习算法(AWGIM),这种类型的方法之前在小样本目标检测算法中见到过,就是直接用一个生成器生成分类器 ...
李沐读论文笔记--大模型时代下做科研的四个思路
大模型时代下做科研的四个思路 0. 视频来源: 1. 提高效率(更快更小) 1.1 PEFT介绍(parameter efficient fine tuning) 1.2 作者的方法 1.3 AIM效 ...
我的读论文经验总结！
↑↑↑关注后"星标"Datawhale 每日干货 & 每月组队学习,不错过 Datawhale干货作者:胡来,Datawhale成员从入门到精通一个领域,绕不开文献阅读 ...
记录理解程度、一篇至少读3遍，吴恩达建议这样读论文！
↑↑↑关注后"星标"Datawhale 每日干货 & 每月组队学习,不错过 Datawhale推荐作者:Richmond Alake,来源:机器之心在科研领域中,读论文 ...
沈向洋：读论文的三个层次
Datawhale干货来源:AI科技评论,沈向洋博士作者 | 蒋宝尚编辑 | 丛末 5月14日,沈向洋博士在全球创新学院(GIX)课程上曾做了一场线上公开课<You are how ...
如何高效读论文？剑桥CS教授亲授“三遍论”：论文最多读三遍，有的放矢，步步深入...
鱼羊编译整理量子位报道 | 公众号 QbitAI 嗑盐之始,在于读论文. 一方面,把握最前沿的研究动态,激发自身研究灵感.另一方面,不做好文献调研,自己的绝妙想法变成了重复造轮子,这种体验可不太 ...
读论文七步走！CV老司机万字长文：一篇论文需要读4遍
视学算法报道编辑:LRS [新智元导读]读论文对于AI新手和工程师来说可能是一件比较难的事.最近一位从业超5年的CV老司机发布了一篇万字长文,讲述了读论文七步法,从找论文到总结,每篇论文由浅 ...
覆盖近2亿篇论文还免费！沈向洋旗下团队「读论文神器」登B站热搜
视学算法报道编辑:小咸鱼好困 [新智元导读]无意中发现B站上有个叫ReadPaper的在线论文阅读笔记神器冲上了热榜!ReadPaper由沈向洋博士创办的IDEA旗下团队研发,其收录了近2 ...
记录理解程度、一篇至少读3遍，吴恩达建议这样读论文
选自Medium 作者:Richmond Alake 机器之心编译参与:杜伟.小舟.魔王在科研领域中,读论文大概是大家的日常基本操作了.但如何读论文,才能实现效率最大化呢?斯坦福大学教授吴恩达在斯 ...

读论文：Charting the Right Manifold:Manifold Mixup for Few-shot Learning

文章目录