读论文:Charting the Right Manifold:Manifold Mixup for Few-shot Learning

文章目录

  • 一、补充知识
  • 二、概述
  • 三、主要贡献
  • 三、模型图
  • 四、对比实验结果
  • 五、原文链接

一、补充知识

什么是自监督学习?
自监督学习主要是利用辅助任务(pretext task)从大规模的无监督数据中挖掘自身的监督信息,通过这种构造的监督信息对网络进行训练,从而可以学习到对下游任务有价值的表征。其本质是一个feature提取器。

自监督学习所利用的pretext task层出不穷,主要介绍一下本文所采用的Rotation和Exemplar。
论文链接:Rotation
文章提出,通过训练ConvNets来识别输入图像的2D旋转来学习图像特征。在质量和数量上证明了这个看似简单的任务,实际上为语义特征学习提供了非常强大的监督信号。
论文链接:Exemplar
文章的思路是将无标签的图像进行旋转、平移、增强等操作,组成不同的数据集合(同一图像生成的图像为同一数据集合),利用CNN将不同数据集合区分开。其目的是区分不同图像并保证旋转、平移等变换的鲁棒性。

什么是Manifold Mixup?
论文链接:Manifold Mixup
是对mixup数据增强算法的一种改进算法,把输入数据混合扩展到对中间隐层输出混合。
在数据传输到了中间第k层的时候对数据进行mixup,输出混合后的融合向量和新的label(当然实际上其操作的是向量,下图是对mixup的可视化):

其具有三个优势:1.平滑决策边界 2.拉大低置信空间 3.展平隐层输出的数值。

二、概述

本文发现,通过regularizing feature manifold和self-supervised techniques 可以有效提升小样本学习的性能。并且分别在CIFAR-FS、CUB、mini-ImageNet三个数据集上进行了相关实验,都取得了很好的效果,

三、主要贡献

  • regularization technique of Manifold Mixup 对数据分布的小变化具有鲁棒性并且可以提高小样本任务的性能。
  • 在训练过程中增加自我监督损失(本文使用rotation和exemplar)可以实现语义特征学习,并且显著改善小样本分类任务。
  • 在通过自我监督任务丰富的特征流形上应用Manifold Mixup正则化,可以进一步提高小样本任务性能。这就是本文提出的方法S2M2。

三、模型图


第一阶段:在base dataset上训练一个Nb-way的分类器,在该阶段有两个损失,一个是分类损失classification loss一个是额外损失auxiliary loss。额外损失(auxiliary loss)来自Manifold Mixup regularization和self-supervision task of rotation and exemplar.

第二阶段:在novel dataset上进行微调模型,冻结特征提取层,然后训练一个新的Nn-way的分类器,在该阶段只有classification loss.

四、对比实验结果


本文在mini-ImageNet、tiered-ImageNet、CUB、CIFAR-FS四个数据集上进行了比较,可以看出S2M2取得了新的state-of-the-art。

五、原文链接

链接: link

读论文:Charting the Right Manifold:Manifold Mixup for Few-shot Learning相关推荐

  1. 论文阅读笔记《Attentive Weights Generation for Few Shot Learning via Information Maximization》

    小样本学习&元学习经典论文整理||持续更新 核心思想   本文提出一种基于权重生成的小样本学习算法(AWGIM),这种类型的方法之前在小样本目标检测算法中见到过,就是直接用一个生成器生成分类器 ...

  2. 李沐读论文笔记--大模型时代下做科研的四个思路

    大模型时代下做科研的四个思路 0. 视频来源: 1. 提高效率(更快更小) 1.1 PEFT介绍(parameter efficient fine tuning) 1.2 作者的方法 1.3 AIM效 ...

  3. 我的读论文经验总结!

    ↑↑↑关注后"星标"Datawhale 每日干货 & 每月组队学习,不错过 Datawhale干货 作者:胡来,Datawhale成员 从入门到精通一个领域,绕不开文献阅读 ...

  4. 记录理解程度、一篇至少读3遍,吴恩达建议这样读论文!

    ↑↑↑关注后"星标"Datawhale 每日干货 & 每月组队学习,不错过 Datawhale推荐 作者:Richmond Alake,来源:机器之心 在科研领域中,读论文 ...

  5. 沈向洋:读论文的三个层次

    Datawhale干货 来源:AI科技评论,沈向洋博士 作者 | 蒋宝尚 编辑  | 丛  末 5月14日,沈向洋博士在全球创新学院(GIX)课程上曾做了一场线上公开课<You are how ...

  6. 如何高效读论文?剑桥CS教授亲授“三遍论”:论文最多读三遍,有的放矢,步步深入...

    鱼羊 编译整理 量子位 报道 | 公众号 QbitAI 嗑盐之始,在于读论文. 一方面,把握最前沿的研究动态,激发自身研究灵感.另一方面,不做好文献调研,自己的绝妙想法变成了重复造轮子,这种体验可不太 ...

  7. 读论文七步走!CV老司机万字长文:一篇论文需要读4遍

      视学算法报道   编辑:LRS [新智元导读]读论文对于AI新手和工程师来说可能是一件比较难的事.最近一位从业超5年的CV老司机发布了一篇万字长文,讲述了读论文七步法,从找论文到总结,每篇论文由浅 ...

  8. 覆盖近2亿篇论文还免费!沈向洋旗下团队「读论文神器」登B站热搜

      视学算法报道   编辑:小咸鱼 好困 [新智元导读]无意中发现B站上有个叫ReadPaper的在线论文阅读笔记神器冲上了热榜!ReadPaper由沈向洋博士创办的IDEA旗下团队研发,其收录了近2 ...

  9. 记录理解程度、一篇至少读3遍,吴恩达建议这样读论文

    选自Medium 作者:Richmond Alake 机器之心编译 参与:杜伟.小舟.魔王 在科研领域中,读论文大概是大家的日常基本操作了.但如何读论文,才能实现效率最大化呢?斯坦福大学教授吴恩达在斯 ...

最新文章

  1. Scrum敏捷看板工具leangoo-销售流程管理
  2. ASP.NET:性能与缓存
  3. 动态语言,静态类型,强类型定义语言,弱类型定义语言,
  4. 学业水平测试计算机模拟,高二计算机学业水平测试 模拟试题(附答案)
  5. 应该怎么学python_什么样的人适合学Python,应该怎么学?
  6. 任务管理器在右下角的图标不显示
  7. C#类类型“.NET技术”
  8. 创建 linux分区命令,Linux中创建分区
  9. MySQL集群搭建——主备模式
  10. 图像处理-图像增强(三)
  11. linux java环境变量修改不生效_ansible执行带有环境变量的脚本不生效
  12. 随想录(校园招聘记)
  13. python列表推导式中使用if和if-else
  14. socket-(2)
  15. 21天Jmeter打卡Day21生成HTML测试报告
  16. mysql分组和where条件查询,mysql中where和having条件查询的区别
  17. Java基础笔记(三)
  18. 拓端tecdat|R语言极值分析:分块极大值Block-maxima、阈值超额法threshold excess、广义帕累托分布GPD拟合降水数据时间序列
  19. 计算机保研夏令营英语面试,保研经验 | 夏令营面试那些事儿(内含视频)
  20. 实验吧-杂项-Only one file(多文件合并、firework多图层图片)

热门文章

  1. android键盘映射之一
  2. 基于MFC实现大华监控摄像头Demo(视频流和抓图)
  3. RTOS系统与Linux系统的区别
  4. 【U8】禁止UU(UTU)随登陆账套启动(U8V11.0及其以上版本)
  5. 织梦编辑器加HTML视频显示很小,织梦教程:去掉编辑器自动加div的方法即大小字情况...
  6. Win32:INI文件读写结构体/Int/String/遍历
  7. 植物大战僵尸音乐计算机简谱,植物大战僵尸(主题音乐)钢琴谱
  8. Windows Phone 7.5及诺基亚Lumia 800使用感受
  9. 设计模式(三)代理设计模式
  10. python人工智能计算器_python游戏dnf_招募:基于python的召唤师全时段全技能(含均值AI)计算器全程测试......