自从ICML2017的Model-Agnostic Meta-Learning (MAML)以及NIPS17的Prototypical Networks (ProtoNet)等paper出现之后,一系列meta learning以及few-shot learning的paper如雨后春笋般涌现出来。同时,常用的几个数据集Omniglot、miniImagenet、tieredImagenet的性能也被不断刷新。

结合最近无监督学习的潮流,元学习相关方法和无监督学习的结合,成为了最近一个新的方向。本文主要介绍基于MAML的无监督元学习相关工作。

有监督和无监督元学习的对比,如图1。区别主要在Meta-train阶段,有监督元学习可以利用标签信息进行训练,而无监督元学习只能利用无标注的原始数据。无监督的常见方法,比如self-supervised learning,clustering,generative model等等都有可能应用到无监督元学习中。

图1. 有监督和无监督元学习比较。在Meta-train阶段,无监督元学习只能利用无标注的数据进行学习,而有监督元学习可以利用标签信息进行训练。Meta-test阶段,有监督和无监督的设置相同。

CACTUs (Unsupervised learning via meta-learning)

图2. CACTUs方法框架图。首先,预训练得到特征表示(1),对训练数据进行无监督聚类,得到若干组伪标签数据(2a)。然后根据伪标签随机采样多个任务(tasks)(2b),运行正常的元学习算法(3),例如MAML或者ProtoNet。

这篇论文是MAML的作者Chelsea Finn等人发表在ICLR19的paper,主要提出了unsupervised meta-learning的设置以及一种简单的基于聚类的方法。虽然方法简单,但是也为后续基于无监督的元学习方法开辟了一个方向。

整个方法可以分成三个步骤(图2):

  1. 使用现有无监督特征学习方法,在无标签训练集合得到特征表示(embedding function)
  2. 使用聚类方法(例如,k-means)划分出多个子集合
    等。然后随机采样构建伪标签的元学习任务
  3. 使用监督元学习方法,如MAML、ProtoNet在步骤2构建的元学习任务上进行学习。需要指出的是这个步骤学习用到的网络结构是随机初始化的,而不是从1步骤得到。这么做,是非常必要的,因为如果聚类和元学习都使用步骤1的网络结构和参数,很可能引起过拟合现象。

作者在Omniglot、Mnist、MiniImagenet以及CelebA上进行了实验,验证了clustering+meta learning的有效性。另外,如图3,通过无监督元学习和有监督元学习的对比,可以看出无监督性能逐步接近有监督性能。

图3. 无监督元学习和有监督元学习性能对比

UMTRA (Unsupervised Meta-Learning for Few-Shot Image Classification)

图4. UMTRA方法框架图。首先,随机选取N个样本作为N个类别,然后将原图片作为support set,augmentation之后的图片作为query set。最后,使用有监督的MAML算法进行元学习参数更新。

CACTUs是一个多步骤的元学习算法,需要先单独训练特征表示,然后用于聚类,最后训练新的网络结构。它的过程相对负责,而且没有很好的灵活性。

受到一些自监督(self-supervised)方法的启发,UMTRA提出了一个end2end的元学习框架,如图4。整个方法包含三个部分:

  1. 随机采样N个图片,每个图片单独认为是一个类别,就是N-way 1-shot 的任务
  2. 对每个图片进行数据增广(Augmentation),增广之后对数据作为元学习的query set,原图作为support set。这样,就有了N-way 1-shot的support+query数据以及N个label。
  3. 运行MAML算法,进行训练。

作者对方法的动机进行了解释:假设训练集合共有

个类别,每个类别有
个样本,我们每次随机选取
个样本。这
个样本全部来自不同类别的概率是:

上述公式,分子是

个样本全部来自不同类别的可能情况,分母是所有随机组合的情况数目。对于Omniglot(
),
;对于MiniImagenet,
;对于Imagenet,

所以,随机选择的样本有很大概率来自不同类别,这样选出来的样本应该比k-means聚类得到的伪标签更接近真实数据。

其他方法

AAL和UMTRA是同期工作,方法也很大程度重合,但是性能略低于UMTRA。

Centroid Networks提出了不同的Unsupervised meta-learning的设置,但是由于它是ICLR2020的拒稿paper,这里不做深入解读。

本文涉及到的论文如下:

  1. Kyle Hsu, Sergey Levine, and Chelsea Finn. Unsupervised learning via meta-learning. In International Conference on Learning Representations, 2019.
  2. Khodadadeh, Siavash, Ladislau Boloni, and Mubarak Shah. "Unsupervised Meta-Learning for Few-Shot Image Classification."Advances in Neural Information Processing Systems. 2019.
  3. A. Antoniou and A. Storkey. Assume, augment and learn: Unsupervised few-shot meta-learning via random labels and data augmentation. arXiv preprint arXiv:1902.09884, 2019.
  4. Gabriel Huang, Hugo Larochelle, and Simon Lacoste-Julien. Are few-shot learning benchmarks too simple? 2020.

无监督和有监督的区别_无监督元学习(Unsupervised Meta-Learning)相关推荐

  1. 无监督特征学习——Unsupervised feature learning and deep learning

    无监督学习近年来很热,先后应用于computer vision, audio classification和 NLP等问题,通过机器进行无监督学习feature得到的结果,其accuracy大多明显优 ...

  2. 机器学习贝叶斯学习心得_贝叶斯元学习就是您所需要的

    机器学习贝叶斯学习心得 Update: This post is part of a blog series on Meta-Learning that I'm working on. Check o ...

  3. 静态代码和动态代码的区别_无代码和低代码有哪些区别

    代码是大多数软件程序和应用程序的骨干. 代码是大多数软件程序和应用程序的骨干.每行代码充当一条指令:采用一种逐步性的逻辑机制,以便计算机.服务器和其他机器执行操作.想创建那些指令,就要知道如何编写代码 ...

  4. 【Java Web开发指南】有状态会话Bean(SLSB) 和无状态会话Bean(SFSB)的区别

    有状态会话Bean(SLSB) 和无状态会话Bean(SFSB)的区别 1 无状态 (Stateless) 在不同方法调用间不保留任何状态 . 事务处理必须在一个方法中结束 . 通常资源占用较少:可以 ...

  5. 无监督和有监督的区别_干货|全面理解无监督学习基础知识

    一.无监督学习 无监督学习的特点是,模型学习的数据没有标签,因此无监督学习的目标是通过对这些无标签样本的学习来揭示数据的内在特性及规律,其代表就是聚类.与监督学习相比,监督学习是按照给定的标准进行学习 ...

  6. 无监督学习与监督学习_有监督与无监督学习

    无监督学习与监督学习 If we don't know what the objective of the machine learning algorithm is, we may fail to ...

  7. 机器学习中的无监督学习_无监督机器学习中聚类背后的直觉

    机器学习中的无监督学习 When it comes to analyzing & making sense of the data from the past and understandin ...

  8. 【自然语言处理】【知识图谱】SEU:无监督、非神经网络实体对齐超越有监督图神经网络?

    SEU:从对齐到分配----简单有效的无监督实体对齐 <From Alignment to Assignment:Frustratingly Simple Unsupervised Entity ...

  9. 频率计的交流耦合和直流耦合的区别_风机盘管直流无刷与普通交流电机有什么区别和不同?...

    注:水舒适整理原创,转载请注明出处,面斥不雅直流无刷风机盘管由于具有节能.无级调速.安静.寿命长等优点,所以在许多新建项目中都被广泛应用,并且也越来越得到市场的认可与青睐.那么,直流无刷风机盘管与普通 ...

最新文章

  1. 一站式了解多模态、金融、事理知识图谱构建指南 | AI ProCon 2020
  2. BZOJ 3224: Tyvj 1728 普通平衡树【Treap】
  3. UVa 1225 Digit Counting
  4. linux系统初始化脚本
  5. python中、既可以将数据通过print_整理了8个Python中既冷门又实用的技巧
  6. 深度学习啃“花书”指南
  7. graythresh函数(OTSU算法)
  8. bbs的html代码,bbs论坛源代码
  9. 2021-2027全球与中国相控阵校准测试系统市场现状及未来发展趋势
  10. 如何用计算机制作pop海报,手绘POP海报的制作 -电脑资料
  11. linux tcp调优
  12. 详解 VOC 数据集
  13. WARN: Establishing SSL connection without server‘s identity verification is not recommended
  14. cnn图像风格转换原理论文整理(一)
  15. win版本openssl工具下载安装
  16. 数学建模常用模型04:灰色关联分析法
  17. ERD Online 4.0.4 元数据在线建模(免费、私有部署)
  18. 二手书籍的归宿 - 闲鱼、转转官方收书使用体验
  19. 电影魔术|改变世界?乔布斯可不仅仅用苹果
  20. transformer与视觉

热门文章

  1. Vscode----热门插件超实用插件汇总(史上最全)
  2. Hbuilder----安装less插件(详细)
  3. android动画效果 translate,Android利用translate、scale、alpha、rotate实现动画效果
  4. JQuery中的特殊选择器--this
  5. 学习响应式BootStrap来写融职教育网站,Bootsrtap第九天手粉琴swiper特效
  6. 2021年10月到12月一个月学习总结2
  7. 设置一个DIV固定在底部,并且左右固定,垂直居中
  8. JSON.parse()和JSON.stringify()的区别
  9. 三维点集拟合:平面拟合、RANSAC、ICP算法
  10. windows下可用mysql吗_Windows下MySQL安装配置与使用