点上方蓝字视学算法获取更多干货

在右上方 ··· 设为星标 ★,与你不见不散

仅作分享,不代表本公众号立场,侵权联系删除

转载于:新智元

继MoCo和SimCLR之后非监督学习的又一里程碑!Salesforce的华人科学家(Junnan Li)介绍了一种新的非监督式神经网络学习方法,这种方法能够从数百万个未标记的图像中训练深层神经网络,让我们离机器智能又进了一步。

本文提出的原型对比学习(PCL) ,统一了非监督式学习的两个学派: 聚类学习和对比学习。PCL 推动了机器学习和人工智能的圣杯--非监督式学习技术的进步,并向无需人类指导的机器智能迈出了重要的一步。

为什么是非监督学习

深层神经网络在许多方面取得了前所未有的进展,比如图像分类和目标检测。大部分的进步都是由监督式学习 / 标签模式驱动的,得到这么好的性能很大程度上依赖于大量带有人工注释的标签(例如 ImageNet)。

然而,手工标注的成本是十分昂贵的,很难扩大规模。另一方面,互联网上存在着几乎无限量的未标记图片。非监督式学习是唯一适合开发未标记数据这个大金矿的方法。

首先,让我们来谈谈两个流行的非监督式学习算法学派: 聚类和对比学习。

聚类:机器学习中最常见的非监督式学习任务之一。

它是将数据集划分为若干个组的过程,聚类算法将相似的数据点组合在一起,而不同的数据点组合在不同的组中。

在所有的聚类方法中,K 均值是最简单和最流行的方法之一。它是一个迭代算法,目的是将数据集划分为 k 组(聚类) ,其中每个数据点只属于一类,聚类中每个数据点和聚类质心(属于该聚类的所有数据点的算术平均值)平方距离之和最小。

对比学习: 非监督式学习的一个新兴学派

随着深层神经网络的出现,对比非监督式学习已经成为一个流行的方法学派,它训练深层神经网络而不用标签。经过训练的网络能够从图像中提取有意义的特征(表示) ,这将提高其他下游任务的性能。

对比非监督式学习主要是从数据本身学习有用的表征,所以也称为对比自我监督学习。

许多最先进的对比学习方法(例如 MoCo 和 SimCLR )都是基于实例辨别的任务。

实例鉴别训练一个网络来分类两个图像是否来自同一个源图像,如图 1(a)所示。该网络(例如 CNN 编码器)将每个图像裁剪投影到一个嵌入中,并将同源的嵌入彼此拉近,同时将不同源的嵌入分开。通过解决实例识别任务,期望网络学习到一个有用的图像表示。

实例鉴别在无监督表征学习中表现出了良好的性能。然而,它有两个局限性。

首先,利用低层线索就可以区分不同的实例,因此网络不一定学习到有用的语义知识。

其次,如图 1(b)所示,来自同一个类(cat)的图像被视为不同的实例,它们的嵌入被推开。这是不可取的,因为具有相似语义的图像应该具有相似的嵌入。为了解决上述缺点,我们提出了一种无监督表征学习的新方法: 原型对比学习(PCL)。

原型对比学习: 统一对比学习和聚类学习

原型对比学习是无监督表征学习的一种新方法,它综合了对比学习和聚类学习的优点。

在 PCL 中,我们引入了一个「原型」作为由相似图像形成的簇的质心。我们将每个图像分配给不同粒度的多个原型。训练的目标是使每个图像嵌入更接近其相关原型,这是通过最小化一个 ProtoNCE 损失函数来实现的。

在高层次上,PCL 的目标是找到给定观测图像的最大似然估计(MLE)模型参数:

我们引入原型 c 作为与观测数据相关的潜在变量,提出了一种期望最大化算法来求解最大似然估计。在 E-step 中,我们通过执行 K 平均算法估计原型的概率。在 m 步中,我们通过训练模型来最大化似然估计,从而最小化一个 ProtoNCE 损失:

在期望最大化框架下,我们可以证明以前的对比学习方法是 PCL 的一个特例。

通常情况下我们是通过将预先训练的模型转移到下游任务来评估非监督学习的效果,类似于 ImageNet 预先训练的模型已经广泛应用于许多计算机视觉任务。一个好的预训练模型应该在有限的训练数据和有限微调的新任务上产生良好的表现。

PCL 的表现如何?

我们在三个任务上对 PCL 进行评估,在所有情况下,它都达到了最先进的性能。

1、少样本迁移学习

首先,将未标记的 ImageNet 数据集上训练 ResNet 模型的任务转化为两个: VOC07 数据集上的目标识别和 Places205 数据集上的场景分类。对于每个任务,我们只得到很少(k)标记的样本。我们使用无监督学习训练一个线性支持向量机。如下表所示,PCL 在 VOC 上 取得 10% 左右的性能改善。

2、半监督学习

接下来,我们评估 PCL 在半监督图像分类中的作用。在这个任务中,我们在未标记的 ImageNet 图像预先训练 ResNet 模型,并使用 1% 或 10% 带有标签的 ImageNet 图像微调分类模型。PCL 同样优于其他方法,将 Top-5 准确率提高了 18% 。

3、目标检测

我们进一步评估了目标检测学习表征的泛化能力。我们在 VOC07 或 VOC07 + 12 上训练了一个更快的 R-CNN 模型,并在 VOC07 的测试集上进行了评估。如下所示,PCL 实质上缩小了自监督方法和监督方法之间的差距,他们之间只有 1% 的差异。

学到的表征是什么样子的?

为了更好地理解 PCL 学习到的表征,我们绘制了来自 ImageNet 前 40 类图像的 t-SNE 可视化图像。我们可以看到,PCL 学习的表示方法可以将来自同一类的图像聚在一起。

结果已经证明 PCL 有巨大的潜力,在深层神经网络中使用纯粹的非标记图像就可以训练。

我们希望 PCL 可以扩展到视频,文本,语音等领域,让 PCL 激励更多有前途的非监督式学习领域的研究,推动未来人工智能的发展,使人工标注不再是模型训练的必要组成部分。

作者简介:Junnan Li,Salesforce亚洲研究院科学家,香港大学电子工程学学士,新加坡国立大学计算机博士,主要研究方向计算机视觉和深度学习、非监督式学习,弱监督学习,迁移学习和社交场景理解。

参考链接:

https://blog.einstein.ai/prototypical-contrastive-learning-pushing-the-frontiers-of-unsupervised-learning/

https://sites.google.com/site/junnanlics/

end

点个在看支持一下吧

华人博士提出原型对比学习,非监督学习效果远超MoCo和SimCLR相关推荐

  1. 苏黎世华人博士提出模型SwinIR,只用33%的参数量就碾压图像修复领域sota

    来源:新智元 [导读]参数量和模型的性能有绝对关系吗?苏黎世华人博士提出SwinIR模型,实验结果告诉你,越小的模型还可能更强!SwinIR使用Transformer力压CNN,又在图像修复领域屠榜, ...

  2. NAACL 2021 | AWS AI 提出基于对比学习的端到端无监督聚类方法

    ©PaperWeekly 原创 · 作者 | 李婧蕾 学校 | 北京邮电大学硕士生 研究方向 | 自然语言处理 Abstract 无监督聚类的目的是根据在表示空间中的距离发现数据的语义类别.然而,在学 ...

  3. 不用亲手搭建型了!华人博士提出few-shot NAS,效率提升10倍

    [导读]你能找到最优的深度学习模型吗?还是说你会「堆积木」?最近,伍斯特理工学院华人博士在ICML 2021上发表了一篇文章,提出一个新模型few-shot NAS,效率提升10倍,准确率提升20%! ...

  4. Google提出用对比学习解决推荐系统长尾问题

    关注 ▲对白▲ 和百万AI爱好者,一起向上生长 这是对白的第 87 期分享 作者 l 知乎@吴家丫头1990 出品 l 对白的算法屋 大家好,我是对白. 本文主要分享一下Google今年提出的< ...

  5. OpenAI打破文本和图像次元壁,提出基于对比学习的多模态预训练模型CLIP

    OpenAI 打破了自然语言与视觉的次元壁,推出了一个连接文本与图像的神经网络模型CLIP. 相关资料 CLIP原论文:Radford et al. Learning transferable vis ...

  6. 加州理工华人博士提出傅里叶神经算子,偏微分方程提速1000倍,告别超算!

    视学算法报道   编辑:LRS [新智元导读]偏微分方程存在于生活中的方方面面,但这个方程通常需要借助超算才能求解.最近加州理工的一个博士生提出了一种傅里叶神经算子,能让求解速度提升1000倍,从此让 ...

  7. 张俊林:对比学习在微博内容表示的应用

    点击下面卡片,关注我呀,每天给你送来AI技术干货! 分享嘉宾:张俊林博士 新浪微博 编辑整理:李桂荣 中南财经政法大学 出品平台:DataFunTalk 点这里:当知识图谱遇上预训练语言模型 -- 留 ...

  8. 对比学习在微博内容表示的应用

    对比学习在微博内容表示的应用 一.什么是对比学习 1. 渊源与谱系 目前,对比学习并没有一个非常明确的定义.综合来看,对比学习跟以下两个目前比较流行的技术关联较深. Bert采用的自监督学习.Bert ...

  9. 自监督对比学习系列论文(二):有引导对比学习--SCCL,SwAV,PCL,SupervisedCon

    自监督对比学习  本篇承接前一篇自监督对比学习的介绍自监督对比学习系列论文(一):无引导对比学习–MOCO,SimCLR,这次主要关注于包含先验指导的对比学习,这一指导更进一步的可以区分为聚类指导以及 ...

最新文章

  1. ASP.NET MVC Model绑定(二)
  2. pytorch之tensor按索引赋值,三种方法!
  3. Angular @Effect监听指定Action类型的实现原理
  4. php属于脚本,php是脚本语言吗
  5. Opencv--cvGEMM、cvMatMul和cvMatMulAdd的定义
  6. android设置存储,在android应用程序中存储用户设置的最合适方法是什么?
  7. oracle 触发器 insert 前检查_一文看懂INSTEAD OF 与AFTER 触发器区别与联系
  8. android 拍照 图片剪切
  9. x86_64-linux-gnu/libgdk-x11-2.0.so: error adding symbols: DSO missing from command line
  10. 电力网络故障的计算机算法,电力系统故障分析的计算机算法.pdf
  11. RouterOS利用(L2TP)实现异地组网
  12. Java自定义类创建对象数组并赋值
  13. Golang学习资源整理
  14. 2022摄影摄像行业年度分析报告:单反小幅下滑,微单销额增长超32%
  15. 同时校验手机号和座机号
  16. Report_Report Builder的一些基本概念(概念)
  17. chrome 由某组织管理_Chrome为什么说它是“由您的组织管理”?
  18. Systemverilog中static、automatic区别
  19. 最新计算机技术a类学校,计算机科技领域的23所院校排名,4所A类院校录取分数线达到A+...
  20. ANSYS Maxwell 3D线圈磁场仿真分析

热门文章

  1. 【怎样写代码】小技巧 -- 关于方法中修饰形参的关键词
  2. 【POJ】2377 Bad Cowtractors(最大生成树)
  3. 华为:HarmonyOS 即将开源!
  4. 写给Python开发者:机器学习十大必备技能
  5. 高文院士:为什么中国的AI发展必须要有开源开放平台?
  6. Flink最锋利的武器:Flink SQL入门和实战 | 附完整实现代码
  7. 漫画:有趣的海盗问题 (完整版)
  8. 一文概览主要语义分割网络:FCN,SegNet,U-Net...
  9. AI一分钟|美团确认收购摩拜;特斯拉今年第一季度产量创历史新高
  10. 哈工大推智能荐股,能让你稳赚不赔吗?