从对比学习(Contrastive Learning)到对比聚类(Contrastive Clustering)

作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/

想要了解对比聚类,首先应该清楚对比学习的整个过程。最经典的对比学习的文章是Hinton团队提出的SimCLR,该方法首先将一个实例(图像)变换成两种不同的增广实例(图像),然后用神经网络训练得到投影表示,用余弦相似性求出两两投影表示之间的相似性,并最大化相同实例投影表示之间的一致性。而对比聚类(CC)完全借鉴SimCLR的思想,唯一的区别是之前的对比学习是实例层面的,横向进行对比,而CC则添加了一个聚类层面的对比学习,纵向进行对比。通过同时最小化两个层面的损失函数,最终得到聚类层面上的网络权重,进而得到划分结果。

1. 对比学习

2. 对比聚类

CC创新:

  • 一方面,从聚类的角度,受益于“标签即表示”及“列空间对应类别表示空间”的洞见,本文提出的方法无需所有数据输入后才能进行聚类,而是采用在线的方式实时对当前数据进行聚类隶属预测,适用于大规模在线场景和流式数据处理。大量实验表明,提出的方法在CIFAR10,CIFAR100等数据集上比当时最优聚类算法提升精度30%以上。
  • 另一方面,从对比学习角度,该工作是最早的面向任务的对比学习方法,而不再是流行的任务无关无监督表示学习范式。
  • 此外,本文提出的算法也可认为是一种新的引入聚类性质从而增强表示学习能力的对比学习方法,为对比学习研究领域引入新的洞见。
  • 本文的整个idea非常优雅、简洁及自洽。相对于最新的SimCLR等对比学习算法,本文提出的算法仅需在考虑数据特征行空间对比学习的同时再考虑列空间的对比学习即可。

思考:

对比聚类中用红色方框框出来的就是不同于SimCLR的地方,如果去掉红框的内容,那就完全是SimCLR。以往都是在行空间上进行对比学习,CC的创新之处在于引入列空间上的对比学习(矩阵大小为:样本数*聚类个数)。但列空间上的对比学习的损失函数与SimCLR完全一致,没有任何改进。对比学习主要目的是最大化同一实例之间的相似性,而最小化不同实例之间的相似性。总体来说,该算法最适用于图像类型的数据,因为刚开始涉及到随机变换函数是对图像进行一系列变换操作。本人理解有限,欢迎指正。

3. 采用最近邻进行语义聚类(SCAN)

在没有真实标注的情况下,我们是否能自动将图像划分为语义意义上的簇?无监督图像分类在计算机视觉领域仍然是一个重要的开放的挑战性任务。最近有几种方法试图以端到端的方式解决这个问题。在这篇论文中,通过两步的方法进行聚类,其中特征学习和聚类是分开进行的。首先,利用表征学习的自监督任务来获取语义特征。其次,在可学习的聚类方法中,使用获得的特征作为先验。在此过程中,去掉了依赖于底层特征的聚类学习能力,这在当前的端到端学习方法中是存在的。具体来看该算法Semantic Clustering by Adopting Nearest neighbors (SCAN)。

4. 参考

[1] Ting Chen, Simon Kornblith, Mohammad Norouzi, Geoffrey Hinton. A Simple Framework for Contrastive Learning of Visual Representations, ICML, 2020.

Paper: http://proceedings.mlr.press/v119/chen20j.html

Code: https://github.com/google-research/simclr

[2] Yunfan Li, Peng Hu, Zitao Liu, Dezhong Peng, Joey Tianyi Zhou, Xi Peng, Contrastive Clustering, AAAI, 2021.

Paper: http://pengxi.me/wp-content/uploads/2020/12/2021AAAI-CC.pdf

Code: https://github.com/XLearning-SCU/2021-AAAI-CC

彭玺老师报告视频(从第21分钟开始看):https://www.bilibili.com/video/BV1Ny4y127v6

[3] CCF A类会议AAAI 2021论文收录结果出炉:我院彭玺教授有两篇论文入选 http://cs.scu.edu.cn/info/1246/15202.htm

[4] The Illustrated SimCLR Framework - Amit Chaudhary https://amitness.com/2020/03/illustrated-simclr/

[5] Van Gansbeke W., Vandenhende S., Georgoulis S., et al. SCAN: Learning to Classify Images Without Labels. ECCV 2020.

Paper: https://www.ecva.net/papers/eccv_2020/papers_ECCV/papers/123550273.pdf

Code: https://github.com/wvangansbeke/Unsupervised-Classification

从对比学习(Contrastive Learning)到对比聚类(Contrastive Clustering)相关推荐

  1. Contrastive Learning(对比学习,MoCo,SimCLR,BYOL,SimSiam,SimCSE)

    很多大佬认为,深度学习的本质就是做两件事情:Representation Learning(表示学习)和 Inductive Bias Learning(归纳偏好学习).在表示学习方面,如果直接对语义 ...

  2. 文章分享《Supervised Contrastive Learning》 自监督对比学习和有监督对比学习的区别

    文章题目 Supervised Contrastive Learning 作者: Prannay Khosla Piotr Teterwak Chen Wang Aaron Sarna 时间:2020 ...

  3. NIPS20 - 将对比学习用于监督学习任务《Supervised Contrastive Learning》

    文章目录 原文地址 论文阅读方法 初识 相知 回顾 代码 原文地址 原文 论文阅读方法 三遍论文法 初识 对比学习这两年在自监督学习.无监督学习任务中非常火,取得了非常优秀的性能.这个工作就是想办法将 ...

  4. Micro-expression recognition with supervised contrastive learning基于对比监督学习的微表情识别

    Micro-expression recognition with supervised contrastive learning基于对比监督学习的微表情识别--2022 PRL 文章链接:https ...

  5. UCL-Dehaze: Towards Real-world Image Dehazing via Unsupervised Contrastive Learning 基于对比学习的无监督真实图像去雾

    概述 本文提出了一种有效的无监督对比学习范式 --ucl-dehaze.未配对的真实世界清晰图像和模糊图像很容易获取,在训练UCL-Dehaze网络时分别作为 重要的正样本和负样本.为了更有效地训练网 ...

  6. 对比学习系列论文CPCforHAR(一):Contrastive Predictive Coding for Human Activity Recognition

    0.Abusurt 0.1逐句翻译 Feature extraction is crucial for human activity recognition (HAR) using body-worn ...

  7. 理解对比学习(contrasive learning)

    1.什么是对比学习? 对比学习,顾名思义就是在训练中和某些东西进行对比从而学习,在自编码器中,输出与自己进行对比,从而得到一个中间量latent code,我认为这也是一种对比学习. 2.对比学习框架 ...

  8. 读文章笔记(十一):对比学习(Contrastive Learning)

    读文章笔记(十一):对比学习(Contrastive Learning) 对比学习 来源于:对比学习(Contrastive Learning):研究进展精要 对比学习 对比学习属于无监督或者自监督学 ...

  9. 【ICML 2020对比学习论文解读】SimCLR: A Simple Framework for Contrastive Learning of Visual Representations

    一.写在前面 对比学习(Contrastive Learning) 对比学习是一种自监督学习方法,在无标签数据集上仍可以学习到较好的表征. 对比学习的主要思想就是相似的样本的向量距离要近,不相似的要远 ...

最新文章

  1. 【牛腩新闻发布系统】系统发布06
  2. VBA中级班课时3小结
  3. 计算摄影 | 计算机如何学会自动裁剪图片(自动构图)?
  4. [Silverlight动画]转向行为 - 转向机车
  5. 【Scratch】青少年蓝桥杯_每日一题_3.07_画金字塔
  6. fastText原理和文本分类实战
  7. 散列碰撞_散列中的碰撞和碰撞解决技术
  8. 搭建opencv环境
  9. 设置python路径
  10. Jeewx 捷微管家操作配置文档(开源版本)
  11. lampp mysql 等待响应时间很长_Apache 打开网页的时候等待时间过长的解决方案
  12. 趣味物理中的计算机科学,【趣味物理】10个有趣的科学实验,揭示物理原理。...
  13. Tcp keepalive详解
  14. [转]仿百度文库或豆丁网在线浏览doc.pdf.xls.txt源码
  15. 大数据:新动力 新机遇 新途径
  16. U盘写保护通过量产工具解除
  17. dw里PHP编写格式,Dreamweaver中如何使用模板(附代码)
  18. jar脱壳_软件脱壳 - Rannie` - 博客园
  19. 玻璃盖板丝印质量及尺寸在线检测方案
  20. 比赛对阵表(女排世界杯对阵表)

热门文章

  1. springboot 优雅停机_Spring Boot 2.3 新特性优雅停机详解
  2. android支付宝插件,GitHub - DmcSDK/cordova.plugin.alipay: cordova 支付宝支付插件,支持IOS Android。...
  3. 下列关于python字典变量的定义中错误的是_python练习题-day14
  4. python电影情感评论分析_Kaggle电影评论情感分析
  5. 定时分量和直流分量_交直流输入的RC电路分析
  6. 热门云服务超87GB电子邮箱和密码泄露,黑客已验证大部分数据
  7. soot——相关资源
  8. Forcepoint DLP解决方案持续推高各机构的业务发展进程
  9. 林志玲送衣直播的背后,阿里工程师下了哪些功夫?
  10. POJ 2190 模拟