背景

今天介绍下SimCLR,也是Hinton老爷子在今年提出的工作。首先介绍下为什么下一代神经网络需要无监督对比学习。目前整个人工智能行业的落地,其实都依赖于监督学习模式,无论是OCR、ASR、TTS、ImageDetection,如果没有大量的标注,是很难训练出商业化程度的模型的。这个模式需要被打破,因为世界上存在太多的未知场景,完全依赖人肉标注是不行的。

所以未来无监督学习大势所趋。其实在这方面之前已经有了一些工作,比如Bert模型,就可以基于大量的unlabeled数据训练,然后在小数据集上Fintune来取得效果。类似Bert这一类的训练模式叫做自监督学习。这种模式在NLP领域会有比较好的效果,但是在图像领域效果不明显,因为图像的数据表示会比语意复杂得多。

举个简单例子,“喜欢_ _ _ _的人都会关注凡人机器学习”,这句话虽然空了4个字,但是根据上下文不难猜出这4个字是“机器学习”。所以在NLP领域,自监督是比较好实现的。但是在图像方面,假设戴了墨镜,你能根据一个人的鼻子、嘴和耳朵推测出这个人墨镜后面的样子么?所以图像领域的无监督学习要难的多。

SimCLR基本原理

SimCLR使用无监督对比学习模式在图像领域取得了突破性的成果,可以看下在ImageNet数据集的表现。

那SimCLR究竟是怎么实现的呢,我们分步骤介绍下,看下图:

第一步:Augmentation

无监督对比学习的本质其实是让模型通过不同的类别数据的对比学习出相同类别的属性。所以为了增强同一类别的数据的特征表现,需要做Augmentation,包含数据裁剪、翻转、颜色转换等。

第二步:CNN

可以选用CNN的Resnet网络,做数据的向量表示。Resnet也是最终的分类器模型。

第三步:MLP

通过MLP,也就是全连接层,可以学习出数据的非线性信息,是对上一步的一个增强。通过这一步的学习就可以得出同一类别数据的共同信息特点。如下图所示:

第四步:Optimization

在Optimization这一步,Lossfunction的求法就是要让相同类别的数据对比的Loss最小。比如同是来源于“猫”的图片,他们之间的Loss需要很小,这个Loss的计算需要通过L(猫,猫)去除以L(猫,猫)+L(猫,其它类别)的和。

最终通过Loss去优化CNN和MLP,CNN的输出结果就可以作为最终的模型输出结果了。

参考文献:

[1]https://ai.googleblog.com/2020/04/advancing-self-supervised-and-semi.html

[2]https://blog.csdn.net/u011984148/article/details/106233313/

详解下一代神经网络-无监督对比学习框架SimCLR相关推荐

  1. 73岁Hinton老爷子构思下一代神经网络:属于无监督对比学习

    来源:机器之心 本文约2700字,建议阅读7分钟. 在近期举行的第 43 届国际信息检索年会 (ACM SIGIR2020) 上,Geoffrey Hinton 做了主题为<The Next G ...

  2. Hinton构思下一代神经网络:属于无监督对比学习

    本文由机器之心报道 Geoffrey Hinton 是谷歌副总裁.工程研究员,也是 Vector Institute 的首席科学顾问.多伦多大学 Emeritus 荣誉教授.2018 年,他与 Yos ...

  3. 无监督对比学习SIMCSE理解和中文实验操作

    自从入行NLP领域以来,就一直在做文本分类.文本匹配相关的任务.也关注着相关前沿的算法和论文.从Sentence bert到bert flow,再到苏神的bert Whitening,再到2021年的 ...

  4. 受压缩感知启发,斯坦福 AI 研究院提出新的无监督表示学习框架!

    雷锋网 AI 科技评论按:如今,说到图像领域的生成式模型,大家往往会想到对抗生成网络(GAN)和自编码器(AE).本文介绍了斯坦福 AI 研究院的研究人员如何从统计压缩感知技术中汲取灵感设计出的非确定 ...

  5. 一文梳理无监督对比学习(MoCo/SimCLR/SwAV/BYOL/SimSiam)

    本文从对比学习的概念出发,收集了五个2020年的关于对比学习的经典研究,详细介绍了每个工作的模型及思路过程,帮助大家快速掌握对比学习的原理和发展的脉络. 对比学习的概念很早就有了,但真正成为热门方向是 ...

  6. 语义表征的无监督对比学习:一个新理论框架

    点击上方↑↑↑蓝字关注我们~ 「2019 Python开发者日」7折优惠最后3天,请扫码咨询 ↑↑↑ 译者 | Linstancy 责编 | 琥珀 出品 | AI科技大本营(ID:rgznai100) ...

  7. 无监督对比学习之MOCO 《Momentum Contrast for Unsupervised Visual Representation Learning》

    无监督学习 如果可以建立一种通用的无监督模型,经过海量无标签数据的学习后,可以习得一个强大的特征提取器,在面对新的任务,尤其是医疗影像等小样本任务时,也能提取到较好的特征.这就是无监督学习的意义. 对 ...

  8. 无监督对比学习论文Momentum Contrast for Unsupervised Visual Representation Learning阅读

    目录 MoCo论文:<Momentum Contrast for Unsupervised Visual Representation Learning> 基础概念了解 1.无监督.有监督 ...

  9. 表现SOTA!DetCo算法:目标检测无监督对比学习

    点上方计算机视觉联盟获取更多干货 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:Sophia知乎 https://zhuanlan.zhihu.com/p/393398507 AI博士笔记系 ...

最新文章

  1. python爬虫接单经历_一个Python小白5个小时爬虫经历
  2. 深入浅出SharePoint——数据库维护
  3. iOS开发之FMDB
  4. java axis2 教程_webservice的Axis2入门教程java版
  5. c语言规范标准中英文,C语言中英文翻译资料.doc
  6. sql中exists,Intersect ,union 与union All的用法
  7. 介绍目前计算机网络的新技术,当前计算机网络技术实验室建设现状及方向
  8. github上创建java项目简单操作
  9. 泰安本地话听不懂,为何后来能勉强听懂?
  10. mapgis转arcgis
  11. 笔记本电脑换内存条流程
  12. Breeze魔兽编程交流论坛
  13. 前后端分离跨域问题Access to XMLHttpRequest at ‘http://localhos...has been blocked by CORS policy: No ‘Access-
  14. 计算机以太网,局域网,互联网,令牌网,ATM网络
  15. scala 编程(其五)集合,交差交差集
  16. 网络编程培训之七 实现Traceroute
  17. 如何在手机上打包生成APK
  18. MarkDown超级教程 Obsidian版_11.4
  19. 前台Html上传文件,后台使用.net接收文件
  20. CE实战:植物大战僵尸修改阳光并制作辅助(小试牛刀)

热门文章

  1. opencv图片处理和摄像头边缘检测
  2. leetcode 739. 每日温度 单调栈解法和暴力法及其优化 c代码
  3. tcp/ip 协议栈Linux内核源码分析十 邻居子系统分析一 概述通用邻居框架
  4. JAVa面向对象--反射
  5. 修改串口设备名ttymxc1_ESP8266接入阿里云——基于官方SDK接入阿里云串口获取云下发数据...
  6. java打印系统参数_Java学习(二十):获取系统参数
  7. 园林系统优秀党员推荐材料_昆山合纵生态科技有限公司——园林废弃物循环利用“昆山合纵模式”的探索和实践者...
  8. lighttpd+fastcgi 返回500错误码_阿根廷著名电视减肥冠军去世 临终前体重达到500公斤...
  9. 未转变者服务器床id,最新id欢迎补充
  10. mysql分析表锁,MySQL锁分析和监控