来源:机器之心本文约2000字,建议阅读8分钟
双盲评审之下,图灵奖得主的论文也会被拒。

近期,全球人工智能顶会 NeurIPS 2021 放出了今年的论文接收结果。正所谓有人欢喜有人忧,但也有人处于「欢喜」和「忧愁」之外的另一种状态——被拒绝之后的「proud」。

这位拥有独特心境的研究者便是大名鼎鼎的 Facebook 首席 AI 科学家、2018 年图灵奖得主 Yann LeCun。

被拒绝的论文标题为《VICReg: Variance-Invariance-Covariance Regularization for Self-Supervised Learning 》。LeCun 表示,在这篇论文中,他们提出了一种极其简单、高效的方法,用于联合嵌入(joint-embedding)架构的自监督训练。

VICReg 论文链接:

https://arxiv.org/pdf/2105.04906.pdf

而领域主席给出的拒稿理由是:与 LeCun 等人之前发表于 ICML 2021 上的「Barlow Twins」论文相比,这篇「VICReg」提出的改进还不够大。

Barlow Twins 论文链接:

https://arxiv.org/pdf/2103.03230.pdf

但 LeCun 似乎并不这么认为,他表示,VICReg 引入了方差正则化,这使得它适用于更广泛的架构。

因此,在 LeCun 看来,他们的论文有足够的创新之处,被拒绝并不是什么丢人的事。「一些最具影响力的论文被拒绝过多次,比如 David Lowe 著名的 SIFT,」LeCun 在 twitter 上写道。

对于「不要放弃」之类的鼓励,LeCun 给出的回应是:「我的整个职业生涯都是基于『不放弃』的,现在也不会改变。」对于 LeCun 这种连「AI 寒冬」都经历过的人,个别研究不被肯定又算得了什么。

不过,对于普通研究者来说,LeCun 论文被拒让人看到了顶会审稿机制透明的一面:看来双盲评审还是有一定公平性的。

而且,审稿结果似乎并没有被网络上的宣传所左右:该论文今年 5 月份就出现在了 arXiv 上,而且 LeCun 发表推特进行了宣传。在 LeCun 看来,这是一种正常的学术信息交流,有利于技术进步。但不可忽略的一点是:在各种「交流」渠道中,不同地位的研究者所占有的资源是非常悬殊的,这难免造成一些不公平,让本身就很有学术号召力的研究者从中获益。

不过,具体到「VICReg」这篇论文是否应该被接收,我们还是要看一下论文的具体内容。

「 VICReg 」是个什么方法

自监督表征学习在过去几年取得了重大进展,在许多下游任务上几乎达到了监督学习方法的性能。虽然可以显式地防止崩溃(collapse),但许多方法都存在成本高昂的问题,需要大量内存和较大的批大小。

还有一些方法虽然有效,但是依赖于难以解释的架构技巧。已有一些研究提供了关于如何通过非对称方法避免崩溃的理论分析,但还远不完备,并且这些方法可能不适用于其他自监督学习场景。最后,冗余减少(redundancy reduction)的方法通过对表征的维度进行去相关(decorrelate)操作来避免崩溃,从而使表征能够最大限度地提供有关其相应输入的信息。这些方法的性能良好,能够学习有意义的表征,在去相关的同时保留表征的方差,但所有这些都使用一个唯一的目标函数。VICReg 的研究提出将目标分解为三个独立的目标函数,且每个目标函数都有明确的解释。

在这篇论文中,研究者提出了一种新的自监督算法——VICReg(Variance-Invariance-Covariance Regularization,方差 - 不变性 - 协方差正则化),用于学习基于三个简单 principle(方差、不变性和协方差)的图像表征,这些 principle 有明确的目标和解释。

方差 principle 独立地约束每个维度上嵌入的方差,是一种简单而有效的防止崩溃的方法。更准确地说,研究者使用 hinge loss 来约束沿嵌入的批维度计算的标准差,以达到固定目标。与对比方法不同,这里不需要 negative pair,嵌入被隐式地鼓励不同于彼此,而且它们之间没有任何直接的比较。

不变性 principle 使用标准的均方欧氏距离来学习对一张图像多个视图的不变性。

最后,协方差 principle 借鉴了 Barlow Twins 的协方差 criterion,后者将学习表征的不同维度去相关,目标是在维度之间传播信息,避免维度崩溃。这个 criterion 主要是惩罚嵌入的协方差矩阵的非对角系数。

在 SimCLR 中,negative pair 由批给出,这意味着该方法严重依赖于批大小。而 VICReg 则没有这种依赖性。与 Barlow Twin 类似,VICReg 也不需要 siamese 权重差异。此外,VICReg 架构是对称的,并且无需 SimSiam 的停止梯度(stop-gradient)操作、BYOL 的动量编码器(momentum encoder)以及二者均用到的预测器。与之前用于表征学习的任何自监督方法都不同,VICReg 的损失函数中不需要对嵌入进行任何形式的归一化,这使得该方法相对简单。

实验结果

在很多下游任务中,研究者通过评估 VICReg 方法学到的表征来测试其有效性。这些任务包括:ImageNet 线性和半监督评估以及其他一些分类、检测和实例分割任务。他们进一步表明,在更复杂的架构和其他自监督表征学习方法中加入文中提出的方差正则化,可以更好地提高下游任务的训练稳定性和性能。可以说,VICReg 是自监督联合嵌入学习中防止崩塌的一种简单、有效的可解释方法。

图 1:在 ImageNet 上的评估结果

图 2:在下游任务上的迁移学习结果

图 3:在不同架构中加入方差和协方差正则化的效果

图 4:消融研究结果

NeurIPS 2021 线下 MeetUp:12 月北京见!

受疫情影响,NeurIPS 2021 依然选择了线上的形式举办。虽然这可以为大家节省一笔注册、机票、住宿开支,但不能线下参与这场一年一度的学术会议、与学术大咖近距离交流讨论还是有些遗憾。

NeurIPS Meetup 是由 NeurIPS 官方发起并进行支持,由 NeurIPS Code of Conduct 监管的地方性活动。NeurIPS 于 2019 年首次尝试这一机制,在去年和前年机器之心举办的 Meetup 中,来自各地的学术研究人员进行了充分的交流讨论。

今年,我们将在 NeurIPS 官方支持下,再次于 12 月份在北京举办线下 NeurIPS MeetUp China,促进国内人工智能学术交流。2021 NeurIPS MeetUp China 将设置 Keynote、圆桌论坛、论文分享和 Poster 等环节,邀请顶级专家、论文作者与现场参会观众共同交流。

编辑:黄继彦

校对:林亦霖

图灵奖得主Yann LeCun:我的论文也被NeurIPS拒了相关推荐

  1. 图灵奖得主Yann LeCun走进百度,与世界研究工作者展开交流

    百度研究院举办的系列学术交流会,邀请国内外顶尖学者走进百度,分享最新的前沿思考和技术研究.北京时间2月23日上午,广大 AI 研究者和 AI 工程师们非常熟悉的图灵奖得主."深度学习三巨头之 ...

  2. 图灵奖得主Yann LeCun最新访谈!

    Datawhale干货 编辑:泽南.小舟,来源:机器之心 在最近一次访谈中,Meta AI 人工智能先驱 Yann LeCun 点出了下一代人工智能技术的三大主要挑战. Yann LeCun(杨立昆) ...

  3. 在我的世界中,B站UP主搭建世界首个纯红石神经网络,图灵奖得主Yann LeCun转赞...

    机器之心报道 编辑:杜伟 神奇的红石,神奇的我的世界,不可思议的 UP 主. 在我的世界(Minecraft)中,红石是一种非常重要的物品.它是游戏中的一种独特材料,开关.红石火把和红石块等能对导线或 ...

  4. 图灵奖得主Yann LeCun的六十年

    2021-01-25 23:02:40 作者 | 陈大鑫.青暮 当今世界人工智能领域,有三位AI学者被业内奉为"神一样的存在",其中两位来自加拿大,一位来自法国. 他们就是2018 ...

  5. 深度学习准「研究僧」预习资料:图灵奖得主Yann LeCun《深度学习(Pytorch)》春季课程...

    视学算法报道 编辑:蛋酱 转载自公众号:机器之心 开学进入倒计时,深度学习方向的准「研究僧」们,你们准备好了吗? 转眼 2020 年已经过半,又一届深度学习方向的准研究生即将踏上「炼丹」之路.对于这一 ...

  6. 【AI】图灵奖得主 Yann LeCun 最新文章 :自监督学习,人工智能世界的“暗物质”...

    来源:AI前线 作者:Yann LeCun ,Ishan Misra 近年来,AI 产业在开发"可以从大量经过细致标记的数据中学习的 AI 系统"这个研究领域上取得了巨大进步.这种 ...

  7. 图灵奖得主Yann LeCun万字访谈:DNN“史前文明”、炼金术及新的寒冬

    作者 | 武文浩 Yann LeCun,现任 Facebook 副总裁兼首席 AI 科学家,纽约大学教授,曾在 Facebook 内领导开启了 AI 研究,并领导建设了纽约大学的数据科学中心.Yann ...

  8. 深度学习“三巨头”、图灵奖得主 Yann LeCun:我没有天赋,所以才追随聪明人...

    Yann LeCun 作者 | 胡巍巍 出品 | 程序人生(ID:coder_life) "彻头彻尾的骗局." 2018年初,历史上首个获得公民身份的机器人索菲亚,又是上节目,又是 ...

  9. 深度学习“三巨头”、图灵奖得主 Yann LeCun:我没有天赋,所以才追随聪明人

    作者 | 胡巍巍 出品 | 程序人生(ID:coder_life) "彻头彻尾的骗局." 2018年初,历史上首个获得公民身份的机器人索菲亚,又是上节目,又是去联合国演讲,可谓红得 ...

最新文章

  1. BAT面试题9:谈谈判别式模型和生成式模型?
  2. 简单动态启停图 js jquery css3
  3. 【大厂攻略】Android开发3年当了2年咸鱼每天CRUD,复习2个月幸运拿下美团offer!
  4. 两种语言实现设计模式(C++和Java)(三:策略模式)
  5. 增强包_机电工程学院开展“情暖冬日,爱在机电”冬至包饺子活动
  6. 2017计算机应用+简答,2017计算机应用基础试题及答案
  7. kibana 查看索引库中文档个数_百度索引量是什么意思?和百度收录量的区别。...
  8. C语言仅在函数中可见,如何学习C语言、入门C语言,看这篇就够了
  9. 什么是QName【转】
  10. [Android]Log打印
  11. Security+ 学习笔记33 主机安全
  12. OpenCV C++案例实战十《车牌号识别》
  13. 在MFC程序中使用XML文件配置工具栏
  14. 查找整数c语言程序,查找整数(示例代码)
  15. 开发3D游戏建模都需要哪些软件?软件繁多,如何从中挑选学习?
  16. 家乐福中国独立上市,是苏宁的一颗“定心丸”吗?
  17. python爬取电影天堂新片精品模块电影列表,并用迅雷下载
  18. Java程序包不存在问题的解决办法
  19. 使用PS为Unity游戏创建简单的游戏素材实例
  20. Markdown 新手指南

热门文章

  1. 用指针、子函数的方法去一维数组中所有元素的平均值,并放在a[0]处
  2. php网页添加图片的代码,天天查询-PHP版的kindeditor编辑器加图片上传水印功能
  3. 如何基于Kubernetes构建完整的DevOps流水线
  4. Windows server 2008 R2 登录密码恢复
  5. redis的导入导出需要特别注意的地方
  6. LVM学习之LVM基础
  7. MYSQL主从数据库搭建
  8. samba+quota配置
  9. php学习_第6章_PHP的语言结构
  10. ntop和Cacti