点击下方卡片,关注“CVer”公众号

AI/CV重磅干货,第一时间送达

转载自:机器之心  |  编辑:张倩、小舟

双盲评审之下,图灵奖得主的论文也会被拒。

上周,全球人工智能顶会 NeurIPS 2021 放出了今年的论文接收结果

这位拥有独特心境的研究者便是大名鼎鼎的 Facebook 首席 AI 科学家、2018 年图灵奖得主 Yann LeCun。

被拒绝的论文标题为《VICReg: Variance-Invariance-Covariance Regularization for Self-Supervised Learning 》。LeCun 表示,在这篇论文中,他们提出了一种极其简单、高效的方法,用于联合嵌入(joint-embedding)架构的自监督训练。

VICReg 论文链接:https://arxiv.org/pdf/2105.04906.pdf

而领域主席给出的拒稿理由是:与 LeCun 等人之前发表于 ICML 2021 上的「Barlow Twins」论文相比,这篇「VICReg」提出的改进还不够大。

Barlow Twins 论文链接:https://arxiv.org/pdf/2103.03230.pdf

但 LeCun 似乎并不这么认为,他表示,VICReg 引入了方差正则化,这使得它适用于更广泛的架构。

因此,在 LeCun 看来,他们的论文有足够的创新之处,被拒绝并不是什么丢人的事。「一些最具影响力的论文被拒绝过多次,比如 David Lowe 著名的 SIFT,」LeCun 在 twitter 上写道。

对于「不要放弃」之类的鼓励,LeCun 给出的回应是:「我的整个职业生涯都是基于『不放弃』的,现在也不会改变。」对于 LeCun 这种连「AI 寒冬」都经历过的人,个别研究不被肯定又算得了什么。

不过,对于普通研究者来说,LeCun 论文被拒让人看到了顶会审稿机制透明的一面:看来双盲评审还是有一定公平性的。

而且,审稿结果似乎并没有被网络上的宣传所左右:该论文今年 5 月份就出现在了 arXiv 上,而且 LeCun 发表推特进行了宣传。在 LeCun 看来,这是一种正常的学术信息交流,有利于技术进步。但不可忽略的一点是:在各种「交流」渠道中,不同地位的研究者所占有的资源是非常悬殊的,这难免造成一些不公平,让本身就很有学术号召力的研究者从中获益。

不过,具体到「VICReg」这篇论文是否应该被接收,我们还是要看一下论文的具体内容。

「 VICReg 」是个什么方法

自监督表征学习在过去几年取得了重大进展,在许多下游任务上几乎达到了监督学习方法的性能。虽然可以显式地防止崩溃(collapse),但许多方法都存在成本高昂的问题,需要大量内存和较大的批大小。

还有一些方法虽然有效,但是依赖于难以解释的架构技巧。已有一些研究提供了关于如何通过非对称方法避免崩溃的理论分析,但还远不完备,并且这些方法可能不适用于其他自监督学习场景。最后,冗余减少(redundancy reduction)的方法通过对表征的维度进行去相关(decorrelate)操作来避免崩溃,从而使表征能够最大限度地提供有关其相应输入的信息。这些方法的性能良好,能够学习有意义的表征,在去相关的同时保留表征的方差,但所有这些都使用一个唯一的目标函数。VICReg 的研究提出将目标分解为三个独立的目标函数,且每个目标函数都有明确的解释。

在这篇论文中,研究者提出了一种新的自监督算法——VICReg(Variance-Invariance-Covariance Regularization,方差 - 不变性 - 协方差正则化),用于学习基于三个简单 principle(方差、不变性和协方差)的图像表征,这些 principle 有明确的目标和解释。

方差 principle 独立地约束每个维度上嵌入的方差,是一种简单而有效的防止崩溃的方法。更准确地说,研究者使用 hinge loss 来约束沿嵌入的批维度计算的标准差,以达到固定目标。与对比方法不同,这里不需要 negative pair,嵌入被隐式地鼓励不同于彼此,而且它们之间没有任何直接的比较。

不变性 principle 使用标准的均方欧氏距离来学习对一张图像多个视图的不变性。

最后,协方差 principle 借鉴了 Barlow Twins 的协方差 criterion,后者将学习表征的不同维度去相关,目标是在维度之间传播信息,避免维度崩溃。这个 criterion 主要是惩罚嵌入的协方差矩阵的非对角系数。

在 SimCLR 中,negative pair 由批给出,这意味着该方法严重依赖于批大小。而 VICReg 则没有这种依赖性。与 Barlow Twin 类似,VICReg 也不需要 siamese 权重差异。此外,VICReg 架构是对称的,并且无需 SimSiam 的停止梯度(stop-gradient)操作、BYOL 的动量编码器(momentum encoder)以及二者均用到的预测器。与之前用于表征学习的任何自监督方法都不同,VICReg 的损失函数中不需要对嵌入进行任何形式的归一化,这使得该方法相对简单。

实验结果

在很多下游任务中,研究者通过评估 VICReg 方法学到的表征来测试其有效性。这些任务包括:ImageNet 线性和半监督评估以及其他一些分类、检测和实例分割任务。他们进一步表明,在更复杂的架构和其他自监督表征学习方法中加入文中提出的方差正则化,可以更好地提高下游任务的训练稳定性和性能。可以说,VICReg 是自监督联合嵌入学习中防止崩塌的一种简单、有效的可解释方法。

图 1:在 ImageNet 上的评估结果。

图 2:在下游任务上的迁移学习结果。

图 3:在不同架构中加入方差和协方差正则化的效果。

图 4:消融研究结果。

ICCV和CVPR 2021论文和代码下载后台回复:CVPR2021,即可下载CVPR 2021论文和代码开源的论文合集后台回复:ICCV2021,即可下载ICCV 2021论文和代码开源的论文合集后台回复:Transformer综述,即可下载最新的两篇Transformer综述PDF
CVer-Transformer交流群成立
扫码添加CVer助手,可申请加入CVer-Transformer 微信交流群,方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch和TensorFlow等群。
一定要备注:研究方向+地点+学校/公司+昵称(如Transformer+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群▲长按加小助手微信,进交流群
▲点击上方卡片,关注CVer公众号整理不易,请点赞和在看

我的论文被NeurIPS拒了!图灵奖得主LeCun:自监督学习新工作相关推荐

  1. 两位图灵奖得主万字长文:新计算机架构,黄金十年爆发!

    来源:cacm.acm.org.新智元 图灵奖得主.计算机体系结构宗师David Patterson与John Hennessy认为,未来将是计算机体系结构的黄金十年.最新一期的ACM通讯上刊登了两人 ...

  2. 图灵奖得主LeCun力推无监督学习:要重视基于能量的学习方法

    作者 | Tiernan Ray 译者 | 夕颜 出品 | AI科技大本营(ID:rgznai100) 导语:图灵奖得主深度学习大牛 Yann LeCun 表示,人工智能的下一个发展方向可能是放弃深度 ...

  3. 图灵奖得主LeCun和7位华人博士当选美国科学院2021院士!!

    来源:NAS 编辑:yaxin.LRS 转自:新智元 美国科学院2021新晋院士名单发布! 美国国家科学院(National Academy of Sciences,NAS)昨晚在网上宣布了最新当选的 ...

  4. 图灵奖得主LeCun亲授,深度学习课程在线发布|资源

    木易 发自 凹非寺  量子位 报道 | 公众号 QbitAI 深度学习作为AI入门的一门必修课程,在网上一直有着许多教学资源. 最常见的莫过于吴恩达老师的<深度学习>课程. 就在前不久,纽 ...

  5. 图灵奖得主LeCun:不需要监督的AI才是未来!

    Datawhale干货 作者:ELIZA STRICKLAND,编译:机器之心 AI 的前进方向是通过更好的数据标签来改善监督学习,还是大力发展自监督 / 无监督学习?在 IEEE Spectrum ...

  6. 【经典课程】图灵奖得主LeCun亲授,深度学习课程在线发布

    点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要5分钟 Follow小博主,每天更新前沿干货 深度学习作为AI入门的一门必修课程,在网上一直有着许多教学资源. 最常见的莫过于吴恩达老师的&l ...

  7. 6000星人气深度学习资源!架构模型技巧全都有,图灵奖得主LeCun推荐

    铜灵 发自 凹非寺 量子位 出品 | 公众号 QbitAI 暑假即将到来,不用来充电学习岂不是亏大了. 有这么一份干货,汇集了机器学习架构和模型的经典知识点,还有各种TensorFlow和PyTorc ...

  8. 巨星陨落!图灵奖得主Edmund Clarke感染新冠逝世!

    点击 机器学习算法与Python学习 ,选择加星标 精彩内容不迷路 新智元报道 当地时间12月22日,2007年图灵奖得主爱德蒙·克拉克(Edmund M. Clarke)因感染新冠肺炎不幸去世,享年 ...

  9. 图灵奖得主Lecun、纽约大学教授Marcus,大佬争论背后的玄机

    整理 | 杨阳 出品 | CSDN(ID:CSDNnews) 四年前,纽约大学教授Marcus为反驳深度学习三巨头之一Bengio的"有意识先验"和"解纠缠观念" ...

最新文章

  1. Go -- 一致性哈希算法
  2. SyntaxHighlighter -- 代码高亮插件
  3. 移动端1px像素的设置?
  4. mui html5电子签名,关于H5电子签名的实现。
  5. 云智一体趋势下,百度智能云打通技术与商业的共生闭环
  6. Linux网络编程 之 TCP编程(七)
  7. 【select模块】select IO多路复用和select实现FTP
  8. 第12步 用户模块前端(客户)
  9. 论文浅尝 | 六篇2020年知识图谱预训练论文综述
  10. 虚拟机 NAT模式与桥接模式的区别
  11. windows10环境tensorflow下载安装
  12. 32位/64位WIN2003各版本支持内存列表 彻底解决XP系统无法支持4G内存的问题
  13. Linux shell 的条件 / 比较语法
  14. 网卡驱动DM9000-基于uboot
  15. 期权与期货有哪些不同?
  16. 服务器使用笔记本网络连接外网
  17. 自定义的毛玻璃效果,高斯模糊
  18. SLURM 节点状态总是drained问题
  19. Android 如何关闭Navigation Bar
  20. java 标签云_网站标签云(TagCloud)的实现

热门文章

  1. ANSYS/Icepak网格划分_51CAE_新浪博客
  2. 屏保文件scr文件制作方法
  3. 一篇让读者恐怖、令微软害怕的文章
  4. html查看器 小米8,小米文档查看器app
  5. TouchImageView源码分析
  6. PP越狱助手官方最新版 v1.6.0 绿色版
  7. DB2中使用事件监控器获取某个时间段里某个用户执行的SQL语句
  8. 【lwip】第二篇:使用lwip的netconn接口编写TCP服务器
  9. 实验十八、测量运放的开环差模放大倍数
  10. 弘扬文化,传承文明-西安第七届文化马拉松