作者 | 陈大鑫

来源 | AI科技评论

每件事物的出现都有它各自的使命,我们提到数据集就绕不过ImageNet,ImageNet数据集及其它推动的大规模视觉比赛对人工智能特别是计算机视觉领域的巨大贡献是毋庸置疑的。

一晃十载,ImageNet竞赛和刷榜的历史见证了很多知名神经网络模型的诞生,如AlexNet在2012年横空出世,并在ImageNet竞赛取得冠军,而之后伴随ImageNet竞赛又出现了如Inception、ResNet、ResNeXt等网络模型。在当年,这些模型真是一时风头无量。

虽然如李飞飞所言,ImageNet已经完成了它的历史使命(早早超出了人类的识别率),ImageNet竞赛也已经于几年前就早已不再举办,但是家里有矿的谷歌仍然默默地在ImageNet数据集上进行刷榜。

近日,谷歌大脑团队首席科学家科学家Quoc Le 发推表示,他们提出了一种新的半监督学习方法,通过使用半监督学习方法Meta Pseudo Labels训练EfficientNet-L2,可以将ImageNet 上的 top-1准确率提升到90.2%,这一结果与之前的 SOTA 相比实现了1.6% 的性能提升。

下图则是ImageNet Top-1准确率近五年的详细提升路线图。

这篇有关元伪标签的论文《Meta Pseudo Labels》如下所示:

论文链接:https://arxiv.org/abs/2003.10580

其实这篇论文最早提交于 2020 年 3 月,只不过于最近又放出了最新的一个版本。

可以看到这篇论文前两个版本的识别准确率是86.9%,由此可以间接看出谷歌在这一年期间为之作为目标并持续进行了模型改进(或许称为魔改+调参+trick?)。

谷歌的这篇论文是把ImageNet上top-1识别准确率作为一个亮点,其实这篇论文同样在ImageNet上top-5识别率上也刷到了第一:98.8%。

只不过top-5识别准确率相对比较简单,谷歌是不会把这当作卖点的。(注:top-5识别准确率指的是在测试图片的N个分类概率中,取前面5个最大的分类概率,这五个当中只要有一个预测正确即可,而top-1则最难,只取第一个预测输出结果,对就是对,错就是错。)

1

论文介绍

那这篇论文究竟讲了什么呢?以下援引知乎@小小将的回答(已经过作者授权):

【终于终于,ImageNet的Top-1可以上90%了。其实谷歌刷新的还是自己的记录,因为目前ImageNet上的SOTA还是由谷歌提出的EfficientNet-L2-NoisyStudent + SAM(88.6%)和ViT(88.55%)

首先谷歌这篇paper所提出的方法Meta Pseudo Labels是一种半监督学习方法(a semi-supervised learning ),或者说是self-training方法。和谷歌之前的SOTA方法一样,这里当然用到了那个未公开的300M JFT数据集。

不过这里把它们当成unlabeled的数据(和NoisyStudent一样,但ViT是用的labeled数据pretrain)。Meta Pseudo Labels可以看成是最简单的Pseudo Labels方法的改进,如下面图以图二所示。其实之前的SOTA方法Nosiy Student也是一种Pseudo Labels方法(也需要特定的技巧),如上图所示。

 图一

图二

以上两图显示了伪标签和元伪标签之间的区别。图一:伪标签,在这里一个固定的预训练的教师生成供学生学习的伪标签。图二:元伪标签,老师和学生一起训练。根据教师生成的伪标签(顶部箭头)对学生进行培训。教师根据学生在标记数据(底部箭头)上的表现进行培训。

而Meta Pseudo Labels要解决的是Pseudo Labels容易出现的confirmation bias:

如果伪标签不正确,则学生将从错误的数据中学习。结果,学生可能不会比老师好得多。过度拟合网络预测的错误伪标签称为确认偏差。

老师总会犯错,这就会带偏学生。谷歌提出的解决方案,是用学生在labeled数据集的表现来更新老师,就是上图中老师也是不断被训练的,有点强化学习的意味,就是student的preformance应该是teacher进化的一个reward。Meta Pseudo Labels其实也算是对模型训练过程的优化,为什么叫Meta,paper里面也给出解释:

我们在方法名称中使用Meta,因为从学生的反馈中得出教师更新规则的技术是基于双级优化问题的,该问题在元学习的文献中经常出现。

虽然思路很简单,但是paper里有非常复杂的推导,这里直接贴出伪代码(训练teacher时其实gradient包含三个部分:来自student的feedback,labeled数据loss,以及UDA loss):

关于Meta Pseudo Labels的benefits,paper里面给出了一个toy case,其实我也被这个效果给震惊了。简单来说,就是用TwoMoon dataset,这个数据集中共有两类,或者说是两个cluster,总数据是2000个,每个cluster共有1000个,现在每个cluster只有3个labeled数据,其它都是unlabeled的数据。

作者在这样的一个任务上对比了三种方法:Supervised Learning, Pseudo Labels, and Meta Pseudo Labels,最终结果如下所示:

其中红色圈和绿色圈分别是两类的samples,星号表示labeled的6个数据,红色和绿色区域表示模型的分类区域,虽然3类方法都可以对6个训练样本正确分类,但具体到unlabeled的数据效果差别很大。SL方法基本过拟合了,分类区域完全不对;而Pseudo Labels分对了一半,但是Meta Pseudo Labels却找到了一个比较完美的classifier。虽然这个分类任务看起来不难,但是只有6个训练样本,我个人觉得能finding a good classifier is hard。

当然Google也在论文里狠狠地秀了一把肌肉:

因此,我们设计了一个混合模型-数据并行框架来运行元伪标签。具体来说,我们的培训过程在2,048个TPUv3内核的集群上运行。

论文最后的D2中说到:

元伪标签是一种有效的正则化策略。

我觉得这句话应该是对谷歌这个方法的一个较好的总结。】

2

网友评价

在知乎帖子[如何看待谷歌最新论文第一次将ImageNet数据集的准确度提升至90%以上?]下面,众多知乎大V都对谷歌这一工作做了吐槽。

如[王晋东不在家]回答道:

imagenet榜单前15名都是G家的,都用了不开源的jft data。。。

问怎么看待?数据都看不到,怎么看待?

下面随即就有霍华德等一众大V对谷歌数据集不开源的调侃:

往下翻可以看到大家基本都对谷歌用额外数据集且不公开表示质疑。

之后有匿名网友直接表示谷歌这是耍流氓行为:用了比imagenet还大几个数量级的dataset额外训练,还不公布数据集。

在别的平台上,也有网友回复道:

“Quoc Le的论文Yann Le Cun都吐槽小技巧太多,贼难复现,之前连论文一作都出来说没必要复现,trick太多了。

最后,关于谷歌的这篇论文,以及对于ImageNet Top-1识别率达到90%这件事,大家又有什么看法呢?

参考链接:https://www.zhihu.com/question/439336844

ImageNet的top-1终于上了90%,然而谷歌却遭众网友吐槽相关推荐

  1. ImageNet的top-1终于上了90%,网友质疑:用额外数据集还不公开,让人怎么信服?...

    转载自:机器之心 近日,谷歌大脑研究科学家.AutoML 鼻祖 Quoc Le 发文表示,他们提出了一种新的半监督学习方法,可以将模型在 ImageNet 上的 top-1 准确率提升到 90.2%, ...

  2. ​ImageNet的top-1终于上了90%,网友质疑:用额外数据集还不公开,让人怎么信服?...

    来源:机器之心本文约3000字,建议阅读10+分钟Quoc Le:"我原本以为 ImageNet 的 top-1 准确率 85% 就到头了,现在看来,这个上限难以预测." 近日,谷 ...

  3. ImageNet的top-1终于上了90%?

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:机器之心 AI博士笔记系列推荐 周志华<机器学习> ...

  4. 鸿蒙os吃内存吗,终于上手机!华为鸿蒙 OS 2.0 系统:128KB 内存就能跑

    终于上手机!华为鸿蒙 OS 2.0 系统:128KB 内存就能跑 2020-09-11 10:51:48 0点赞 0收藏 0评论 9月11日消息,华为昨天下午在东莞松山湖举办了全球开发者大会,本次大会 ...

  5. 怀念上世纪90年代的中国摇滚乐

    我在做软件工程师之前一直都想做一名调音师,呵呵,高中时还想做一名歌手,还玩过乐队,不过那些已经是不可实现的梦了,我自从听了老崔的<解决>专辑后就爱上了摇滚乐,并且一直喜欢到现在,只是当今实 ...

  6. 快不快乐用计算机,“终于上计算机课了,真高兴”

    "关注民生 益路黔行",都市晨报携手民生银行徐州分行共同举办的第三季公益探访活动"2018,我们一起去支教"5月21日启程,前往贵州省凯里市当地山区苗寨的棉席小 ...

  7. 80后90后成股市开户主力 网友调侃解套有希望了

     80后90后成股市开户主力 网友调侃解套有希望了 2500点.2600点--2900点,3000点.最近半个多月,A股的多头摧枯拉朽般接连攻克一个又一个高地,让整个市场热血沸腾.股市巨大的赚钱效 ...

  8. 史上AI最高分!谷歌大模型创美国医师执照试题新纪录,科学常识水平媲美人类医生...

    杨净 羿阁 发自 凹非寺 量子位 | 公众号 QbitAI 史上AI最高分,谷歌新模型刚刚通过美国医师执照试题验证! 而且在科学常识.理解.检索和推理能力等任务中,直接与人类医生水平相匹敌.在一些临床 ...

  9. 史上首次!苹果/谷歌/微软/火狐合力解决Web兼容性问题

    大厂技术  高级前端  Node进阶 点击上方 程序员成长指北,关注公众号 回复1,加入高级Node交流群 文 | 罗奇奇 出品 | OSC开源社区(ID:oschina2013) 浏览器制造商 Ap ...

最新文章

  1. linux查看地址和,UNIX/LINUX平台下查看MAC和WWN地址的方法
  2. cxgrid列高度行宽度定义
  3. 台式计算机机箱的作用,如何选择台式电脑机箱?小白安装电脑机箱常识指南
  4. 数据结构排序算法实验报告_[数据结构与算法系列]排序算法(二)
  5. html网络,HTML—构建网络
  6. Python里面使用的容器
  7. AC自动机 HDU 2222
  8. NET委托:一个C#睡前故事
  9. 架构之旅~一个操作的返回要有一个标准,看我的公用消息类
  10. SPI以及UART的测试DEMO
  11. 全网首发:JDK绘制文字:三、绘制句柄的内容是如何定义的
  12. 图片标注工具Labelme-简明使用教程
  13. Python生成图文并茂的PDF报告
  14. 超五类和六类网线的区别—Vecloud
  15. 小米最新系统android 10,国内最快推送安卓10稳定版系统!小米新旗舰出厂标配稳了...
  16. Mac 下如何解压 bin 文件
  17. 真牛!如何才能更容易拿到大厂Offer?挥泪整理面经
  18. QSlider功能作用和信号
  19. idea的java项目怎么连数据库_idea 使用Java连接SQL Server数据库教程
  20. msql中常用的DDL语句

热门文章

  1. SurfaceView 加速 开启硬件加速
  2. 小伙失恋服毒后又反悔 自作聪明喝洗衣粉洗胃
  3. ban aviator wholesale new era|Be Happy! One of the Greatest Sources of Happiness—Nature_4899
  4. 【项目实战开发】第三章——在线生鲜商城系统
  5. NEUQ-acm 预备队训练Week11——复习
  6. TO BE A BETTER MAN(纪念时光)
  7. 如何选择成长型新股?还是得看股票基本面!
  8. 遗传算法GA求解非连续函数最值问题
  9. MySQL入门语法(视频学习笔记)
  10. 基于C++的中国行政区域图染色与信息查询 课程论文+任务书+代码