鱼羊 发自 凹非寺 
量子位 报道 | 公众号 QbitAI

谷歌的EfficientNet进化之后,又刷新了ImageNet纪录。

这个叫Noisy Student的新模型,将ImageNet图像分类的top-1准确率提高到了87.4%,比此前最好的FixResNetXt-101 32×48d高出了1个百分点

更令人惊叹的是,在ResNeXt-101 32×48d只达到了16.6%top-1准确率的ImageNet-A测试集上,Noisy Student一举将准确率提高到了74.2%

新模型来自谷歌大脑首席科学家Quoc V. Le的团队,而论文第一作者,则是毕业于上海交大ACM班的谢其哲,目前正在CMU攻读博士,是谷歌大脑的学生研究员。

实现方法

提升如此明显,但方法却并不复杂。Noisy Student是站在了EfficientNet这位“名师”的肩膀上。

第一步,是用ImageNet中带标签的图像训练EfficientNet。

EfficientNet是谷歌开源的缩放模型,基于AutoML开发, 初登场就刷新了ImageNet的纪录,准确度为84.4%(top-1)和97.1%(top-5),并且模型更小更快,效率提升达10倍之多。

第二步,在一个更大规模的数据集上,用EfficientNet给无标签图片打上伪标签。

这一步中,研究人员选择的是谷歌的JFT数据集。这一数据集拥有300M图片,是ImageNet的300倍。

然后,将有标签的图像和被打上伪标签的图像组合起来,训练一个更大的学生模型。

新的学生模型又会成为新的老师,迭代这一过程。

在生成伪标签的过程中,教师模型不会被噪声干扰,以便提高伪标签的置信度。

但学生模型在训练的过程中,会面临来自随机深度、dropout和RandAugment带来的噪声干扰。这就迫使学生模型不得不从伪标签中进行学习。

在训练的过程中,EfficientNet也会不断更新。其中,最大的模型EfficientNet-L2需要在2048核的Cloud TPU v3 Pod上训练3.5天。

性能表现

开头已经提到,这个新的Noisy Student模型再一次刷新了ImageNet的纪录,现在来看看它的具体战绩:

在top-1准确率上,EfficientNet和Noisy Student的组合将最佳成绩提高了1个百分点,并且模型的参数规模远小于Facebook的FixResNetXt-101 32×48d。

而在更加严格测试集上,Noisy Student的进步更为显著。

ImageNet-A测试集包含7500个自然对抗样本,会导致SOTA模型的准确率大大下降。比如来自Facebook的知名选手ResNeXt-101 32×48d,就只能达到16.6%的top-1准确率。

在这个基准当中,Noisy Student一举将top-1准确率从16.6%提高到了74.2%

Image-C和Image-P测试集则包含了模糊、雾化、旋转和缩放过的图像。换句话说,测试图像完全不同于模型的训练数据。

在ImageNet-C上,Noisy Student将平均错误率从45.7降到了31.2

在ImageNet-P上,Noisy Student将平均翻转率从27.8降到了16.2

也就是说,这个新模型不仅准确率又进一步,在鲁棒性上,更是实现了惊人的进步。

根据论文作者介绍,模型代码将尽快释出,不妨先mark一下~

传送门

论文地址:

大咖齐聚!第一批参会嘉宾重磅揭晓

量子位 MEET 2020 智能未来大会启幕,李开复、倪光南、景鲲、周伯文、吴明辉、曹旭东、叶杰平、黄刚等AI大咖与你一起读懂人工智能。观众票即将售罄,扫码报名预定席位 ~

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「在看」吧 !

从16.6%到74.2%,谷歌新模型刷新ImageNet纪录,第一作者是上海交大毕业生谢其哲...相关推荐

  1. 谷歌新模型刷新ImageNet纪录,第一作者是上海交大毕业生谢其哲

    2019-11-14 01:43:36 鱼羊 发自 凹非寺  量子位 报道 | 公众号 QbitAI 谷歌的EfficientNet进化之后,又刷新了ImageNet纪录. 这个叫Noisy Stud ...

  2. 谷歌新模型突破BERT局限:NLP版「芝麻街」新成员Big Bird长这样

    萧箫 发自 凹非寺 量子位 报道 | 公众号 QbitAI 最新消息,谷歌推出了NLP系列「芝麻街」的新成员Big Bird. 这个在外界眼中看起来有点可爱的动漫小鸟,摇身一变,解决了BERT模型中的 ...

  3. 史上AI最高分!谷歌大模型创美国医师执照试题新纪录,科学常识水平媲美人类医生...

    杨净 羿阁 发自 凹非寺 量子位 | 公众号 QbitAI 史上AI最高分,谷歌新模型刚刚通过美国医师执照试题验证! 而且在科学常识.理解.检索和推理能力等任务中,直接与人类医生水平相匹敌.在一些临床 ...

  4. 友商对于鸿蒙系统,谷歌新系统上线!鸿蒙面临生死线考验,华为喊话友商,被小米拒绝...

    随着鸿蒙系统正式推出时间的临近,业界对于这款国人自研操作系统的期待也与日俱增.不过,作为操作系统市场的新晋选手,鸿蒙面临的竞争压力也同样不小. 谷歌带来压力 根据鸿蒙官方在5月25日的消息,鸿蒙将在6 ...

  5. 谷歌提出「卷积+注意力」新模型,超越ResNet最强变体!

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 丰色 发自 凹非寺 量子位 报道 | 公众号 QbitAI Tran ...

  6. 海外名校毕业!好不容易凭借超强的面试能力+算法入职的谷歌新员工被批干活太慢,委屈得要哭!作为职场新人该怎么办?...

    一位刚毕业一年的谷歌新员工被manager委婉提示"干活慢",小哥一下子就受不了了,只想找个地方大哭一场.关键是,这已经不是他第一次被批评干活慢了. 原来这位小哥是海外TOP10的 ...

  7. 谷歌新发布的分布式数据库服务,是要打破CAP定理了吗?

    谷歌新发布的分布式数据库服务,是要打破CAP定理了吗? 本来来自:Original 2017-02-19 作者|登州知府 2月14日,Google 宣布推出 Cloud Spanner 云端数据库服务 ...

  8. 谷歌提出「卷积+注意力」新模型,超越ResNet最强变体

    丰色 发自 凹非寺 量子位 报道 | 公众号 QbitAI Transformer跨界计算机视觉虽然已取得了一些不错的成绩,但大部分情况下,它还是落后于最先进的卷积网络. 现在,谷歌提出了一个叫做Co ...

  9. 谷歌推出新模型「pQRNN」,少量参数下进行文本分类,性能堪比BERT

    近日,谷歌推出了新模型「pQRNN」,它是由去年推出的「PRADO」进一步使用小模型改进而得,达到了SOTA结果.pQRNN的新颖之处在于,它可以结合一个简单的映射和一个quasi-RNN编码器来进行 ...

最新文章

  1. Oracl数据库管理方面的资料(查询sga,查看oracle数据库名称sid,查看oracle数据库名称,查看表空间,修改表空间名称,数据库管理,sqlPlus数据显示)
  2. 安置和设置Opera9.50Beta2
  3. 建立最简单的repo服务器实例讲解
  4. 终极Java日志字典:开发人员最常记录的单词是什么?
  5. WPF疑难杂症之二(全屏幕窗口)
  6. WordPress 多语言支持(本地化)
  7. 编程算法 - 篱笆修理(Fence Repair) 代码(C)
  8. 《Android游戏开发详解》一3.7 里程碑
  9. ECS 还是轻量应用服务器,看完评测你就知道了?
  10. JAVA刺客信条大革命_黑色沙漠单机版
  11. appium的滑动操作总结
  12. Linux服务篇之DNS域名解析服务
  13. ArcGIS中将经纬度表格转为空间图层并制作采样点分布图
  14. 搭建自己的frp服务器
  15. C# 抽象类与接口异同
  16. python - sklearn 计算F1
  17. 跟着小马哥学系列之 Spring IoC(进阶篇:类型转换)
  18. 分数一定是有理数吗?
  19. Matlab群体智能优化算法之大鲹鱼优化算法(GTO)
  20. 每天晨跑五公里,膝盖有点儿疼,不想中断,有什么办法缓解吗?

热门文章

  1. ECS TAG功能详解
  2. NHbiernate 配置
  3. 构造 HDOJ 5400 Arithmetic Sequence
  4. spring4 整合 mybatis3 配置文件
  5. Android 关于Handler
  6. 第十四章 梁山好汉中谁最惹人爱
  7. 树型目录菜单,菜单图标不是图片,是字体
  8. mongodb从3.2升级到4.4_丰田汉兰达汽车音响升级黄金声学GS265.2,焱哥音响
  9. kmeans python interation flag_Python / Scipy Integration数组
  10. Metasploit设置VERBOSE参数技巧