2020-01-19 16:37 专题:ICLR 2019

导语:ICLR论文解读~

雷锋网AI科技评论按:本文对悉尼科技大学博士生董宣毅发表于 ICLR 2020 的录用Spotlight论文《NAS-BENCH-201: Extending the Scope of Reproducible Neural Architecture Search》进行解读。这篇论文提出的NAS-Bench-201,可在很大程度上提高NAS算法的可复现性,并降低了NAS算法的计算需求(例如仅用0.1秒便可以完成搜索)。

论文链接:https://arxiv.org/abs/2001.00326

NAS背景介绍

神经网络结构对深度学习领域的各个应用的性能都起着至关重要的作用,目前,网络结构的设计范式已经逐渐的从专家手动设计转变为了机器自动搜索。网络结构搜索 (Neural Architecture Search,NAS) 旨在研究如何在一个给定的搜索空间内自动地发现高性能高精度高效率的网络结构。

在过去的几年内,越来越多的科研人员投入到NAS这一研究领域,越来越多的NAS方法被提出,整个领域也取得了许多突破性的进展。现在是时候回顾一下NAS领域好的一面和不好的一面了。NAS除了以良好的性能著称,还因为海量的计算需求而让众多研究员望而却步,同时目前各个NAS算法的实验设置不尽相同,难以去公平的衡量一个NAS算法的真实好坏。

为了进一步推动NAS算法的可复现性,为了降低NAS算法的计算需求,为了让大家着眼于NAS算法的本质,且启发后续的NAS算法,我们提出了NAS-Bench-201。

NAS-Bench-201是什么?

NAS-Bench-201把15000多个神经网络在三个数据集(CIFAR-10,CIFAR-100,ImageNet-16-120)上基于不同的随机数种子基于不同的超参数训练了多次。提供了每个训练epoch之后的训练和测试耗时,模型在训练集/验证集/测试集的损失函数和准确度,训练之后的模型参数,模型大小,模型计算量等重要信息。NAS-Bench-201将这些有用的诊断信息整理起来,提供了方便的API来获取他们。执行 “pip install nas-bench-201”可以一键安装NAS-Bench-201的API,你将会拥有15000+个神经网络的全部信息!下图是15000+个网络性能可视化。

利用NAS-Bench-201能干什么?

1,加速NAS算法,利用NAS-Bench-201,Regularized Evolutionary Algorithm / Random Search / REINFORCE等NAS算法可以在0.1秒内完成搜索过程并给出发现的网络的性能。

2,实时跟踪NAS算法表现,对于One-shot NAS算法,利用NAS-Bench-201就可在任意时间节点,观测当前预测的网络结构的性能表现而无需重新训练该结构。

3,公平对比每一个NAS算法。不同的文章在重训练搜索出的网络结构时,使用的超参数/数据增强/正则/等都不尽相同。现在利用NAS-Bench-201的API,每位科研人员可以公平地对比搜索出来的网络结构。

NAS-Bench-201还提供了什么?

我们在一个codebase下实现且开源了10种不同的NAS算法。我们尽可能地公平地对比检验了这些算法的性能。结果如下图:

REA / REINFORCE / RANDOM / BOHB的500次运行结果

六种One-shot NAS算法的3次运行结果

使用NAS-Bench-201的注意事项

NAS-Bench-201旨在提供一个公平的计算友好型的环境给NAS社区。因为利用我们的API可以很容易的获取每个网络的性能,这个便利的条件可能会隐形的让设计的新NAS算法过拟合到最好的结构。为此,我们设置了一些规则来防止过拟合。

1,不能对某一个具体的操作进行正则化。比如限制skip-connection操作的数量等。

2,使用我们的提供的网络性能。训练策略影响着一个网络结构最终的性能。我们建议NAS-Bench-201的用户使用我们这个benchmark提供的每个网络的性能,即使使用别的训练策略可以得到更好的性能。以此来保证公平性。

3,公布多组搜索实验的结果。多次反复搜索过程能够更稳定地展示一个NAS算法的效果。

NAS-Bench-201 API样例展示

使用NAS-Bench-201的数据非常容易,无需自己整理数据,我们提供了方便的API接口,可以轻松调用各种对NAS算法有用的诊断信息。下面我们暂时了一些基本用法:

各位小伙伴快来试一试吧!代码,数据,算法分析总有一款你需要的哦 。

NAS-Bench-201的相关资源

10+种NAS算法的PyTorch实现:https://github.com/D-X-Y/AutoDL-Projects

NAS-Bench-201复现指南:https://github.com/D-X-Y/AutoDL-Projects/blob/master/docs/NAS-Bench-201.md

NAS-Bench-201 API的pip安装:https://pypi.org/project/nas-bench-201/1.0/

NAS-Bench-201文章链接:https://openreview.net/forum?id=HJxyZkBKDr

优秀NAS文章列表:https://github.com/D-X-Y/Awesome-NAS

ICLR 2020| 最新NAS benchmark:0.1秒完成NAS算法搜索相关推荐

  1. 神经架构搜索(NAS)2020最新综述:挑战与解决方案

    终于把这篇NAS最新的综述整理的survey放了上来,文件比较大,内容比较多.这个NAS的survey是A Comprehensive Survey of Neural Architecture Se ...

  2. grasshop 犀牛5.0下载_神契幻奇谭 v1.129版发布 快来下载神契幻奇谭2020最新官方版...

    全文导读 下载神契幻奇谭就上高手游,神契幻奇谭是一款具有二次元.烧脑特征的角色扮演手机游戏,最让人难忘的是精致生动的形象设计系统和宏大的剧情,平平淡淡还是揭竿而起,传奇史诗由您亲自谱写!神契幻奇谭日前 ...

  3. php mt4,2020最新Thinkphp5.0版微盘|微交易源码|MT4+外汇+贵金属交易 PHP整站源码

    [温馨提示]源码包解压密码:www.youhutong.com 资源描述 2020最新Thinkphp5.0版微盘|微交易源码|MT4+外汇+贵金属交易 PHP整站源码 微盘微交易源码,MT4,外汇, ...

  4. 0.3秒定位解剖位置、定位精度提升超2.3%!达摩院骨科AI成果已被MICCAI 2020收录

    限时免费提供人脸人体.分割抠图.OCR以及医疗分析等共计140+项AI能力的调用[点此开通] 阿里巴巴达摩院医疗AI又有了一项突破. 7月9日,达摩院提出了一种AI助力骨科关节置换手术的新方法,该方法 ...

  5. 重磅!深度学习的顶级会议ICLR 2020 数据图文详解

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 编辑:Sophia 计算机视觉联盟  报道  | 公众号 CVLianMeng 转载于 :medium,机器之心,学 ...

  6. ICLR 2020论文投稿2600篇,GNN、BERT、Transformer领跑热门研究方向

    (图片由AI科技大本营付费下载自视觉中国) 出品 | AI科技大本营(ID:rgznai100) 2019 年 4,ICLR 2020 论文征集活动开始,截止 9 月 25 日,大会共收到近 2600 ...

  7. 0.7秒,完成动漫线稿上色

    鱼羊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 给一张这样繁复的线稿: 一步步填上颜色.赋上光影: 你猜需要多长时间? 答案是最快0.7秒. 没错,这又是AI的手笔. 厚涂不在话下,换种漫 ...

  8. 从ICLR 2020、AAAI 2020看对话系统近期研究进展

    ©PaperWeekly 原创 · 作者|王馨月 学校|四川大学本科生 研究方向|自然语言处理 本文盘点近期 ICLR 2020.AAAI 2020 上几篇对话系统相关的论文. ICLR 2020 论 ...

  9. ICLR 2020 | 可提速3000倍的全新信息匹配架构(附代码复现)

    ©PaperWeekly 原创 · 作者|周树帆 学校|上海交通大学硕士生 研究方向|自然语言处理 今天聊一篇 FAIR 发表在 ICLR 2020 上的文章:Poly-encoders: Trans ...

最新文章

  1. Java系列: JAVA字符串格式化-String.format()的使用(zz)
  2. 天地伟业tiandy如何连手机_关注 | 天地盖手工盒裱纸选铜版纸还是白牛皮纸?
  3. oracle 创建模式语句,ORACLE基本使用SQL语句以及归档模式的操作
  4. wshttpbinding java_WCF自定义用户账号密码之WCF系结模式wsHttpBinding的Java调用
  5. Wi-Fi 6连续两年出货量国内登顶,锐捷无线靠什么这么6?
  6. Java类的执行顺序
  7. Dynamic CRM 2013学习笔记(四十二)流程5 - 实时/同步工作流(Workflow)用法图解...
  8. iOS键盘遮挡输入框,输入区域自动上移
  9. Eclipse,工程builed失败的原因。
  10. linq拼接where语句_C# 10. LINQ 的三种查询语句写法
  11. Fiddler中文版
  12. 从各方面比较一下各类电脑玩手游吃鸡安卓模拟器
  13. ijkplayer 代码走读之 h264 解封装器应用详解
  14. 易语言 超文本浏览框
  15. 渗透测试-CS架构客户端
  16. mysql 导出dmp文件_Linux环境下使用crontab实现mysql定时备份
  17. perl中grep用法总结 z
  18. [开源 .NET 跨平台 数据采集 爬虫框架: DotnetSpider] [一] 初衷与架构设计 - ModestMT.Zou - 博客园...
  19. 初识MIMO(三):天线分集技术及其仿真
  20. 精准引流怎么推广:免费的引流推广营销技巧

热门文章

  1. 如何让决策树中有样本的索引
  2. pandas dataframe与series
  3. mysql一主两从_MySQL 网络延迟参数设置建议
  4. 有限域f9的特征是多少_宽频域谐波的潜在威胁欠缺全面考虑,现有标准需进一步优化...
  5. 图灵奖得主Judea Pearl :从“贝叶斯网络之父”到“AI社区的叛徒”
  6. 两周后上线,老板你在开玩笑吗?
  7. 图灵2011年6月书讯【误区】【软件调试修炼之道】即将上市
  8. 【南洋理工-CVPR2022】视觉语言模型的条件提示学习
  9. 独家 | 神经网络的对抗性攻击:快速梯度符号方法的探索(附链接)
  10. OpenAI新研究:扩散模型在图像合成质量上击败BigGAN,多样性还更佳