OpenAI今天宣布将开始追踪机器学习模型的效率,并对AI算法演进的情况进行定量追踪,结果显示算法改进效率吊打摩尔定律。

为了启动这一进程,Open AI发表了一份分析报告,开篇即用数据展示了算法演进的速度。

报告分析显示,自2012年以来,要训练一个人工智能模型在基准测试ImageNet图像分类任务中达到同等的分类效果,所需的算力每16个月就会减少1/2。

与2012年相比,现在训练一个神经网络达到 AlexNet的水平所需的算力会减少到1/44(相比之下,摩尔定律在相同时间之内,效率只有12倍左右的增长)。结果表明,对于投入了大量资金的AI研发,算法演进显然比传统的硬件进步带来了更多的收益。

算法演进速度吊打摩尔定律

「算法进步是推动AI发展的关键因素。重要的是要找到方法,阐明整个算法演进的过程,尽管这比衡量计算趋势更难,」OpenAI 在官网文章中写道。

提升算法效率,可以定义为减少训练算法完成某项任务所需的算力。

在很多其他领域都可以对效率进行比较,比如 DNA 测序(每10个月翻一番)、能源再生(每6年翻一番)和晶体管密度(每2年翻一番)。研究人员经常使用效率,来衡量算法在完成经典计算任务时的能力,其中就包括分类任务。分类等传统问题上的效率提升,比机器学习中的效率更容易衡量,因为它们对任务难度的衡量更加清晰。

在机器学习中,我们想要测量算法的效率,就要保持达到性能水平的恒定。

在分析中,Open AI利用开源的方法测量了各种模型达到AlexNet 水平的效率。

上图为 ImageNet比赛中各种模型达到AlexNet水平的效率提升情况,图中reduction factor指的就是提升的倍数。

2019年推出的EfficientNet-b1模型达到ResNet-50相同的性能,4年的时间里所需算力减少到1/10。

研究发现在机器翻译、 Go 和 Dota 2比赛中,在较短的时间内效率提升速度更快:

1 在WMT’14英语到法语的翻译基准测试中,seq2seq三年后推出的Transformer,完成相同的训练任务所需的算力减少了1/61。seqseq也是谷歌2014年推出的架构,是当时最先进的模型。

2 我们都知道,Deepmind 的AlphaZero是一个从零开始自学下棋的系统,他的进步速度也很快,和在他一年前推出的版本 AlphaGoZero相比,达到相同的性能,只需要8分之一的算力。

3 Open AI自己的Dota2游戏系统Open AI Five Rerun和在3个月之前推出的Open AI Five相比,达到相同的性能只需要1/5的算力。前者曾经击败过世界冠军,种子选手OG。

当然也要考虑到2012年的计算和2019年的计算不可同日而语,就像美元需要随着时间的推移发生通货膨胀一样。相同的算力在2019年可以完成比2012年更多的任务。从这个意义上讲,可以将某些AI研究进程分为两个阶段,类似于半导体中的「tick tock」发展模型。

以英特尔为例, Tick年(工艺年)更新制作工艺,Tock年(架构年)更新微架构。Tick-Tock就是时钟的“嘀嗒”的意思,而在Intel的处理器发展战略上,每一个嘀嗒代表着2年一次的工艺制程进步。每个Tick-Tock中的“Tick”,代表着工艺的提升、晶体管变小,并在此基础上增强原有的微架构,而Tick-Tock中的“Tock”,则在维持相同工艺的前提下,进行微架构的革新,这样在制程工艺和核心架构的两条提升道路上,总是交替进行。

根据摩尔定律,一个集成电路中可容纳的晶体管数量每两年就会翻一番,OpenAI 推测演算法效率可能会超过摩尔定律。

摩尔定律是在1965年提出来的,当时集成电路只有64个晶体管。

Open AI的研究结果表明,AI研发,研究人员时间和计算能力的投入更高,算法演进效率可能会超过硬件效率。

算法效率的提升使得研究人员可以在同等的时间和经济条件下做更多想做的实验。除了作为衡量整体AI进步的指标,算法效率提升还加快了未来AI研究的速度,也意味着整体算力的提升。

其他衡量AI进展的指标

除了效率之外,还有许多其他的衡量标准也可以揭示AI的算法演进过程。

1 训练成本(以美元为单位)也是相关的衡量标准,但不再取决于算法的进步,因为它还受到底层硬件、硬件利用率和云基础设施的改进的影响。

2 采样效率也很关键,尤其是当样本数据不足时。训练模型的能力也加快了研究的速度,可以被认为是对感兴趣的学习能力的并行性的一种度量。

3 在 GPU 时间、参数和浮点运算方面,训练模型推理效率也有所提高,但这主要是由于它们的经济影响而不是对未来研究进展的影响。推理效率在5年内(每15个月翻一番)提高了18倍,这表明训练效率和推理效率可能在相同的速率下得到提高。

算法效率演进将大幅推动行业发展

对于翻译和游戏这样的领域,如何用更少的算力来获取更好的成绩,提升大规模计算的效率是至关重要的。在重要能力方面实现最优训练效率的模型,可以用来规模化,来实现总体计算的最佳性能。

事实上,这项工作最初是通过训练 PyTorch 示例模型来完成的,通过微调来提高早期学习的效率。

Open AI认为,测量算法效率提升的长期趋势将有助于定量描绘整个算法演进的进程。研究表明,硬件和算法效率都是呈倍数增长的,一个良好的AI进步模型可以将二者相结合。

正是出于上述这些原因,Open AI开始公开测试最先进的算法效率。除了图像和翻译效率基准(ImageNet 和 WMT14) 测试以外,Open AI会考虑逐步增加更多的基准测试,同时Open AI鼓励学界提交他更多的测量结果(原创作者和合作者也会受到相应的奖励)。

值得注意的是,OpenAI 并不是第一个提出利用基准测试AI模型效率的公司。去年,艾伦人工智能研究所、卡内基梅隆大学和华盛顿大学的科学家们主张将效率作为AI学术论文的一个更普遍的评估标准,与准确性和相关措施并列。还有人主张要求对机器学习项目进行行业级的耗能分析,并设定每瓦特运行算力的行业标准。

「行业领袖、政策制定者、经济学家和研究人员都在努力更好地理解人工智能的进展,并决定他们应该投入多少精力,并将研究重心放在何处,」OpenAI 写道。「我们的这项测量工作可以帮助他们做出这样的决定。」

论文结尾,Open AI展望了未来,「如果在未来的几十年内,我们观察人工智能算法效率呈指数级倍增,我们不确定这会带来什么。这些结果也意味着,我们正面向着一个AI服务和技术无比强大的未来。」

这个未来也许已经近在咫尺。

超摩尔定律!OpenAI官宣AI算法效率每16个月翻一番相关推荐

  1. AI算法效率每16个月提速一倍,算力革命超越摩尔定律

    AI算法效率每16个月提速一倍,算力革命超越摩尔定律 2020-05-06 22:10:26 作者 | 蒋宝尚 编辑 | 丛 末 摩尔定律预测芯片性能每18个月翻一倍,那 AI 算法性能多少个月翻一番 ...

  2. c++ 线程进度条_AMD R9 5900X 跑分曝光,单线程性能大幅提升;天猫“官宣”苹果iPhone 12:暗示10月16日开启预定...

    2020.10.1数码资讯 微软发布 Surface Pro X:搭载 SQ2 处理器 微软今天更新了搭载 Arm 处理器的 Surface Pro X 平板,搭载了 SQ2 处理器,增加了铂金色配色 ...

  3. ChatGPT或要推出APP,OpenAI官宣为ChatGPT招募移动端开发工程师

    文 | 兔子酱 OpenAI官方招聘页面放出了英雄帖,他们正在为ChatGPT招聘移动端工程师: 传送门: https://openai.com/careers/mobile-engineering- ...

  4. 阿里官宣AI框架大牛贾扬清加盟,任职技术VP

    乾明 发自 凹非寺  量子位 报道 | 公众号 QbitAI 阿里巴巴再揽一员大将! 阿里巴巴宣布,贾扬清正式加盟,担任技术副总裁岗位,领导大数据计算平台的研发工作. 贾扬清,本科和硕士毕业于清华大学 ...

  5. 官宣|Apache Flink 1.16 发布公告

    作者|贺小令 Apache Flink 持续保持高速发展,是 Apache 最活跃的社区之一.Flink 1.16 共有 240 多个 Contributor 热情参与,共完成了 19 个 FLIP  ...

  6. 北大率先官宣朱松纯加盟,现身燕园,任职AI研究院院长,“AI发展离不开哲学思考”...

    贾浩楠 发自 凹非寺 量子位 报道 | 公众号 QbitAI 从UCLA回国的计算机视觉领域泰斗级学者--朱松纯教授,被北大率先公开官宣加入. 据北大新闻网9月24日消息,朱松纯教授受聘北京大学讲席教 ...

  7. 极客日报:达摩院实现全球最大AI预训练模型;苹果3nm芯片或将2023年问世;微软官宣加入JCP计划

    一分钟速览新闻点! 达摩院实现全球最大AI预训练模型 清华北大等18所高校设立集成电路博士授权点 购物平台推出"协助退订营销短信"功能 抖音内测"听视频模式": ...

  8. python富翁与陌生人编程_GitHub近10万星:印度小哥用Python和Java实现所有AI算法

    原标题:GitHub近10万星:印度小哥用Python和Java实现所有AI算法 又到了招聘季.疫情将我们圈在家里这么长时间,以至于都宅废了! AI的算法你还记得多少?他们都是如何用Python和Ja ...

  9. 互联网快讯:苹果iOS 15.2发布;极米2021双十二圆满收官;vivo S12系列正式官宣

    国内要闻 三聚环保.福州大学.紫金矿业联合打造国内首家"氨-氢能源重大产业创新平台": 微信支付上线"防骗客服提醒"功能,针对风险交易提供语音劝阻: 京东科技入 ...

最新文章

  1. php http_get_vars,$_GET($HTTP_GET_VARS)和$_POST($HTTP_POST_VARS)的区别
  2. vue代码转换成小程序
  3. 从玉农业智能蔬菜技术 农业大健康·林裕豪:中国金控斥资打造
  4. 京东宣布收购拇指阅读,具体金额未披露
  5. mesos_Linux Foundation提供了新的认证,Mesos进入了Google等等
  6. linux xwindow 权限,普通用户如何启动XWindow的问题
  7. Illustrator教程,如何在 Illustrator 中创建和应用图案?
  8. CUDA编成:从GPU的物理体系结构到逻辑结构
  9. iOS voip电话和sip软电话 --网络电话
  10. 在VMware虚拟机环境下为msdos7.1安装masm
  11. MySQL当前读和快照读
  12. 山西流传于百姓餐桌的宫府名菜——山西过油肉
  13. R语言字符串相关操作
  14. 微信可以显示你的足迹了,快试试
  15. java imageio 内存问题_java中的内存泄漏ImageIO.read()
  16. 用editplus删除csv文件中的软回车
  17. unity设置中文版
  18. 电子技术基础(三)__第2章放大电路原理__晶体三极管
  19. Linux——DHCP篇
  20. Liang的Rootkit习作-ZION

热门文章

  1. C++版数据结构继承关系图
  2. C++中数学运算、比较、赋值操作符的重载
  3. mysql 事务值被改变_面试被问MySQL 事务的实现原理,怎么破?
  4. 电路原理邱关源_看高手是如何学习电路原理的,有哪些捷径?
  5. 计算机if函数and,excel if_EXCEL函数IF()+()和IF(and)区别是什么?
  6. 中石油2018年秋季C语言 试卷答案,[石油华东]《数据采集系统》2018年秋季学期在线作业...
  7. 深入浅出让你理解什么是LLVM
  8. 如何在Spyder中运行spark
  9. linux libpath的作用,linux – LD_LIBRARY_PATH似乎不起作用
  10. python如何调用文件进行换位加密_python 换位密码算法的实例详解