白交 发自 凹非寺
量子位 报道 | 公众号 QbitAI

深度学习在计算上受到限制并不是一件「新鲜事」。

只是在过去十年里面,这种计算限制被「淡化」了。人们专注于「算法」优化和「硬件」性能的提升,以及愿意投入更高的「成本」来获得更好的性能。

性价比这件事,从来没被严肃以待。

但是现在,深度学习的计算需求越来越大,这些所谓的「方法」开始变得无济于事了。

最近,MIT计算机科学与人工智能实验室的研究科学家Neil Thompson发表了最新研究,主题旗帜鲜明:「Computational Limits of Deep Learning」。

46页研究千余篇论文告诉你,深度学习的算力局限在哪里。

从设置的生成模型中发现理论上的算力局限。

首先,来看看理论上的算力局限。

他们设置了一个生成模型,在可能的1000个参数中,有10个非零参数,并考虑4个模型来尝试发现这些参数。

Oracle model:在模型中有完全正确的10个参数。

Expert model:模型中恰好有9个正确参数和1个错误参数。

Flexible model:拥有模型中所有1000个潜在参数,并使用「最小二乘估计」。

Regularized model:跟「Flexible model」一样,它拥有模型中所有参数,但是是在正则化模型中。

于是,就得出了这样的结果——模型复杂度与正则化对模型性能和对计算要求的影响。

其中模型性能,是以与最佳预测器相比预测的归一化平均平方误差的负对数(以10为底)。

可以看到,随着样本量的增加,Oracle model跟Expert model一开始表现出更好的性能,而Flexible model和Regularized model这两个模型后进之势十分猛烈。

而与之相应的「计算要求」,Flexible model和Regularized model跟前两个压根就不是一个量级的。

这恰好印证了吴恩达的一个观点:

当数据量小的时候,传统的机器学习技术做得更好,但灵活的深度学习模型在数据量更大的情况下做得更好 。

那么这篇论文将这一见解推向了更加广泛的结论:

灵活的深度学习模型有更大的潜力,但也有更大的数据和计算要求。

1058篇论文看到实际中的算力需求

直接上图。

可以看到,所有的深度学习模型的实际算力需求,在近几年里,远远高于「硬件性能」提升中需要的计算能力。

为了研究深度学习对计算的依赖性,团队研究了1058篇研究论文。

涵盖了图像分类(ImageNet基准)、对象检测(MS COCO)、问题回答(SQuAD 1.1)、命名实体识别(COLLN 2003)和机器翻译(WMT 2014 En-to-Fr)等领域。

图像分类为例。

ImageNet为基准,显示了ImageNet数据集上图像识别错误率的下降及其与这些模型的计算要求的相关性。

除此之外,在问题回答、命名实体识别、机器翻译等领域也表现出了对计算能力的依赖性。

除了机器翻译(英语到德语),使用的计算能力的变化很小。其他的模型的依赖性都很强,其中问题回答的依赖性达到了7.7。

总的来说,在深度学习的许多领域中,训练模型的进展都依赖于计算能力的大量增加。

但随之而来的,就是「高昂的研究成本」

MIT助理教授,清华大学校友韩松,就曾说过:

深度神经学习网络在计算上非常昂贵,这是一个关键的问题。

今年一月,Facebook的AI副总裁Jerome Pesenti在接受《连线》采访时,就表示,该领域很快就会「碰壁」

AI科研成本的持续上涨,或导致我们在该领域的研究碰壁,现在已经到了一个需要从成本效益等方面考虑的地步,我们需要清楚如何从现有的计算力中获得最大的收益。

现在,用千余篇论文研究再次证实了这一结论。

那么对于现在的机器翻译、自动驾驶等项目需要重新考虑一下,「如何实现以最低的成本实现收益最大化」。

换而言之,作为商业模型来落地的AI翻译和自动驾驶项目,是时候要用「性价比」来重估了。

你觉得呢?

论文地址:http://www.neil-t.com/moores-law-and-computer-performance/

参考链接:https://www.wired.com/story/prepare-artificial-intelligence-produce-less-wizardry/

—完—

@量子位 · 追踪AI技术和产品新动态

深有感触的朋友,欢迎赞同、关注、分享三连վ'ᴗ' ի ❤

发布于 07-21

MIT长篇论文:我们热捧的AI翻译和自动驾驶,需用技术性价比重估相关推荐

  1. MIT长篇论文:我们热捧的AI翻译和自动驾驶,需要用技术性价比来重估

    点击上方"视学算法",选择加"星标" 重磅干货,第一时间送达 白交 发自 凹非寺  本文转载自:量子位(QbitAI) 深度学习在计算上受到限制并不是一件「新鲜 ...

  2. AI公开课:19.03.20吴甘沙-驭势科技联合创始人《AI时代的自动驾驶趋势》课堂笔记以及个人感悟

    AI公开课:19.03.20吴甘沙-驭势科技联合创始人<AI时代的自动驾驶趋势>课堂笔记以及个人感悟 导读       为什么要大大小小的公司都要做无人驾驶?因为它真的是一个很大的舞台,具 ...

  3. 可能是最全的|适合决策AI研究的自动驾驶模拟器评测(下篇)

    原创不易,大家多多鼓励呦,OpenDILab继续出精品.错过上次评测推送的,可戳如下链接. 可能是最全的 | 适合决策AI研究的自动驾驶模拟器评测(上篇)_m0_55289267的博客-CSDN博客本 ...

  4. 一周AI创业:MIT博士领衔星药科技获新融资,自动驾驶再掀资本狂潮

    智源社区 AI 创业周报关注早期有潜在影响力的AI创业团队,挖掘新的场景和技术应用范式,同时希望通过采访和其他信息聚合的方式搜集创业观点,为AI创业者提供更有价值的行业洞察. 本周获得融资的AI创业团 ...

  5. 北大AI公开课2019 | 驭势科技吴甘沙:AI时代的自动驾驶趋势

    在努力的拓展技术和应用对外的边界,尽快的把技术发展到为人类所用的过程中,有很多的技术的挑战,自动驾驶行业尤其如此.自动驾驶技术发展至今也取得了很多进展,3月20日北大AI公开课第五讲,请到了驭势科技创 ...

  6. 当AI对话系统像自动驾驶一样分级,谁能率先跑出L5?

    当智能音箱中的"小爱"."小度"回应你时,它是否理解你说的意思?如何判断人工智能助手是否聪明.好用?这些声音背后究竟是什么技术在支撑? 1950年,英国计算机科 ...

  7. 每天2亿美元投入AI领域,1/10砸向自动驾驶,中国AI论文首超全欧洲 | 斯坦福全球AI年度报告...

    边策 十三 发自 凹非寺  量子位 报道 | 公众号 QbitAI 全球AI遇冷了吗?不存在的.中国AI发展怎么样?论文总数更上一层楼. 这就是一年一度权威报告<斯坦福2019全球AI报告> ...

  8. MIT中国博士生开发出第一套保护自动驾驶车辆的感知算法

    作者 | 陈彩娴 来源:AI科技评论 自动驾驶的落地,离不开一个关键条件:安全. 近日,清华大学校友.MIT 在读的中国博士生杨珩与团队合作开发了第一套针对自动驾驶汽车的"可认证的感知&qu ...

  9. 报告 | 斯坦福2019 AI年度报告出炉!700亿美元投入AI,自动驾驶融资最多

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 编辑:Sophia 计算机视觉联盟  报道  | 公众号 CVLianMeng 转载于 :https://hai.s ...

最新文章

  1. 代替国足踢决赛?马宁当选卡日大战第四官员
  2. 如何使用Transformer来做物体检测?
  3. 伯克利的电气工程和计算机科学专业,2021年加州大学伯克利分校电气工程与计算机科学专业入学要求高吗?...
  4. .net 导出excel_java导出excel(easypoi)
  5. 使用dotnet-dump 查找 .net core 3.0 占用CPU 100%的原因
  6. 几个极品笑话,放松下心情
  7. Leaflet中使用Leaflet.Pin插件实现图层要素编辑效果
  8. [ECMAScript] 举例说明你对es6的class的理解
  9. Python - python不是内部或外部命令
  10. Oracle 10.2.0.1.0升级到 10.2.0.4.0
  11. CAN笔记(2) CAN特点
  12. 笔记 编写可读性代码的艺术
  13. render vue 添加类_详解vue 动态加载并注册组件且通过 render动态创建该组件
  14. Atitit json array to csv 目录 1. Lib 1 1.1. Apache csv lib 1 1.2. Org.json.jar cdl模式 1 2. other 1 2
  15. 物理常量/真空电容率/引力常量/真空磁导率/斯特潘-玻尔兹曼常量
  16. [GOM引擎]假人配置的脚本设置方法
  17. 玩转WIN7的MKLINK
  18. 穷人的语义处理工具箱之二:语义编辑距离
  19. 数组里的字符串转换成数字或者把数字转换成字符串
  20. 深入浅出学算法008-韩信点兵

热门文章

  1. 五连阳回调买入法_只要出现“4连阳+1阴”形态,坚定满仓干进去,百分百是主升浪...
  2. [ ]是数组结构 ndarray区分list列表结构 的理解,
  3. eclipse 源码设置UTF-8 (eclipse可以为JSP HTML 等各种文件不同编码格式设置) 在windows - preference- general-workspace
  4. QT安装由问题的,安装后发现有些控件标签名显示不了
  5. 告别2010-正则表达式
  6. django html菜单,django实现动态菜单的方式
  7. ip的正则表达式 java,项目实战:Java正则表达式验证IP地址
  8. mysql删除表中的唯一索引吗_Mysql 使用sql删除同表中重复数据并加唯一索引
  9. Docker系列 五.Docker容器数据卷
  10. Yann LeCun:发现智能原理是AI的终极问题 | 独家对话