当年,19岁的世界围棋第一人柯洁九段在和AlphaGo的围棋终极人机大战以0:3完败,这也是人类顶尖高手与这台机器之间的最后一次较量,AlphaGo从此将退隐江湖。

比赛至中局之时,柯洁再次被AlphaGo的手法惊到了。他先是取下眼镜捂住自己的脸,继而在桌子上趴了几秒钟,起身摇头,再次趴下,然后才用手把头撑起,双手抹了抹眼睛,又重新戴上眼镜。

韩国高手李世石也面对过AlphaGo,曾在三连败的情况下扳回一局,连输两场的柯洁自然也希望能在最后一句中挽回颜面,很可惜这次柯洁全面落于下风。

2017年,机器学习领域最令人兴奋的事件之一,莫过于 AlphaGo 战胜李世石成为世界上最好的围棋选手了。

同年10月份,DeepMind 发表了一篇论文,描述了一个名为 AlphaGo Zero 的新版本。仅仅经过36个小时的训练,AlphaGo Zero已经比击败李世石的阿尔法狗更擅长围棋了。

不仅如此,AlphaGo Zero 学会下围棋,却是在没有任何先验的游戏知识的情况下(换句话说,就是白板)

而相比之下,之前发布的 AlphaGo 则是在人类围棋比赛数据库的帮助下进行训练的。

这一成就确实非同寻常,因为它表明,我们可以开发一个系统,教会自己从一张白纸上做一些不琐碎的任务,并最终在完成任务方面比人类做得更好。

它同时也表明了,现在整个世界的可能性是触手可及的,只要想象计算机可以教自己做任何人类可以做的事情。

但是取得这样的进步却并不便宜。

正如人类掌握围棋需要多年的训练一样,计算机掌握围棋也需要大量的资源,复现 AlphaGo Zero 的论文中报道的实验需要花费3500万美元的算力。

AlphaGo Zero 学习下围棋的方法是通过一种被称为「self-play」的过程,模拟围棋对它自己的比赛。该论文报告了以下几点:

1.在72个小时里,共进行了490万场比赛

2. 在自我游戏过程中,每个动作大约占用0.4秒的时间

3.在一台机器上执行自我游戏,该机器包含4个 TPU

不过,这里有一个数字没有被公布出来,就是在三天的过程中使用的进行自我游戏的机器的数量。按照平均每场围棋211步的估计值,得到了最终的1595台自动对战机器的结果,或者说6380个 TPU。

按照每个TPU每小时6.50美元的报价(截至2018年3月) ,仅仅进行复现就要花费2,986,822美元。

而这只是他们论文中的两个实验中的一个小实验:

「随后,我们使用一个更大的神经网络,将我们的强化学习管道应用于 AlphaGo Zero 的第二个实例,并且持续时间更长。训练再次从完全随机的行为开始,持续了大约40天」

「在训练过程中,产生了2900万场自我比赛」

在为期40天的这项实验中,使用的神经网络的层数(大小相同)是为期3天的实验中使用的网络的两倍,因此,假设实验没有其他任何改变,一个动作所需的计算机思考时间大约是之前的两倍。

考虑到这一点,可以大概求出最终花费了35,354,222美元的TPU来复现这个为期40天的实验。

就 DeepMind 运行这项实验的实际成本而言,还有其它因素需要考虑,比如研究人员的薪水等。但是对于谷歌以外的人来说,这个数字对于重复这个实验的成本是一个很好的估计。

另一种看待 AlphaGo Zero 实验成本的方式是想象需要多少人的大脑来提供同样数量的能量。

图:当机器接管后,他们将更有效地使用我们的大脑

一个TPU消耗大约40瓦,人脑大约是20瓦。所以,这个实验的耗电量相当于12760个人的大脑连续运转。

这种耗电量和金钱的消耗并不是说AlphaGo Zero不是一个惊人的成就,它向世界展示了建立系统来自学完成复杂任务是可能的,只是开发这种通用技术还没有提供给大众而已。

也就是说,许多具有现实价值的问题并不需要超人一般的表现。也许,通过应用领域知识和 AlphaGo Zero 提供的技术,未来这些问题可以用比创建 AlphaGo Zero 便宜得多的成本得到解决。

参考链接:

https://www.yuzeh.com/data/agz-cost.html

让柯洁痛哭的AlphaGo,竟耗资3500万美元,耗电量相当于12760个大脑相关推荐

  1. 获3500万美元A轮融资,滴普科技用数字智能加速企业升级

    2019年9月24日,滴普科技DEEPEXI 2.0 新品发布暨A轮融资战略发布会在北京隆重召开,发布会以"聚合数字.链接智慧"为主题,由甲子光年创始人张一甲担任主持人,与来自晨兴 ...

  2. Docker出售企业业务后获得3500万美元融资并迎来新CEO

    对于Docker来说,这无疑是个有趣的时间节点.该公司刚刚宣布从Benchmark Capital与Insight Partners两家资方处获得3500万美元投资,同时表示已经任命原首席产品官Sco ...

  3. 这个年均开销3500万美元的 FBI 机密部门,将结合面部识别与大数据技术来调查案件...

    撰者 | Thomas Brewster 译者 | Katie,责编 | Jerry 来源 | CSDN云计算 FBI+面部识别+大数据,瞄准恐怖犯罪事件 在发生大规模枪击或恐怖袭击后,调查人员可能会 ...

  4. 曾经爆火的匿名社交应用Secret宣布关门大吉,3500万美元打水漂

    匿名社交曾经是2014年最热的创业方向之一,而今天,始作俑者Secret的创始人David Byttow却宣布已经决定关闭公司,将融资所剩的钱(原话是a significant amount)返还给投 ...

  5. 凭什么美柚又融了3500万美刀?

    文/娄老师 娄老师是传统IT媒体人出身,所以身边很多手机PC行业的朋友,他们最近最喜欢聊的一个话题就是,年轻人越来越不务实了,总是渴望几年内发家致富赢取白富美走向人生的巅峰,接下来就是忆苦思甜环节,讲 ...

  6. 输了!柯洁首战告负AlphaGo,哈萨比斯:这不是人机大战

    本文来自AI新媒体量子位(QbitAI) 19岁的柯洁输了. 围棋人机大战2.0版的第一场,双方交锋至第286手棋,执黑的柯洁以约四分之一子的微弱劣势,败给围棋人工智能程序AlphaGo. 全程记录 ...

  7. 最终一战柯洁再负AlphaGo,此后再无围棋人机大战

    本文来自AI新媒体量子位(QbitAI) 5月27日,人机大战第三场,天气晴朗. 经过209手的博弈,主动要求执白的柯洁再次负于AlphaGo.在这场人机大战中,世界围棋第一人0:3完败于围棋人工智能 ...

  8. 【CSDN AI周刊】第22期 柯洁对战AlphaGo 微软小冰出诗集 百度是AI公司

    欢迎人工智能相关的技术投稿.约稿.行业分析.热点新闻.编译等,请发送邮件至baiyan@csdn.net,期待大家投稿 人机对决 李开复预测AlphaGo对战柯洁:人类胜率几乎为零 日前谷歌联合中国棋 ...

  9. 过分了!耗资 5600 万、4 年开发的网络商城成“烂尾楼”,404 无法打开

    整理 | 伍杏玲 出品 | 程序人生(ID:coder_life) 有句话叫"南义乌.北临沂",小商品批发商场除了有南方的义乌外,北方的临沂也是重要的商场.为了推动线上线下市场融合 ...

最新文章

  1. java地铁线路规划_地铁线路规划——简单分析
  2. ArcGIS10新功能之制作地图集
  3. Java学习笔记27
  4. C语言scanf()函数格式化输入和printf()格式化输出。
  5. Java程序员之完美代码
  6. adapter 适配器
  7. 关于eclipse环境启动不成功的问题解决方法
  8. python做的数据图表怎么在flask中显示_Python:如何在Flask应用程序的表中显示MySQL查询的数据...
  9. jQuery动态加载select下拉列表
  10. 智能指针(一):STL auto_ptr实现原理
  11. centos7搭建ELK Cluster集群日志分析平台(四):Fliebeat-简单测试
  12. 在flex4中使用asdoc生成api文档
  13. Android Multimedia框架总结(八)Stagefright框架之AwesomePlayer及数据解析器
  14. 探秘综合布线产品质保问题
  15. iOS 录音踩坑之旅
  16. mysql 3306端口入侵_3306端口入侵流程
  17. Oracle in 不能超过1000的解决方案
  18. win8应用开发——动态磁贴
  19. 宝塔 php守护 1.2,宝塔面板的Supervisor (进程管理利器) 使用说明 – 附Nginx守护教程...
  20. 历史上最有名的五句农民起义军口号

热门文章

  1. TPS和事务响应时间的关系、计算公式
  2. c语言字符怎么运算,c语言运算符号(c语言如何输入运算符号)
  3. 如何初始化一个指针数组
  4. C/C++数组初始化
  5. 卫星位置计算小程序(C#版)
  6. 操作系统课程设计--简单文件系统的实现
  7. Conflict with dependency com.android.support-annotations' in project':app'.Resolved ...解决方法
  8. C++:实现量化Libor市场模型测试实例
  9. 高手勿进!写给初中级程序员以及还在大学修炼的“准程序员”的成长秘籍
  10. OpenCV笔记02:用cv2.imread函数读取图片