最绚烂的火花,永远产生于森然秩序被打破,天才超然于规律之外的那一瞬间

卡内基梅隆大学博士生用54页PPT解密阿法狗的工作原理

在刚刚结束的“AlphaGo”与韩国围棋高手李世石之间的人机大战第五局中,李世石执黑负,无缘两连胜。至此,人机大战五番棋全部结束,李世石1-4输掉对决,无缘100万美元赢棋奖金。

为了让大家从另外一面了解AlphaGo,Computer Science排名第一的卡内基梅隆大学的博士研究生 Shane Moon(个人主页:http://shanemoon.com/)做了一次演讲,他就读于卡内基梅隆大学著名的语言技术研究所,纯干货讲稿PPT奉上。

AlphaGo是如何工作的

演讲人:Shane Moon

2015年10月,AlphaGo与欧洲围棋冠军樊麾二段对弈

2016年3月9日-15日,AlphaGo与世界冠军李世乭九段展开对弈

电脑围棋人工智能


电脑围棋人工智能:定义

我们可以把棋盘想象成一个矩阵


当给出s,电脑围棋运算出最优移动a,得到s'

电脑围棋人工智能:一个可行的概念?

假设它模拟所有可能的棋盘落子位置呢?

进行这样的模拟直到游戏结束,然后报告输赢结果


这是不可能的,据说所有可能的棋盘排布种类总数超过了宇宙中原子的数量

关键在于:缩减搜索空间

缩减搜索空间的第一种方法:减少可选择的着法(横向缩减)

从搜索出的着法候选中把这些提前剔除

缩减搜索空间的第二种方法:提前评估落子位置(纵向缩减)

假设这里有一个函数可以计算V,即s的盘面形势评估

缩减搜索空间的两种方式:减少可选择的着法(横向),提前评估落子位置(纵向)

减少可选择的着法

得到P(下一次落子|现在的位置)

减少可选择的着法:模仿专业高手的着法(在指导下学习)

建立棋盘的预测模型

将预测模型模拟为矩阵进行运算

这个深度学习过程要经过13层“CNN”

CNN即卷积神经网络,是一种强大的图像识别任务处理模型,它将输入的图像通过卷积层抽象化

它们利用卷积神经网络模型去评估对局形势

围棋:胜利的关键在于抽象能力

卷积神经网络:抽象是其特长

模仿专业高手着法的模型

减少可选择的着法:通过自我对弈来提高(巩固学习)

两个专业高手着法模仿模型进行对弈

输赢两种结局

更新模型,不断进行新旧模型之间的对弈,最后一个版本的模型和初始版本对弈已经有了八成赢面

盘面形势评估


使用两个模型:上文最新版本的模仿模型与价值预测模型(复盘)


缩减搜索空间:横向上减少可选择的着法(策略网络),纵向上进行盘面形势评估(价值网络)

前瞻:蒙特卡洛树形研究模型

结果:AlphaGo不同成分的组合所呈现的表现李世乭九段与AlphaGo的能量功耗对比

据估测,AlphaGo的水准在业余五段左右


将CPU/GPU资源运用到极致?

AlphaGo每天都学习数以百万计的对局

如果AlphaGo学习了李世乭的策略会怎样?谷歌表示他们不会将李世乭的比赛数据用于AlphaGo的训练数据,即使它真的学习了,仅仅与李世乭对弈几盘就修改在海量数据下训练过的模型也是很难的AlphaGo的弱点是什么?留待研究

原文发布时间为:2016-03-22

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

阿法狗是如何工作的?卡内基梅隆大学博士用54页PPT给你答案相关推荐

  1. 卡内基梅隆大学副教授张旆:传感系统新玩法,物理响应分析人的生老病死

    受访者 | 张旆 采访者 | 伍杏玲 出品 | CSDN(ID:CSDNnews) 随着万物相联时代来临,我们身边随处可见物联网技术:我们使用智能门锁进入房间,智能窗帘缓缓拉开,智能扫地机器人开始工作 ...

  2. Randy Pausch_卡内基梅隆大学演讲--真正实现你的梦想

    Randy Pausch_卡内基梅隆大学演讲--真正实现你的梦想 2007.9.18     星期二 Randy Pausch's Last Lecture: Really Achieving You ...

  3. 知乎:在卡内基梅隆大学 (Carnegie Mellon University) 就读是怎样一番体验?

    转自:http://www.zhihu.com/question/24295398 知乎 Yu Zhang 知乎搜索 首页 话题 发现 消息 调查类问题名校就读体验修改 在卡内基梅隆大学 (Carne ...

  4. 卡内基梅隆大学机器学习系副主任邢波:AI落地现在最缺的是思维方式

    来源:亿欧 摘要:邢波认为:人工智能现在最缺的不是算法和知识,而是落地应用的思维方式:数据如何被处理.系统如何被调试.资源如何配置,目前阶段还处于黑箱,很混沌的状态:人工智能未来会成为非常朴实的领域. ...

  5. 计算机专业申请计算生物学,卡内基梅隆大学计算生物学硕士专业

    卡内基梅隆大学计算生物学硕士专业为综合项目,助力于运用现代计算机科学.统计学.数学方法探索生物学与生物医学问题.卡内基梅隆大学计算生物学硕士专业面向想要直接到产业部门工作,或想要探索计算生物学但不想继 ...

  6. 卡内基·梅隆大学计算机科学系主任周以真的父母是中国人吗,一篇是王飞跃等人翻译的美国卡内基梅隆大学计算机科学系主任.PPT...

    一篇是王飞跃等人翻译的美国卡内基梅隆大学计算机科学系主任 * * 信息论的内涵与外延 1.狭义信息论: 又称香农信息论.主要通过数学描述与定量分析,研究通信系统从信源到信宿的全过程,包括信息的测度.信 ...

  7. 卡内基·梅隆大学新提出AdaScale:自适应缩放实现视频对象实时检测算法

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 对机器人和自动驾驶汽车等很多应用而言,视频目标检测都是很重要的.但在使用 CNN 执行这一任务时,速度与准确度往往不 ...

  8. 卡内基梅隆大学梁俊卫:视频中行人的多种未来轨迹预测

    不到现场,照样看最干货的学术报告! 嗨,大家好.这里是学术报告专栏,读芯术小编不定期挑选并亲自跑会,为大家奉献科技领域最优秀的学术报告,为同学们记录报告干货,并想方设法搞到一手的PPT和现场视频--足 ...

  9. 卡内基梅隆大学最新研究——使用“耳朵”,而不仅仅是“眼睛”,来提高机器人的感知能力

    机器人用听觉感知物体 虽然人类依靠多种感觉来理解世界,但机器人通常只依靠视觉或触觉.卡内基梅隆大学的研究人员发现,通过增加另一种感觉:听觉,机器人的感知能力可以显著提高. CMU机器人研究所的研究人员 ...

最新文章

  1. 比用Pytorch框架快200倍!0.76秒后,笔记本上的CNN就搞定了MNIST | 开源
  2. linux 有空格的文件夹,Linux之删除带有空格的文件
  3. 几种网络负载均衡方法比较
  4. 区块链BaaS云服务(10)用友iuap区块链平台
  5. 向日葵在mac不能以服务器运行吗,mac远程桌面连接在哪?向日葵可以实现mac远程连接吗?...
  6. 2.2数据通信的基础知识
  7. Javaweb乱码解决
  8. 数据库备份的几种方法
  9. nvcc fatal : '--ptxas-options=-v': expected a number
  10. PHP接口设置10分钟失效
  11. python 生信分析_提速Python!无论生信分析还是数据分析
  12. sublime text 3211 安装中文包
  13. 有赞会不会成为去中心化流量时代的淘宝
  14. cesium雷达图_cesium添加闪烁点,雷达图(一般用于预警)
  15. 集成/信息系统项目管理师学习笔记共享 (1)
  16. 计算机打印机共享失败,打印机共享失败终极解决办法
  17. JVM源码分析之Metaspace解密
  18. html遍历map,forEach()方法遍历map()方法数组遍历
  19. 飞速创软 | 带你深入了解Iass、Pass、Sass三种云服务的区别
  20. 最新的工资薪金所得适用税率表(工资薪金所得适用)

热门文章

  1. PDF在线压缩怎么操作?这里有你不知道的方法
  2. Cocos2dx学习笔记(三)背景、文字
  3. vue中是否有像小程序中的block标签?就是template
  4. python3堆栈_避免python3中的堆栈溢出
  5. 华为EC1260-通话短信 http://majszt.blog.hexun.com/33967361_d.html
  6. 《SDN软件定义网络从入门到精通》导论课
  7. Models Genesis: Generic Autodidactic Models for 3D Medical Image Analysis精读
  8. Petersen黎曼几何习题解答
  9. 微软服务器故障,微软解释Windows Azure故障原因
  10. java毕业设计公益组织登记与查询系统mybatis+源码+调试部署+系统+数据库+lw