「论文共读」是由 PaperWeekly 发起的协同阅读小组。我们每周精选一篇优质好文,由学术大咖带大家解读论文并展开讨论,在碎片化时代坚持深度阅读。

Google DeepMind 团队在 Nature 上发表的最新论文,阐述了新版 AlphaGo 是如何从空白状态学起,不使用任何人类棋谱,通过自对弈强化学习,仅用 3 天训练时间就以 100:0 击败了上一版本的 AlphaGo,并用 21 天达到 AlphaGo Master 水平。

AlphaGo Zero 的核心在于强化学习下的自我博弈。本期论文共读,我们邀请到 深入浅出看懂AlphaGo Zero 一文的作者,圣何塞州立大学研究生刘遥行,带大家揭秘 AlphaGo 的前世今生。

论文介绍

Mastering the Game of Go without Human Knowledge

@PaperWeekly 推荐

#Deep Reinforcement Learning

DeepMind 最新成果,无师自通下围棋。

论文链接

http://www.paperweekly.site/papers/942

嘉宾介绍

刘遥行,圣何塞州立大学研究生,幕布(mubu.com)实习生,关注人工智能和现实生活的工业结合、人工智能和区块链技术的联合应用。

论文共读

 AlphaGo Zero是如何实现无师自通的?

AlphaGo Zero

论文解读√在线讨论√

活动形式:语音直播

 活动时间 

10 月 29 日(周日)13:00-14:15

45 min 串讲 + 30 min 讨论

*请在活动开始前完成论文精读

长按识别二维码,马上报名

*报名成功后,关注系统弹出的公众号获取活动提醒


往期回顾

“阳奉阴违”的半监督学习算法 - Virtual Adversarial Training

关于PaperWeekly


PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。

▽ 点击 | 阅读原文 | 进行报名

报名 | AlphaGo Zero是如何实现无师自通的?相关推荐

  1. 直播实录 | AlphaGo Zero是如何实现无师自通的?

    本文为 10 月 29 日,圣何塞州立大学--刘遥行的论文共读直播分享实录. Google DeepMind 团队在 Nature 上发表的最新论文,阐述了新版 AlphaGo 是如何从空白状态学起, ...

  2. AlphaGo Zero「无师自通」背后的伟大与局限 | 旷视孙剑解读

    整理 | 安木 当你被 AlphaGo Zero 刷屏的时候,你是对人类的创造力产生自豪,还是对人类的未来感到担忧? 10 月 20 日,旷视科技(Face++)首席科学家孙剑博士接受了多家媒体的群访 ...

  3. 报名 | IBM苏中:从深蓝到AlphaGo,从大数据到认知商业

    数量大.速度快.多样性.不确定性等特点,给大数据的采集.存储.管理和分析都带来许多挑战.如何将纷繁数据化繁为简,实现类似人脑的认知与判断,发现新的关联和模式,从而做出正确的决策,就显得尤为重要.伴随着 ...

  4. 无师自通!AlphaGo Zero是怎么练成超越人类?

    Deepmind 最近发布了最新的论文公布了 AlphaGo 在算法方面的进展,以及扩展到其他领域的近用性.网络上对此讨论热度极高!这次 AlphaGo 负责人同时也是 Deepmind 深度学习组负 ...

  5. 那个大战AlphaGo的柯洁,将免试入读清华大学工商管理专业

    日前,柯洁将免试入读清华大学的消息经媒体曝光了出来. <2019 年优秀运动员免试入学推荐名单>3 月 10 日开始公示,围棋世界冠军柯洁的名字出现在名单上,其中表明他将就读清华大学工商管 ...

  6. 公开课报名 | 深入浅出理解A3C强化学习

    强化学习是一种比较传统的人工智能手段,在近年来随着深度学习的发展,强化学习和深度学习逐渐结合在了一起.这种结合使得很多原来无法想象的工作有了可能,最令我们瞩目的莫过于AlphaGo战胜李世石,以及Op ...

  7. 浙大吴飞教授:尽管AlphaGo Zero已强大到从经验中学习模型,我也绝不赞同马斯克和霍金的威胁论,人才是智能的最终主宰

    记者 | 鸽子 在整个采访过程中,吴飞教授在回答中给人的最大感受是温和.儒雅.他没有激烈的言辞,也没有犀利的观点,不会一开始直接抛出自己的判断,而是将所有的提问,看作是一次学术上的严谨探讨,从问题本身 ...

  8. 刚刚,DeepMind被IJCAI授予杰出成就奖,因为他家把AlphaGo Zero做成了暖心的新垣结衣?

    啥都别说,先看图好不好 首先,恭喜DeepMind荣获大奖. 其次,获奖评语中,一定不会少的是对他家新品AlphaGo Zero的大加赞叹. 这货3天走完人类的千年棋史,这样的影响力,柯洁也坐不住了: ...

  9. 活动报名 | 因果科学与Casual AI读书会

    2020年的北京智源大会特别邀请到图灵奖得主.贝叶斯网络奠基人Judea Pearl教授发表演讲,把数据科学和人工智能领域的因果革命推上前台.为了促进学术交流,梳理因果科学体系结构,智源社区特别联合集 ...

最新文章

  1. 用Jsp来实现文件下载功能的几种方式
  2. 【Windows】字符串处理
  3. linux系统结构,文件寻址,文件管理编辑,正则表达式
  4. powerbi visualization
  5. SpringMVC中@RequestParam(username)
  6. PHP header的一些用法
  7. docker查看容器并运行
  8. 【Python 脚本报错】AttributeError: 'module 'yyy' has no attribute 'xxx'的解决方法
  9. redis源码剖析(3):基础数据结构dict
  10. uniapp Android离线打包Activity class {com.xxx.yyy/io.dcloud.PandoraEntry} does not exist.
  11. iis6安装PHPManager和URL Rewrite
  12. 宁波市建筑物矢量数据(Shp格式+带高度)
  13. dos固态硬盘测试软件,dos下的硬盘检测工具MHDD图文教程!
  14. STM32——电容触摸按键
  15. ENVI 5.3 计算NDVI的几种方法及结果的差异分析
  16. 热门算法总结 —— DPCA
  17. 分享一个自媒体副业,认真做可以月入6000+
  18. python的tell和seek_4.2Python文件基本操作2:tell、seek
  19. 美国计算机科学专业学校排名,美国计算机科学专业排名
  20. 《微机原理及应用》 试题

热门文章

  1. jmeter接口测试多数据组合登陆场景
  2. HTML 学习笔记3
  3. oracle sql 数据库之间导入数据
  4. 栈的应用-四则运算表达式
  5. ElasticSearch安装拼音插件(pinyin)
  6. ASP.NET AJAX深入浅出系列课程
  7. 动态让控件超出屏幕_JAVA浏览器控件JxBrowser v7.5上线!更轻松处理Dynamic Favicons...
  8. java招投标网站源码_基于jsp的招标系统-JavaEE实现招标系统 - java项目源码
  9. java class 是否相等_Java重要技术(30)类加载器之Class类型的相等比较
  10. oracle 父latch:library cache,library cache latch等待事件