报名 | AlphaGo Zero是如何实现无师自通的?
「论文共读」是由 PaperWeekly 发起的协同阅读小组。我们每周精选一篇优质好文,由学术大咖带大家解读论文并展开讨论,在碎片化时代坚持深度阅读。
Google DeepMind 团队在 Nature 上发表的最新论文,阐述了新版 AlphaGo 是如何从空白状态学起,不使用任何人类棋谱,通过自对弈强化学习,仅用 3 天训练时间就以 100:0 击败了上一版本的 AlphaGo,并用 21 天达到 AlphaGo Master 水平。
AlphaGo Zero 的核心在于强化学习下的自我博弈。本期论文共读,我们邀请到 深入浅出看懂AlphaGo Zero 一文的作者,圣何塞州立大学研究生刘遥行,带大家揭秘 AlphaGo 的前世今生。
论文介绍
Mastering the Game of Go without Human Knowledge
@PaperWeekly 推荐
#Deep Reinforcement Learning
DeepMind 最新成果,无师自通下围棋。
论文链接
http://www.paperweekly.site/papers/942
嘉宾介绍
刘遥行,圣何塞州立大学研究生,幕布(mubu.com)实习生,关注人工智能和现实生活的工业结合、人工智能和区块链技术的联合应用。
论文共读
AlphaGo Zero是如何实现无师自通的?
AlphaGo Zero
论文解读√在线讨论√
活动形式:语音直播
活动时间
10 月 29 日(周日)13:00-14:15
45 min 串讲 + 30 min 讨论
*请在活动开始前完成论文精读
长按识别二维码,马上报名
*报名成功后,关注系统弹出的公众号获取活动提醒
往期回顾
“阳奉阴违”的半监督学习算法 - Virtual Adversarial Training
关于PaperWeekly
PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。
▽ 点击 | 阅读原文 | 进行报名
报名 | AlphaGo Zero是如何实现无师自通的?相关推荐
- 直播实录 | AlphaGo Zero是如何实现无师自通的?
本文为 10 月 29 日,圣何塞州立大学--刘遥行的论文共读直播分享实录. Google DeepMind 团队在 Nature 上发表的最新论文,阐述了新版 AlphaGo 是如何从空白状态学起, ...
- AlphaGo Zero「无师自通」背后的伟大与局限 | 旷视孙剑解读
整理 | 安木 当你被 AlphaGo Zero 刷屏的时候,你是对人类的创造力产生自豪,还是对人类的未来感到担忧? 10 月 20 日,旷视科技(Face++)首席科学家孙剑博士接受了多家媒体的群访 ...
- 报名 | IBM苏中:从深蓝到AlphaGo,从大数据到认知商业
数量大.速度快.多样性.不确定性等特点,给大数据的采集.存储.管理和分析都带来许多挑战.如何将纷繁数据化繁为简,实现类似人脑的认知与判断,发现新的关联和模式,从而做出正确的决策,就显得尤为重要.伴随着 ...
- 无师自通!AlphaGo Zero是怎么练成超越人类?
Deepmind 最近发布了最新的论文公布了 AlphaGo 在算法方面的进展,以及扩展到其他领域的近用性.网络上对此讨论热度极高!这次 AlphaGo 负责人同时也是 Deepmind 深度学习组负 ...
- 那个大战AlphaGo的柯洁,将免试入读清华大学工商管理专业
日前,柯洁将免试入读清华大学的消息经媒体曝光了出来. <2019 年优秀运动员免试入学推荐名单>3 月 10 日开始公示,围棋世界冠军柯洁的名字出现在名单上,其中表明他将就读清华大学工商管 ...
- 公开课报名 | 深入浅出理解A3C强化学习
强化学习是一种比较传统的人工智能手段,在近年来随着深度学习的发展,强化学习和深度学习逐渐结合在了一起.这种结合使得很多原来无法想象的工作有了可能,最令我们瞩目的莫过于AlphaGo战胜李世石,以及Op ...
- 浙大吴飞教授:尽管AlphaGo Zero已强大到从经验中学习模型,我也绝不赞同马斯克和霍金的威胁论,人才是智能的最终主宰
记者 | 鸽子 在整个采访过程中,吴飞教授在回答中给人的最大感受是温和.儒雅.他没有激烈的言辞,也没有犀利的观点,不会一开始直接抛出自己的判断,而是将所有的提问,看作是一次学术上的严谨探讨,从问题本身 ...
- 刚刚,DeepMind被IJCAI授予杰出成就奖,因为他家把AlphaGo Zero做成了暖心的新垣结衣?
啥都别说,先看图好不好 首先,恭喜DeepMind荣获大奖. 其次,获奖评语中,一定不会少的是对他家新品AlphaGo Zero的大加赞叹. 这货3天走完人类的千年棋史,这样的影响力,柯洁也坐不住了: ...
- 活动报名 | 因果科学与Casual AI读书会
2020年的北京智源大会特别邀请到图灵奖得主.贝叶斯网络奠基人Judea Pearl教授发表演讲,把数据科学和人工智能领域的因果革命推上前台.为了促进学术交流,梳理因果科学体系结构,智源社区特别联合集 ...
最新文章
- 用Jsp来实现文件下载功能的几种方式
- 【Windows】字符串处理
- linux系统结构,文件寻址,文件管理编辑,正则表达式
- powerbi visualization
- SpringMVC中@RequestParam(username)
- PHP header的一些用法
- docker查看容器并运行
- 【Python 脚本报错】AttributeError: 'module 'yyy' has no attribute 'xxx'的解决方法
- redis源码剖析(3):基础数据结构dict
- uniapp Android离线打包Activity class {com.xxx.yyy/io.dcloud.PandoraEntry} does not exist.
- iis6安装PHPManager和URL Rewrite
- 宁波市建筑物矢量数据(Shp格式+带高度)
- dos固态硬盘测试软件,dos下的硬盘检测工具MHDD图文教程!
- STM32——电容触摸按键
- ENVI 5.3 计算NDVI的几种方法及结果的差异分析
- 热门算法总结 —— DPCA
- 分享一个自媒体副业,认真做可以月入6000+
- python的tell和seek_4.2Python文件基本操作2:tell、seek
- 美国计算机科学专业学校排名,美国计算机科学专业排名
- 《微机原理及应用》 试题
热门文章
- jmeter接口测试多数据组合登陆场景
- HTML 学习笔记3
- oracle sql 数据库之间导入数据
- 栈的应用-四则运算表达式
- ElasticSearch安装拼音插件(pinyin)
- ASP.NET AJAX深入浅出系列课程
- 动态让控件超出屏幕_JAVA浏览器控件JxBrowser v7.5上线!更轻松处理Dynamic Favicons...
- java招投标网站源码_基于jsp的招标系统-JavaEE实现招标系统 - java项目源码
- java class 是否相等_Java重要技术(30)类加载器之Class类型的相等比较
- oracle 父latch:library cache,library cache latch等待事件