近日,2019 年 ACM 计算奖颁出,由于在计算机游戏领域取得突破性进展,“AlphaGo 之父”、DeepMind 首席科学家、伦敦大学学院教授 David Silver 获得最新一届的 ACM 计算奖

David Silver 是深度学习领域的先驱人物,他在人工智能领域的一系列成绩中,又以带领打造了 AlphaGo 最为人所知:David Silver 通过巧妙地结合深度学习、强化学习、蒙特卡洛搜索树和大规模计算的思想,开发了 AlphaGo 算法,AlphaGo 战胜了顶尖的人类棋手,更是被公为人工智能(AI)研究的一个里程碑。

(来源:ACM)

根据 ACM 官方报道,最初,AlphaGo 会经过来自人类专业棋手经验的小范围训练,然后,它会通过强化学习来不断改善性能。AlphaGo 之后, David Silver 和他的团队创造了更新颖的方法,来实现更高的性能和通用性,AlphaZero 就此诞生。与 AlphaGo 不同,AlphaZero 完全通过与自己玩游戏来进行学习,不需要任何人类数据或先验知识(游戏规则除外)。而且,AlphaZero 同时在国际象棋、将棋和围棋游戏中有超过人类的表现,证明了其 AI 算法的通用性。

早在 David Silver 于艾伯塔大学(University of Alberta)攻读博士学位时,他就开始探索开发一种可以掌握围棋智慧的计算机程序,这也成为了他后续一直在专注的研究兴趣。在 2013 年的 NeurIPS 会议上,Silver 展示了一种算法,它可以在雅达利游戏中展现达到人类水平的技巧。这个程序学会了在游戏过程中仅仅通过观察像素和分数来玩游戏。

2015 年, David Silver 和他的同事发布开创性论文“Human Level Control Through Deep Reinforcement Learning ”,在这个研究中,他们将强化学习与人工神经网络相结合,论文发表在 Nature 杂志上,且至今被引用近 1 万次,对该领域产生了巨大影响。随后,Silver 和他的同事继续用新技术改进这些深度强化学习算法,这些算法仍然是机器学习中应用最广泛的工具之一。

2016 年 3 月,团队开发的 AlphaGo 击败世界围棋冠军李世石,这被被誉为 AI 里程碑式的时刻。同年,解析 AlphaGo 背后技术的论文 “ Mastering the Game of Go with Deep Neural Networks and Tree Search ” 公开发布在Nature杂志上。

AlphaGo 和 AlphaZero 之后,DeepMind 的游戏 AI 探索的另一个重点是征服《星际争霸 II》。就在去年,由 Silver 领导的 DeepMind 团队开发了 AlphaStar,它掌握了多人即时战略游戏《星际争霸 II》,这类游戏被认为是游戏 AI 需要攀登的高峰。

现在,在 DeepMind——这家谷歌旗下最星光熠熠的 AI 公司,David Silver 和他的同事仍在寻求将机器学习和神经科学方面的进展进行技术融合,以构建功能强大的通用学习算法。David Silver 在深度强化学习上的诸多工作也已被应用于提高英国电网效率、帮助谷歌数据中心降低功耗、为欧洲航天局策划太空探测器轨迹等领域。DeepMind 团队还将继续推进这些技术,并为其找到更多的应用场景。

-End-

“AlphaGo之父”获最新一届ACM计算奖相关推荐

  1. AlphaGo之父对话《连线》,曾被导师劝阻研究强化学习,如今获得ACM计算奖

    晓查 编译整理  量子位 报道 | 公众号 QbitAI 本周,DeepMind的MuZero通过了同行评审,发表在了最新一期的Nature杂志上. MuZero是一个通用的游戏AI,它在围棋.象棋. ...

  2. 量子计算大牛、ACM计算奖得主Scott Aaronson加盟OpenAI

    来源:机器之心 近日,量子计算大牛.知名量子计算机专家 Scott Aaronson 要加盟 OpenAI 的消息引起了社区极大的关注. Aaronson 宣布他将离开 UT Austin 一年,到知 ...

  3. 一个预告|恭喜斯科特·阿伦森获得2021年ACM计算奖

    国际计算机协会(ACM)4月15日宣布,斯科特·阿伦森因对量子计算的开创性贡献荣获2021年ACM计算奖. ACM计算奖用以表彰处于职业生涯中早期.其贡献具有根本且广泛的影响的计算机科学家.ACM主席 ...

  4. 新一届ACM图灵奖得主以及其贡献

         2012年度A.M. Turing奖授予Shafi Goldwasser与Silvio Micali.      Silvio Micali是麻省理工学院的福特工程学教授.      Gol ...

  5. ACM图灵奖现状以及得主及其分别分别的贡献

    图灵奖现状 图灵奖(A.M. Turing Award,又译"杜林奖"),由美国计算机协会(ACM)于1966年设立,又叫"A.M.图灵奖",专门奖励那些对计算 ...

  6. 「AlphaGo 之父」David Silver最新演讲,传授强化学习的十大原则

    「AlphaGo 之父」David Silver最新演讲,传授强化学习的十大原则 https://mp.weixin.qq.com/s/KBddskHUAzQ8dm0Onu13ZA 演讲课件地址: h ...

  7. AlphaGo之父哈萨比斯: 先解决智能 再用智能解决一切

    AlphaGo之父哈萨比斯: 先解决智能 再用智能解决一切 2017年06月01日 06:56 第一财经日报 33微博微信空间分享添加喜爱 刘佳 ["我的背景很多元化.不要循规蹈矩,走自己的 ...

  8. 重庆师范大学第一届ACM选拔赛

    下面的题解不会给出题目所以在开头放出比赛链接传送门 本场比赛大部分都是模板题,但是任有记录的必要性 重庆师范大学第一届ACM选拔赛 不一样的食物链 有趣的求和 统计患病人数 皮皮想拜师 爱玩游戏的To ...

  9. 这一届科研计算人赶DDL红宝书:学生篇

    问:实验室的硬件条件好坏对你的科研有多大影响? 答:啥条件都行,没有影响. 我们坚信以下三点: 1.科学家就是专门负责搞科研的: 2.不依赖别人,你的研究效率和节奏必须掌握在你自己手里: 3.不管是尝 ...

最新文章

  1. ViewBag、ViewData和TempData使用方法、区别与联系
  2. 安装Nginx过程中,使用make时出现 make: *** 没有规则可以创建“default”需要的目标“build”...
  3. 李永乐线性代数手写笔记-特征值和特征向量
  4. Spring Boot——自定义多个拦截器(HandlerInterceptor)配置方法与执行顺序
  5. 错误提示:'……' is not assignable to Android.app.Activity Manifest XML
  6. linux io测试陈旭,130242014076+陈旭+第2次实验(示例代码)
  7. 1400 序列分解(dfs)
  8. 当下最实用计算机编程语言,目前最流行的计算机编程语言是什么?
  9. c语言笔试面试题目及答案,2019腾讯校园招聘C语言笔试题和面试题答案
  10. 《做难而正确的事》有感
  11. Android开发学习心得 (一) 生如夏花之绚烂,死如秋叶之静美 -- App的生死轮回
  12. pycharm菜单栏不见了被隐藏了,两种处理方法
  13. Docker搭建ElasticSearch
  14. perl python文本处理_Perl 调用R分词进行文本数据分析
  15. 一个屌丝程序员的青春(二二三)
  16. BERT微调(SQuAD v1.1)
  17. yapi接口导出为word_还在手工写接口测试文档,已经out了
  18. LeetCode-518零钱兑换II-中等
  19. 清华某面霸收集的世界500强公司面试题目和点评
  20. 基于JavaGUI实现的订餐管理系统

热门文章

  1. 【算法集中营】循环冗余校验
  2. 【预言】分布式缓存成为操作系统的一部分
  3. Lightingcolorfilter 滤镜
  4. 深入源码 UITableView 复用技术原理分析
  5. go get报错unrecognized import path “golang.org/x/net/context”…
  6. OpenAI及DeepMind两团队令未来的AI机器更安全
  7. js获取url中的参数值
  8. Pair Poject 1 【新双人贪吃蛇】本组:龚逸 合作者:庞俊
  9. 2.域控制器及证书颁发机构
  10. 部署了OpenStack就拥有了云平台?还差很远呢