编译 | 禾木木

出品 | AI科技大本营(ID:rgznai100)

谷歌母公司 Alphabet 的人工智能实验室 DeepMind 长期以来一直投资于游戏人工智能系统。实验室的理念是,游戏虽然缺乏明显的商业应用,但却是认知和推理能力的独特相关挑战。这使它们成为 AI 进步的有用基准。

与此前开发的游戏系统不同,DeepMind 创建了一个名为 Player of Games 的系统,是第一个在完全信息游戏以及不完全信息游戏中都能实现强大性能的 AI 算法。与 DeepMind 之前开发的其他游戏系统,如国际象棋冠军AlphaZero和星际争霸 II 的 AlphaStar 不同,博弈者可以在完全信息游戏(例如中国围棋和国际象棋)和不完全信息游戏(例如,扑克)中表现出色。

无论是解决交通拥堵问题的道路规划,还是合同谈判、与顾客沟通等互动任务,都要考虑和平衡人们的偏好,这与游戏策略非常相似。AI系统可能通过协调、合作和群体或组织之间的互动而获益。像 Player of Games 这样的系统,能推断其他人的目标和动机,使其与他人成功合作。

不完全对完全

不完全信息游戏的信息在游戏过程中对玩家是隐藏的,相比之下,完全信息游戏在开始时会展示所有的信息。

要玩好完全的信息游戏,需要相当多的预见性和计划。玩家必须处理他们在棋盘上看到的东西,并决定他们的对手可能会做什么,同时努力实现最终的胜利目标。不完全信息游戏则要求玩家考虑隐藏的信息,并思考下一步应该如何行动才能获胜,包括可能的虚张声势或组队对抗对手。

DeepMind 称,Player of Games是首个“通用且健全的搜索算法”,在完全和不完全的信息游戏中都实现了强大的性能。

Player of Games 有很强通用性,不过不是什么游戏都能玩。参与研究的DeepMind高级研究科学家马丁·施密德(Martin Schmid)说,在完全信息游戏中,AlphaZero比Player of Games更强大,但在不完全的信息游戏中,就没有那么厉害。系统需要考虑每个玩家在游戏中的所有可能观点。虽然在完全信息游戏中只有一个视角,但在不完全信息游戏中可以有很多这样的视角,例如,扑克大约有 2,000 个。此外,与 DeepMind AlphaZero 的继任者 MuZero 不同,Player of Games 也需要了解它所玩的游戏规则,而 MuZero 可以即时掌握完全信息游戏的规则。

在其研究中,DeepMind 在国际象棋、围棋、德州扑克和战略棋盘游戏《苏格兰场》上的表现,评估了 Player of Games 使用谷歌 TPUv4 加速芯片组进行训练。对于围棋,它在 AlphaZero 和 Player of Games 之间设置了 200 场比赛,而对于国际象棋,DeepMind 则让 Player of Games 和 GnuGo、Pachi 和 Stockfish 以及 AlphaZero 在内的顶级系统进行了较量。Player of Games 的德州扑克比赛使用公开可用的 Slumbot 进行,该算法还与 Joseph Antonius Maria Nijssen 开发的 PimBot 进行了苏格兰场的比赛。DeepMind 的合著称为“PimBot”。

在国际象棋和围棋中,Player of Games 被证明在某些配置中比 Stockfish 和 Pachi 更强大,并且它在对抗最强的 AlphaZero 系统时赢得了 0.5% 的比赛。尽管在对阵 AlphaZero 的比赛中损失惨重,但 DeepMind 认为 Player of Games 的表现达到了“顶级人类业余爱好者”的水平,甚至可能达到了职业水平。

结果显示,Player of Games是一个更好的德州扑克和苏格兰场玩家。与Slumbot对战时,该算法平均每hand赢得700万个大盲注(mbb/hand),mbb/hand是每1000 hand赢得大盲注的平均数量。

同时在苏格兰场,DeepMind称,尽管PimBot有更多机会搜索获胜的招数,但Player of Games还是“显著”击败了它。

未来

Schmid 相信 Player of Games 是向真正通用的游戏系统迈出的一大步。

实验的总体趋势是,随着计算资源增加,该算法的性能会更好,Schmid 预计这种方法将在可预见的范围内扩展未来。

“人们会认为,受益于AlphaZero的应用程序可能也会受益于游戏玩家。”他谈道,“让这些算法更加通用是一项令人兴奋的研究。”

参考链接:

https://venturebeat.com/2021/12/08/deepmind-makes-bet-on-ai-system-that-can-play-poker-chess-go-and-more/

DeepMind 打造 AI 游戏系统,可以玩扑克、国际象棋、围棋等,战斗力爆表相关推荐

  1. 杀疯了!通过游戏“元宇宙”,Deepmind让AI学会玩各种没玩过的游戏,骚操作不断...

    来源:大数据文摘本文约1800字,建议阅读7分钟 面对任务一看就会的AI,离我们心里的通用人工智能还有多远呢? 对于AI来说,完成一个单一任务或许相对简单,但是涉及到合作和博弈时,AI往往显得有些愚蠢 ...

  2. 为了让AI不断打怪升级,DeepMind打造了一个“元宇宙”

    作者 | 青暮 DeepMind又冷不丁给了我们一个小惊喜. 我们都知道,强化学习苦于泛化能力差,经常只能针对单个任务来从头开始学习. 像DeepMind之前开发的AlphaZero,尽管可以玩转围棋 ...

  3. CSDN开发者周刊第 22期:谷歌 DeepMind 第四代:不学规则就可以玩游戏;图灵奖得主 Edmund Clarke 因感染“新冠”逝世;

    CSDN开发者周刊:只为传递"有趣/有用"的开发者内容! 本周热门项目 1.红帽为杀死 CentOS 发行版辩护 红帽公司的高级社区架构师.CentOS 董事会成员卡斯滕-韦德(K ...

  4. 腾讯在家门口造了一个AI游戏盒子,这次不用氪金就能玩得开心

    郭一璞 发自 深圳  量子位 报道 | 公众号 QbitAI 一向以游戏业务见长的腾讯,连展示自己的AI业务都要设计成游戏. 是的,这次在腾讯的家门口深圳,腾讯把自己目前的AI业务以及其他科技项目,全 ...

  5. 针对这一行业痛点,创新工场投资的潞晨科技发布了大规模并行AI训练系统——“夸父”(Colossal-AI) ,通过多维并行、大规模优化器、自适应任务调度、消除冗余内存、降低能量损耗等方式,旨在打造一个

    前沿AI模型越来越大,无论是对于企业还是个人,AI模型的训练成本都越来越高.即使花巨资使用超级计算机集群,聘请专家,也难以实现AI模型的高效训练. 针对这一行业痛点,创新工场投资的潞晨科技发布了大规模 ...

  6. 第十四期: 拥有7000多万店铺和10多亿件商品的微店如何打造AI系统?

    AI技术对于电商至关重要,但AI的实践门槛很高,对于创业公司尤其如此.那么电商创业公司如何打造AI系统?如何利用AI解决实际问题? 作者:夏剑 AI技术对于电商至关重要,但AI的实践门槛很高,对于创业 ...

  7. 想搞一套AI问答游戏系统?简单,Google又开源了

    本文来自AI新媒体量子位(QbitAI) 刚刚,Google开源了一套问答游戏App系统. 通过一套模板工具可以,你只要给出问题和答案,就能搞出一套功能齐备的AI问答游戏.这套问答系统基于Google ...

  8. 玩qq游戏提示计算机内存不足,Win8系统下玩lol提示关闭程序以防止信息丢失内存不足怎么办...

    很多人都喜欢在win8系统下玩lol等大型游戏,而在玩游戏过程中经常会碰到一些问题,一些win8系统用户在玩LOL的时候程序崩溃,计算机的内存不足,提示"关闭程序以防止信息丢失,计算机内存不 ...

  9. 听见丨苹果申请自主导航系统专利,自动驾驶汽车梦再近一步 现代打造更聪明、实用汽车AI语音系统

    浙江合众新能源宣布获知合出行12.5亿元注资,首款新车将于明年年中上市 昨天下午,浙江合众新能源宣布获知合出行12.5亿元注资并完成控股股东变更.合众新能源成立于2014年,由北京亿华通科技股份有限公 ...

最新文章

  1. 【bzoj1070】[SCOI2007]修车 最小费用流
  2. 人像摄影哪家强?同为双摄的OPPO R11不敌金立S10
  3. Java 并发编程:ThreadLocal 的使用及其源码实现
  4. linux 配置计算机和用户免密在本地计算机执行远程命令 hosts.equiv $HOME/.rhosts 简介
  5. 纯CSS实现多级菜单,兼容IE6
  6. 1642: [Usaco2007 Nov]Milking Time 挤奶时间(dp)
  7. Extjs EditorGridPanel中ComboBox列的显示问题
  8. 【收藏】CDH6.2.1 配置Flink1.10(编译安装)
  9. 教师学计算机课程标准,信息技术课程标准2018
  10. C语言中sizeof和strlen的区别是什么
  11. Grafana WebHook 报警通知踩坑系列,支持报警截图发钉钉卡片报警!!!
  12. [LibTorch Linux] 各版本 LibTorch 下载
  13. 周年直播倒计时2天,攒足惊喜等你开场! | MindSpore 开源一周年
  14. 关于云数据库的“担忧”,你占了几条?
  15. 计算机应用历年高考真题,春季高考历年真题-2013年天津市春季高考计算机试卷...
  16. ARM V8 SPEC B1 AArch64 Application level programer‘s Model
  17. 计算机视频解码测试,无底限测试 入门电脑挑战H.265视频解码
  18. 学习笔记(01):10小时掌握区块链开发教程-2小时构建以太坊智能合约-1
  19. Python渗透测试之流量分析:流量嗅探工具编程
  20. 微信小程序需要用到服务器吗?

热门文章

  1. Java培训学习步骤有哪些
  2. web前端培训之Javascript如何改变数组的长度?
  3. mysql 安装 se_mysql的安装过程
  4. SharePoint运行状况分析器有关磁盘空间不足的警告
  5. 【书籍下载链接】_2_第二轮_计算机专业书籍
  6. 云计算设计模式(十)——守门员模式
  7. Javascript 检查一组 radio 中的哪一个被勾选
  8. HTML Inspector – 帮助你编写高质量的 HTML 代码
  9. Debian Linux下的Python学习——控制流
  10. 绩效管理领域对管理者的任务和能力要求