智造观点

日前,Facebook人工智能研究和卡内基梅隆大学日前发表在《科学》杂志上的一篇论文,介绍了Pluribus这款AI扑克机器人,它击败了15位扑克专业人士,是第一个在基准游戏中持续击败两个以上人类玩家的人工智能。

AI又双叒叕超神了!

尽管AI在很多1VS1的游戏中具有相当的优越性,但在复杂的多人游戏版本纸牌游戏中,人类还是一直保持着自己的优势。

直到现在,一个新的AI出现了。

这款名叫Pluribus的AI机器人,在6人德州扑克中碾压了人类的顶尖高手。

目前正在各大网站刷屏的Facebook人工智能研究和卡内基梅隆大学日前发表在《科学》杂志上的论文,介绍了Pluribus创建。这是一款扑克玩家AI,Facebook称其是第一个击败德州扑克(扑克有时用来衡量人工智能或游戏理论表现)专业人士的AI。

Pluribus击败的15位人类专业人士,都是人类中的顶尖选手,每个人曾经赢得过至少100万美元的扑克比赛。例如2000年世界扑克锦标赛冠军克里斯“耶稣”Ferguson和4次世界扑克巡回赛冠军达Darren Elias。

对此,最早测试Pluribus的玩家兼它的手下败将Darren表示,几周前,Pluribus还是一个牌技平庸的小可怜。“它的主要优势在于它能够使用混合策略,这与人类试图做所的事情是一样的。而且Pluribus完全随机的方式执行此操作并始终如一地执行此操作。”

Facebook AI声称,Pluribus是第一个在基准游戏中持续击败2个以上人类玩家的人工智能

那么这款AI机器人训练成本如何?

研究人员表示,Pluribus只需花费150美元的云计算进行培训,即可实现其目标。

而且,超过20小时的训练产生的人工智能玩家,就可以比人类顶级玩家更好。

Pluribus建立在Libratus的基础之上。Libratus是卡内基梅隆在2017年制作的AI扑克玩家,曾经历时20天战胜了4为德州扑克顶级选手,但是只能1V1。

Pluribus是怎样练成的?

就像AI被训练玩Pluribus之前的Go、Dota II和星际争霸II等游戏一样,AI可以通过与自己比赛进行训练。

“Pluribus战略的核心是通过自我游戏来计算的,在这个过程中,AI与其自身的副本进行比赛,而没有任何人类或先前AI游戏的数据用作输入。”论文写道,“人工智能从零开始,随机地玩游戏,然后随着它决定了哪些行为,以及这些行为的概率分布,逐渐地改进,与早期版本的策略相比,会产生更好的结果。”

在研究人员的测试中,Pluribus赢得了5场人类和1场AI比赛,以及5场AI和1场人类比赛。Facebook AI表示,如果每个芯片价值1美元,那么Pluribus每手的收益大约为5美元,每小时与5个人玩游戏的收益大约为1000美元。

“根据具体情况,它考虑的具体下注数量在1到14之间不等。”《科学》杂志写道:“虽然多人可以将自己的赌注限制在100美元到10000美元之间,但实际上玩无限制扑克时,对手并不局限于这几个选项中的一个。”

在这里必须说明,实验设置并不完全反映普通的6人扑克游戏。与真实游戏不同,筹码数量并不是一个持续的总数:对于每一手牌,每个玩家都会获得10000个筹码,无论输赢,他们也会在下一手牌中获得10000个筹码。

Facebook人工智能研究科学家NoamBrown说,显然这限制了长期战略的可能,事实上“机器人并没有在对手身上寻找可以利用的弱点”。

但仅仅因为它不是基于对对手个人习惯或风格的长期观察,并不意味着它的策略是肤浅的。相反,它可以说更令人印象深刻,并从另一个角度来看待游戏,即存在一种不依赖行为暗示或利用个人弱点的获胜策略。

在扑克中击败人类只是一个开始,作为一名优秀的选手,Pluribus更重要的是一个AI代理可以在像6人扑克这样复杂的东西上实现超人表现的示范。

“许多现实世界的互动,如金融市场、拍卖和交通导航,可以类似地建模为多代理互动。”Facebook在其博客中写道。

近期热文:

AI项目失败率高达50%!人工智能离企业级应用还有多远?

背了单词再也不怕忘,多邻国的AI要逆天!

还在关注“宏颜获水”?DuerOS 5.0让你更惊讶

重磅!Apollo 5.0来了,百度变身「老司机」!

下一个特斯拉在哪里?

谷歌AI模型ML-Jam激发音乐家创作,人机合作或成未来大势!

从2亿美元估值到被苹果收购,曾经的明星无人车公司Drive.ai黯然退场

IBM发布最新AI模型,帮视障者“看”到更多

又一个里程碑,谷歌发布最新研究,机器学习开辟新篇章!

面对人工智能的发展,人类未来将扮演怎样的角色?

投稿、约访、合作,联系邮箱aiobservation@qq.com

添加微信aixiaozhijun,更多交流或进AI观察团

AI变身超级赌神,德扑六人局击败世界冠军!相关推荐

  1. AI赌神超进化:德扑六人局击溃世界冠军,诈唬如神,每小时能赢1千刀 | Science...

    鱼羊 栗子 乾明 发自 凹非寺  量子位 报道 | 公众号 QbitAI AI赌神完成了超进化! 两年前的Libratus,历时20天战胜4位顶级德州扑克选手,但只能1v1.现在全新的赌神Plurib ...

  2. 超级人工智能称霸德扑的秘密:Libratus击败顶级专业人士

    近年来,人工智能(AI)领域已经取得了相当大的进展.在许多情况下,衡量这种进步的标志是在基准游戏中对人类的表现.国际人道主义计划在跳棋(1),国际象棋(2)和围棋(3).在这些完美的信息游戏中,双方都 ...

  3. CMU德扑AI赌神,现已拿下美军千万美元大单

    乾明 发自 凹非寺 量子位 出品 | 公众号 QbitAI 还记得那个玩德扑的AI吗? 没错,就是Libratus,中文名冷扑大师,在2017年举办的德扑人机大战中,一举成名. 在2017年的比赛中, ...

  4. AI赌神称霸德扑的秘密,刚刚被《科学》“曝光”了

    本文来自AI新媒体量子位(QbitAI) 称霸德州扑克赛场的赌神Libratus,是今年最瞩目的AI明星之一. 刚刚,<科学>最新发布的预印版论文,详细解读了AI赌神背后系统的全貌.此前的 ...

  5. AI赌神升级!无惧bluff,6人局德扑完胜世界冠军,训练只用了8天

    大数据文摘出品 2017年年初,Brain vs AI的德州扑克人机大战在卡耐基梅隆大学(CMU)落幕,由4名人类职业玩家组成的人类大脑不敌人工智能程序Libratus. 获胜后人类还遭到了Libra ...

  6. 德扑 AI 之父解答 Libratus 的13个疑问:没有用到任何深度学习,DL 远非 AI 的全部

    来源: AI科技评论 概要:卡耐基梅隆大学计算机系在读博士生 Noam Brown 和计算机系教授 Tuomas Sandholm 来到 reddit 的机器学习分版,和网友们一起来了一场「你问我答」 ...

  7. 浙大提出会打德扑的「自我博弈」AI,还会玩射击游戏

    选自arXiv, 机器之心编译 人工智能已在围棋这样的完美信息游戏上实现了远超人类的水平,但在信息未完全披露的多人对战游戏上还无法战胜人类.近年来,OpenAI 和 DeepMind 在 DOTA2 ...

  8. android德州扑克计算器,学界 | 一台笔记本打败超算:CMU冷扑大师团队提出全新德扑AI Modicum...

    原标题:学界 | 一台笔记本打败超算:CMU冷扑大师团队提出全新德扑AI Modicum 选自arXiv 参与:路.晓坤 CMU 冷扑大师团队在读博士 Noam Brown.Tuomas Sandho ...

  9. IJCAI-21三大奖项公布,强化学习之父、CMU助理教授方飞、德扑AI之父获奖

    转自:机器之心 「强化学习之父」Richard Sutton.CMU 助理教授方飞.「德扑 AI 之父」 Tuomas Sandholm 分别获得了今年 IJCAI-21 的卓越研究奖.计算机与思想奖 ...

  10. 德扑AI之父:赢不赢柯洁 阿尔法狗都缺乏实际用处

    人机对战无疑是4月10日的新闻焦点之一.一边在海南澄迈,德州扑克人工智能"冷扑大师"(Libratus)经过5日激战,在33000手一对一无限注德扑比赛中完胜中国"龙之队 ...

最新文章

  1. Yii 框架学习--03 多应用多模块
  2. JVM - 深入剖析字符串常量池
  3. Notepad++的安装和基本使用
  4. 决定你是富人还是穷人的12条定律
  5. 全国职称计算机考试教程,全国职称计算机考试专用教程:Excel 2003 中文电子表格(附光盘)...
  6. Vsphere日记01.ESXi5.5.install
  7. $.type 怎么精确判断对象类型的 --(源码学习2)
  8. c++ string长度_String.format()的简单使用
  9. Adobe Illustrator (AI)安装教程 (附安装包下载资源)
  10. 打通C到B,“能者多劳”的小冰
  11. 数据库事务(Transaction)详解
  12. yaml-cpp保存标定文件-Node/Emitter
  13. 锁定计算机后游戏掉线,Win7旗舰版系统下玩游戏挂机总是掉线的解决方法
  14. 【PhotoShop基础B篇】准确控制曝光
  15. 程序员怎样才能实现财富自由
  16. 逆水寒服务器维护到什么时候,逆水寒11月1日更新到什么时候_维护到几点
  17. winget 配置安装路径/卸载等指南
  18. 2023最新无人机专业现状分析及完整“产教融合”人才培养解决方案(超详细)
  19. jsp四大作用域和九大内置对象
  20. 1.7.10我的世界java下载_我的世界1.7.10

热门文章

  1. 视频打包为MP4格式并存储到TF卡的实现
  2. 2022电大国家开放大学网上形考任务-普通心理学非免费(非答案)
  3. ansys linux卸载干净,安装了几次ansys14.5,都没有成功,删除重新安装后许可安装不了了...
  4. Sablog-X v2.x 任意变量覆盖漏洞
  5. 妈妈吼你屋子乱的像猪窝的无聊探究
  6. Liunx使用apt安装本地deb软件包
  7. 高德poi类别23个大类 261个中类 4705个小类
  8. android 汉字 转 拼音首字母大写,传入汉字字符串, 返回大写拼音首字母
  9. 改变历史的引擎 Physx携众物理游戏测试
  10. \xe8\x83\xa5\xe5\xb8\x85\xe6\x9d\xb0转中文