作者 | 若名

出品 | AI科技大本营(ID:rgznai100)

刚刚,在更复杂的《星际争霸 II》游戏中,DeepMind AI 以总比分 2:0 分别战胜两位职业人类选手。这或许是自 2017 年 AlphaGo 在围棋上战胜人类后,再次让人类刷新 AI 认知的人机大战。

此次与人类对战的 AI 是 AlphaGo 兄弟:AlphaStar。开赛前几个小时,DeepMind CEO 在 Twitter 上公布了这一名字。而在开赛前一天,DeepMind 宣布 AI 将与人类在《星际争霸 II》中公开对战的消息,并表示在《星际争霸 II》游戏的疯狂难度模式下,其 AI 的胜率为 50%。

需要说明的是,正如之前打 Dota 的 OpenAI 受到的降低反应速度一样,DeepMind 此次将 AlphaStar 的反应速度“限制”到 APM 280,大致相当于星际中等职业玩家的水平。就 AlphaStar 的表现来看,虽然最终在现场 PK 时输了最后一局比赛,但整体上还是完虐人类。

比赛开始,与 AlphaStar 对战的第一个职业选手是 TLO,其世界排名为第 68 位。此次人机大战是五局三胜制,TLO 虽然不是顶级星际选手,但让人足够惊叹的是,AlphaStar 最终在约五十分钟内结束战斗,以 3:0 的成绩获胜,人类职业选手似乎毫无还手之力。

先来简单回顾下人机大战第一场:AlphaStar 第一局一开始就表现的很有全局观,在 PvP 两矿打一矿的情况下,TLO 很快被击败;第二局一度打得很焦灼,但 AlphaStar 依然以 2:0 再赢一局;十分钟后,TLO 溃败给 AlphaStar,有网友说选手太初级,批评 TLO 作为职业选手在瞎打,没有尊重熬夜看人机大赛的观众。不过,也有人说 AI 很可怕。

如果说第一回合 AlphaStar 战胜的是“初级”选手,那随后与其对战的职业选手是世界排名第 19 位的 MaNa ,其职业水平至少是中上游。

上图显示的是 AlphaStar 的决策过程,具体比赛过程就不说了,结果是 MaNa 在大约 45 分钟内连输五局被 AlphaStar 斩落马下。

前一个职业选手 TLO 在 MaNa 输掉比赛后称,“相信我, 和一个像 AlphaStar 这样的对手比赛是非常困难的, 它的打法和人类完全不同,是你以前从未有过的经验。 AlphaStar 给人留下了极深的印象, 这在游戏 AI 中也是前所未有的。"

AlphaStar 遇神杀神,干脆利落。这次应该没人责怪 MaNa 打得不好,他显然拼尽了全力,而网友发出的慨叹是希望终结者不会来那么快。

但最后一局让网友们为人类命运紧张的情绪稍稍放松,与 MaNa 现场对战的 AlphaStar 一着不慎,让 MaNa 扳回一局,但最终以 1:5 输掉比赛。

AlphaStar 的来历


早在 2016 年,谷歌 DeepMind 的 AI 研究人员已经开始关注暴雪娱乐的《星际争霸 II》。通过游戏来确定 AI 是否可以胜过人类相对简单的复杂任务是 DeepMind 的研究人员长期以来都在尝试的项目。同年 11 月,DeepMind 曾在暴雪嘉年华上宣布与暴雪达成合作协议,将在《星际争霸》系列游戏中进行合作,将在游戏平台中引入机器学习方法,进行人工智能研究。

2017 年 8 月,Deepmind 与暴雪共同发布了合作计划的首个成果:基于《星际争霸 II》的人工智能研究环境 SC2LE,它允许研究者在 Linux 系统中接入游戏 API,开放了 65000 场比赛的数据缓存用于训练 AI,并将添加 50 万场游戏数据到缓存中。

2018 年,同样在暴雪嘉年华上,他们分享了人工智能模型在《星际争霸》游戏中的突破。人工智能模型能执行基本的宏观战略,还能防御像 Tower Rush 这样的激进战术。而刚刚结束的“星际争霸”赛则是是一项“重大挑战”,因为这要求 AI 智能体“实现和平衡一些子目标”,以便最终击败人类选手。

例如,虽然游戏的目标是击败对手,但玩家还必须考虑平衡多个子目标,比如收集资源(水晶和气矿)或建筑。此外,一场比赛的时间通常为几分钟到一小时不等,这意味着游戏中提早执行的行动会在很长时间不见成效。最后,由于玩家智能看到部分地图,这意味着智能体必须结合记忆与规划才能成功。

AlphaStar 背后的 AI 技术

在围棋任务中,对手间可以看到整个棋盘,但《星际争霸 II》与此不同,我们通常无法看到整个地图,需要派小兵出去侦查。而且游戏是不间断进行的,整个游戏甚至会有超过 5000 步的操作。

DeepMind 科学家 Oriol Vinyals 曾在去年的一场以《AI 对战星际争霸胜算几何?》的演讲中提到,这个游戏基本上就是建造一些建筑物以及单位,在同一个地图里与不同的组织相互竞争。在这个游戏中,哪怕只是建造建筑物,也需要做出许多决策。除此之外,他们还要不断收集和利用资源、建造不同的建筑物、不断扩张,因此整个游戏非常具有挑战性。

他们在这个游戏中使用的方法依旧是强化学习。他们要让 AI 模仿人类玩这个游戏的方式,但即使是模仿人类点击鼠标和敲击键盘的行为也非常困难,需要收集整个《星际争霸》玩家的行为进行分析。为此还引入了一个游戏引擎。

DeepMind 还为游戏过程设计了不同的指令和模式,这使得整个玩《星际争霸》的过程变得独一无二。如今,我们看到的 AlphaStar 正是上述想法的结晶。

现在的 AlphaStar 还是刚出生的婴幼儿,不过以其极快的进化速度,你也能想到日后的进化版会是多么无可匹敌。到现在,或许还有很多人期待 2 月 15 日 AlphaStar 与世界排名第一的 Serral 进行终极对决,但最终的结果可想而知。正如柯洁输给 AlphaGo 时面临的绝望一样,人类可能不愿意面对这样的现实:在更多复杂的场景中,人类可能正以难以想象的速度输给 AI。

(本文为 AI科技大本营原创文章,转载请微信联系 1092722531。

征稿

推荐阅读

  • PDF翻译神器,再也不担心读不懂英文Paper了

  • Facebook增强版LASER开源:零样本迁移学习,支持93种语言

  • 啥是佩奇排名算法

  • 网络爬虫的法律边界

  • Caicloud 开源 Nirvana:让 API 从对框架的依赖中涅槃重生

  • 程序员有话说 | 那个拒绝加班的程序员后来怎么样了

  • 告别摩拜

  • 6大改进:盘点以太坊的2018冒险之旅

  • 不难!月薪 50K大牛,悉心整理程序员必备技能!

2:0!谷歌 AI “AlphaStar“ 虐杀职业星际玩家相关推荐

  1. AI打王者、星际争霸……你还不懂背后技术?这有一份游戏AI综述

    视学算法报道 机器之心编辑部 游戏中的人工智能所面临的技术.挑战和机遇. 人机游戏有着悠久的历史,已经成为验证人工智能关键技术的主流.图灵测试可以说是人类首次进行人机对抗测试,这激发了研究人员设计各类 ...

  2. 战网AI危机!AlphaStar匿名潜入星际2天梯PK,进化版让人类玩家瑟瑟发抖

    乾明 栗子 发自 凹非寺  量子位 报道 | 公众号 QbitAI 把自己虐到爆的对手,到底是人还是AI? 对于一些星际争霸II玩家来说,再也没法明确回答了. 刚刚,星际争霸官方宣布,DeepMind ...

  3. 一周AI看点 | 谷歌AI工程师说五年内实现人机对话,能实现吗;NASA开发AI竞赛无人机要挑战人类职业玩家,无需外部定位技术

    本期一周AI看点包括行业热点.投融资.业界观点.技术前沿以及应用等方面. 01 行业 NASA开发AI竞赛无人机,欲挑战人类职业玩家 近日,NASA喷气推进实验室(Jet Propulsion Lab ...

  4. 谷歌AI掌门人Jeff Dean获冯诺依曼奖;微软计划自研PC和服务器芯片;Ruby 3.0 RC1发布|极客头条...

    整理 | 郑丽媛 头图 | CSDN 下载自东方 IC 快来收听极客头条音频版吧,智能播报由出门问问「魔音工坊」提供技术支持. 「极客头条」-- 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「 ...

  5. DeepMind科学家:AI对战《星际争霸》胜算几何?

    记者 | 周翔 AI科技大本营1月29日消息,在<麻省理工科技评论>与深科技举办的新兴科技峰会上,谷歌DeepMind科学家Oriol Vinyals在会上发表了主题为<AI对战星际 ...

  6. Google DeepMind顾问预言:五年后AI将在《星际争霸》中战胜人类

    在纽芬兰和拉布拉多,正在用人工智能进行<星际争霸>比赛. <星际争霸>的幽灵机器人.(来自:维基共享资源) 接下来的两个星期里,在纪念大学(Memorial Universit ...

  7. 【IEEE 2021大奖出炉】谷歌AI掌门人Jeff Dean获冯诺依曼奖

    作者 | 陈大鑫 近日,2021年度IEEE 冯诺伊曼奖项结果正式公布! Google 高级研究员(Senior Fellow).AI掌门 Jeff Dean摘得本年度奖项,获奖理由为「表彰其对大规模 ...

  8. “编程能力差的程序员,90%输在这事上!”谷歌AI专家:都是瞎努力!

    Google 人工智能开发者专家彭靖田老师说--超90%的程序员在初学Python 人工智能时,都会遇到下面3个问题: 1.想学人工智能,但不知从何学起,也不知道该选择什么方向... 2.Python ...

  9. 从Pixel 3a到Android Q,一份谷歌AI能力的“成绩单” | Google I/O全程回顾

    作者 | 琥珀 出品 | AI科技大本营(ID:rgznai100) 当地时间 5 月 7 日上午(北京时间 5 月 8 日凌晨一点),一年一度的 Google I/O 开发者大会如期而至.今年也是 ...

最新文章

  1. 老师吴恩达,身家又增20亿
  2. 上次谁说要简历模板来着?来!
  3. msdn集合不存在 请重新安装msdn_全网首发【MSDN系统】 Windows 10 1909 五版合一 原版系统(64位)...
  4. Bash命令的学习笔记(legacy)
  5. linux 大量文件 ls卡死,Linux下文件过多导致 ls 命令出现 arguments too long 的问题
  6. 计算机考试老师批卷么,【揭秘】高考答卷扫描到电脑上是啥模样?阅卷老师喜欢啥样的答卷?...
  7. JVM系列:生产环境参数实例及分析【生产环境实例增加中】
  8. 局部变量AND全局变量
  9. 解决Tuxera NTFS for Mac软件安装问题 手动批准mac内核扩展
  10. 自定义线程池-c#的简单实现
  11. Java中VO/DTO/DO/PO/POJO/BO/DAO概念及其区别
  12. Echarts美国地图
  13. JMETER badboy 下载及安装
  14. 阿里中台搞了3年,搞凉了?网传:副总裁玄难“背锅”,辞职创业!
  15. 霍尔开关的分类及如何选型
  16. 报错 Error from server (InternalError): an error on the server (““) has prevented the request from suc
  17. 【贪心】加工生产调度(双机调度贪心问题)
  18. Flutter中基于Dio实现Token Refresh
  19. ADB和Fastboot最新版的谷歌官方下载链接
  20. 存储过程语法(MySQL)

热门文章

  1. Using Apache2 with JBoss AS7 on Ubuntu
  2. 普通域账号客户端计算无关机选项
  3. 暑期集训2:ACM基础算法 练习题B:CF-1008B
  4. 关于Linux服务器磁盘空间占满问题的解决方法
  5. django admin组件
  6. MapReduce_wordcount
  7. ARM 环境下使用azure powershell 从远程blob中拉去vhd 并创建虚拟机
  8. 【bzoj3261】最大异或和 可持久化Trie树
  9. HTML5 canvas绘制雪花飘落
  10. bzoj 4695: 最假女选手