栗子 发自 凹非寺 
量子位 报道 | 公众号 QbitAI

AI组队,比人类战队的成绩好。

AI与人类组队,还是远超人类。

DeepMind为了训练强化学习AI的团队协作能力,选择了雷神之锤3竞技场的夺旗游戏。

从去年到今年,AI不断进化:

如今,把反应速度降到和人类水平把标记准确率也降下来,胜率依然超过人类。

而AI学习的资源,也只有第一视角看到的游戏场景,以及比分,没有比人类获得更多信息。

当AI赢了柯洁,我们说AI不会合作;当AI赢了刀塔2世界冠军,我们说是冠军太鱼反应速度不公平。

但现在,我们只能看着DeepMind登上最新一期的Science

然后,观察一下这些既懂得相互协作、又懂得和人类协作的AI,是怎样修炼出来的:

严酷的训练场

夺旗游戏 (Capture the Flag) 是这样的:

两队各有自己的大本营,目标是把己方的旗守在大本营,并拔掉对方的旗。

如果我是蓝方,看见敌人扛着蓝旗跑,就要用激光标记它

这样,蓝旗会失而复得,敌人也会被送回它的老家。

五分钟内,哪一队拔掉对方更多的旗,这一队就赢了。

原本,雷神之锤3竞技场里只有5张地图;团队竞技场,也只有几十张地图。

为了让AI受到更加严格的训练,DeepMind随机生成了许多游戏里原本没有的地图

就在这样的竞技场里,DeepMind同时训练了30只智能体,主要原理是LSTM。

这30只AI选手,一共打完了45万场游戏

在这个过程中,还要不时淘汰掉表现不佳的AI,用顶尖AI选手的变异版本 (Mutations) 代替。这是进化算法的思路。

最终,选出最优秀的一只AI,取名For the Win (FTW) 。

除了碾压人类,还会利用游戏bug

然后,就该测试FTW的实力了。

首先,是人机混战:DeepMind找来40个人类,与AI随机组队。

结果,AI选手的个人胜率远超人类:

研究人员发现,AI不但能同人类/AI协作,还形成了经典的团战策略

比如,跟在队友身后,这样一旦与敌人交火,便能在人数上超过对手。

还有,在敌人大本营附近游荡,当队友拿到旗子的时候可以迅速接手往回跑。

除了这些人类常用套路之外,AI还发明了全新策略:

利用游戏里的一个bug,从背后向队友射击,能加快队友的速度。

除了看到现象,团队还想知道,AI为什么会修炼出这许多技能。

于是,研究了AI的行为模式,观察它们是如何理解比赛:



各种颜色的点点,分别代表:旗在阵地,队友扛走了敌方大旗,自己处在敌方阵地等等。

不同战况之下,AI的反应明显不同。安全和危险,分得清清楚楚。

调至同一起跑线

虽然,AI在初次混战中碾压人类,但DeepMind团队十分理智地以为

AI之所以超过人类,主要优势一是反应速度快,二是射得准 (感觉哪里不对) 。

所以,团队手动把反应速度调慢到人类水平267毫秒左右,把80%的射击准确度降低到和人类相当的48%左右

然后重启比赛,这次是真正的人机对战

人类战队分为普通人类 (Average Human) 和强大人类 (Strong Human) 。

结果,强大人类组成的战队,对战AI的胜率也仅有21%。

对人类来说,唯一值得庆幸的是:

当有AI加入人类战队,与纯AI战队互打的时候,人类战队的胜率终于超过了AI战队。

臆测一下,这个大概是说:人类是猪队友,吧?

Science论文传送门:
https://science.sciencemag.org/content/364/6443/859

Science报道传送门:
https://www.sciencemag.org/news/2019/05/artificial-intelligence-learns-teamwork-deadly-game-capture-flag

OpenAI博客传送门,内容刚刚更新:
https://deepmind.com/blog/capture-the-flag-science/

小程序|全类别AI学习教程

AI社群|与优秀的人交流

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「在看」吧 !

DeepMind登上Science:“和AI相比,人类都是猪队友”,团战称霸雷神之锤3相关推荐

  1. 朱松纯团队工作登上 Science 头条—AI“读懂”人类价值观

    近日,国际顶级学术期刊<Science Robotics >发表了朱松纯团队(UCLA袁路遥.高晓丰.北京通用人工智能研究院郑子隆.北京大学人工智能研究院朱毅鑫等作者)的最新研究成果--实 ...

  2. 像人一样脑补世界!DeepMind历时一年半搞出GQN,登上Science

    夏乙 安妮 发自 凹非寺 量子位 出品 | 公众号 QbitAI 历时一年半的研发之后,新成果浮出水面 . 被称为人工智能"梦之队"的DeepMind,刚刚在Science上发表论 ...

  3. 登上 Science,AlphaZero完整论文首次发布

    登上 Science,AlphaZero完整论文首次发布 DeepTech深科技 百家号12-0720:11 经过数月的反复修改,DeepMind 最强棋类游戏 AI AlphaZero 的完整版论文 ...

  4. 哈佛新研究登上Science封面:这个机械外骨骼,是一条“轻功”短裤

    乾明 发自 凹非寺  量子位 报道 | 公众号 QbitAI 刚刚,Science封面刊发外骨骼穿戴设备的最新研究. 这是一款"神奇"的设备,能像穿短裤(方便)一样穿在身上(简洁) ...

  5. 小鼠脑立体定位图谱_脑科学日报|JAMA:保健品不能预防抑郁症;一只会唱歌的小鼠,登上Science封面;为什么不撒谎?自私谎言背后个体神经机制差异...

     第 247 期    脑科学日报 2019年3月9日 科  学  时  讯 1,一只会唱歌的小鼠,何以登上Science的封面? 来源:原理 纽约大学医学院的神经科学家 Michael Long 和 ...

  6. 打一针就可修复受损心脏,“癌症克星”CAR-T跨界疗法登上Science封面

    博雯 发自 凹非寺 量子位 报道 | 公众号 QbitAI 用"打疫苗"的方式修复心脏损伤,你能想象吗? 这项来自宾夕法尼亚大学的研究,现已登上Science封面: 已存的一些疗法 ...

  7. 「土行孙」机器人登上Science子刊封面,用气流在地下穿梭自如,速度达每秒4.8米...

    明敏 发自 凹非寺 量子位 报道 | 公众号 QbitAI 你能想到这个看上去略显呆萌的"异物",其实是个能挖洞的软体机器人吗? 怎么让我想到了大白? 不仅是长相,连构造上都有点像 ...

  8. 游戏开场是一个博士在计算机,计算机博士告诉你 为什么游戏里的AI都是猪队友...

    不知道玩家们有没有注意到,尽管游戏画面,动作或者其他的方面都产生了脱胎换骨般的变化,但AI仍是没什么大改变,至今判断敌人厉害程度的方式还是停留观察在血量,伤害,防御上面.到底是为什么不能使AI变得更智 ...

  9. AlphaZero登上Science封面:从小白开始制霸多个游戏

    DeepMind 推出的 AlphaGo 曾在围棋项目中取得了超越人类的表现,其研究曾经两次登上 Nature.近日,AlphaGo 的「完全自我博弈加强版」AlphaZero 的论文又登上另一大顶级 ...

最新文章

  1. POJ3070矩阵快速幂简单题
  2. 计算机设计目的和意义,程序设计的目的和意义.doc
  3. 【线上圆桌整理 - 微软】后疫情时代现代化办公新趋势
  4. LeetCode算法入门- Reverse Integer-day6
  5. corosync+openais+pacemaker构建高可用性集群
  6. Servlet多线程机制
  7. Leetcode431.将N叉树编码为二叉树(golang)
  8. 请描述计算机软件分类,2014年计算机一级考试MsOffice模拟题
  9. linux bash脚本 坑,向大家分享一个shell脚本的坑
  10. 没有 4K 和新处理器,任天堂的新 Switch 为什么还能吸引圈外玩家买单?
  11. 抓包工具charles下载安装(破解版)
  12. 渗透测试 QA 收集
  13. 交换刀片和计算刀片的区别_有关编写自定义刀片指令的所有信息
  14. 用matlab实现女声变男声步骤,男变女声、女变男声、如何实现变声效果?
  15. python psutil 终止子进程
  16. Mac如何卸载系统自带软件?macbook系统软件怎么删除?
  17. 转:vue+canvas如何实现b站萌系登录界面
  18. 总结-控制台(Console)程序和Windows程序的区别
  19. 图像超分辨重构(SR)论文整理————适用于刚接触这个领域的初级研究者。(持续更新)
  20. html正则表达式验证字母,正则表达式校验字母和字符串组合

热门文章

  1. 107 岁的 IBM 以 340 亿美元吞下了 25 岁的“小”红帽!
  2. 腾讯:干掉头条,先拿抖音开刀!
  3. createsolidcaret 后 很快就不闪烁了_【文献推送】Adv. Mater. | 单分散硅基闪烁体实现X射线介导的深层肿瘤光动力治疗...
  4. html5触摸指定区域,HTML5/CSS3系列教程:HTML5 区域(Sectioning)的重要性
  5. 数据结构与算法python语言描述答案_《数据结构与算法Python语言描述》习题第二章第一题(python版)...
  6. matlab 频率分布直方图_小猿圈Python开发之绘制频率分布直方图示例
  7. 简述台式计算机组装的基本步骤,《计算机组装与维修》期中考试试卷答案
  8. python监控服务器信息进行可视化_Python实现数据可视化,看如何监控你的爬虫
  9. opencv实现xld_halcon学习网
  10. 堆积密度怎么做_seo关键词究竟应该怎么优化