DeepMind《星际争霸2》AI碾压人类遭Gary Marcus猛怼：通用智能就是空谈

来源：新智元

本文3635字，建议阅读10分钟。

本文介绍了Marcus对AI碾压人类以及未来通用智能研究意义的质疑。

针对DeepMind前几日发布的《星际争霸2》智能体AlphaStar进化版，他在Twitter再次提出了自己的质疑。不过这次，Marcus的质疑点并不是AlphaStar游戏表现本身，而是指向了更高的层面：对未来通用智能研究的意义。

Marcus在Twitter上表示：

DeepMind最近的《星际争霸2》 AlphaStar取得了很不错的结果，但这能称得上通向通用智能的重要一步吗？这里有几个问题：

星际争霸要比Atari游戏难得多，这次DeepMind推出的新版Alphastar性能比1月份那版强力了很多，与真实世界中的玩家实现了复杂场景交互中的对战。但是：

1、在不经修改的情况下，AlphaStar能制霸其他游戏吗？虽然AlphaStar的雏形继承了击败围棋世界冠军的AlphaZero，但此次发布的模型是高度结构化的，其中单位、表示和训练域等要素都是高度针对《星际争霸2》开发并调试的。

2、对AlphaStar专有模型的训练，能否降低和《星际争霸2》类似的策略游戏AI的训练时间？比如《魔兽争霸3》？人类玩家是可以进行这种跨游戏的“经验转移“的。

3、游戏内的AlphaStar对于不同地图、不同种族都能胜任吗？人类玩家至少会擅长多张地图和不止一个种族。

4、只凭借大量人类精英玩家生成的数据，AlphaStar的未来迭代版本还能保持成功吗？系统所需的大量“replay”数据在现实世界中可能很难获取。

5、人类专业知识对于AlphaStar有多重要？2017年，DeepMind推出了AlphaZero因为宣称“无需任何人类知识”而引发大量关注，此次AlphaStar的成功离不开在《星际争霸2》的人类知识和真人对战的演示视频。也许现在是时候承认人类知识的重要价值了。

6、在《星际争霸》领域表现优异的AlphaStar，能否同样在其他开放端领域同样出色？如自然语言理解，该领域的句子范围基本上是无限的。

和上一次对OpenAI魔方机器手的“开炮”相比，本次的6点问题在语气上和深度上都弱了不少。产生的影响似乎也没有上次那么广泛了。毕竟DeepMind这次发布的AlphaStar是一款游戏AI，对于泛化性能也不是重点，只是在博客中提了一嘴。

从Twitter的网友回复中，也可以看出这一点。大部分网友认为Marcus说的有一定道理，但其实DeepMind在博客中已经承认，不利用人类的先验知识，几乎是不可能成功的。

还有网友表示，其实星际争霸这个游戏，精通多个种族可不是一件容易的事情，比如他自己，就只会玩人族，其它两个种族就是菜。

还有网友提出了新的问题：AlphaStar对战斗单位的强度修正（加强和削弱）的变化能做出有效应对吗？如果一些单位完全被移除，又会出现什么情况？

不过，这条Twitter目前为止热度一般，回复和讨论比前些日子Marcus质疑OpenAI"魔方机械手”时的热度差了不少。

到目前为止，DeepMind还没有做出回应。

DeepMind的《星际争霸2》游戏AI “AlphaStar”碾压99.8%人类玩家

接下来给大家补充一下剧情，马库斯这次质疑的DeepMind研究到底是什么。

今年1月，DeepMind的《星际争霸2》游戏AI “AlphaStar”初级版本的发布曾引发广泛关注。当时AlphaStar使用神族挑战了《星际争霸2》中的两个专业玩家并获得了胜利。

时隔9个多月，AlphaStar进化成为完全版，并实现了在战网真实对战中的宗师级水平，分位超过了99.8%的人类玩家。刊载相关成果的论文已发表在Nature上。

论文地址：

https://www.nature.com/articles/s41586-019-1724-z

DeepMind在近日发布了博客中特意将新版AlphaStar与旧版做了对比。具体来说，此次的“完全体AlphaStar”与旧版有4点主要区别：

1、 AlphaStar现在和人类在相同的限制条件下游戏，包括通过摄像头观察世界，对其动作操作频率也作出了更严格的限制，不会再发生APM高到离谱的现象。

2、 AlphaStar现在可以使用游戏中三个种族（人族、虫族、神族）的任意一种与人类玩家进行1v1对战，而不是像1月份时那样只会用神族。使用每个种族的智能体都是一个单独的神经网络。

3、智能体在战网中的训练是完全自动化的，开始只由监督学习训练，而不像原来那样凭借过去的游戏经验进行训练学习。

4、此次AlphaStar在暴雪官方战网和游戏服务器上进行游戏，使用的是和人类玩家相同的地图和条件。

DeepMind表示，新版AlphaStar智能体采用通用机器学习技术，包括神经网络、通过强化学习的自对战、多智能体学习、模仿学习等技术。利用这些技术，新版AlphaStar的游戏水平超过了战网99.8%的活跃玩家，使用三个种族都拿到了宗师级称号。

马库斯：深度学习怀疑论者，曾质疑OpenAI“单手解魔方”

Gary Marcus

加里 · 马库斯 (Gary Marcus) 是一位科学家、畅销书作家和企业家。他是 Robust.AI 公司的创始人和首席执行官，Geometric Intelligence 公司 (2016 年被优步收购) 的创始人兼首席执行官，出版著作包括《代数思维》、《怪诞脑科学 (Kluge)》、《思维的诞生》等，最新著作是与 Ernest Davis 合著的《Rebooting AI : 构建我们可以信任的人工智能》。

马库斯也是著名的深度学习怀疑论者。作为认知心理学家，他一直高调参与人工智能辩论，与 Yann LeCun、AAAI 前主席 Thomas Dietterich 等 AI 大牛都展开过激烈辩论。

在那篇批判深度学习的文章中，马库斯概括了深度学习的十大挑战，直言深度学习本身虽然有用，但它不可能实现通用人工智能。他建议把深度学习视为 “一种非普遍的解决方法，而只是一种工具。”

他说：“相比纯粹的深度学习，我呼吁混合模型，不仅包括深度学习的监督形式，还包括其他技术，例如符号处理（symbol-manipulation），以及无监督学习（它本身也可能被重新概念化）。我也敦促社区考虑将更多的内在结构纳入 AI 系统。”

就在前不久，马库斯对OpenAI“单手解魔方”提出质疑，认为 OpenAI 还原魔方的博客内容存在误导性，并表示：“鉴于 OpenAI 仍然没有更改关于 “解决魔方” 的误导性博客帖子 (博客标题是 “Solving Rubik’s Cube with a Robot Hand)，所以我附上了详细的分析，将他们的说法和暗示与实际所做的进行了比较。依我之见，这些误导性对大多数对非专业人士来说并不明显。”

马库斯对 OpenAI“解决魔方” 的 7 条质疑如下：

1、这不是神经网络解决的；而是有 17 年历史的符号算法做到的。

2、这种算法是先天的，而不是学习的。

3、强化学习在选择转向哪个方向 (即大多数人所说的解决了魔方) 时不起作用。

4、所学到的是物体操纵，而不是解魔方。

5、只有一个物体被操纵，并且没有测试对其他对象的可推广性。

6、该物体装配了大量仪器 (如蓝牙传感器)，机器手也安装了 LED。

7、成功率只有 20%；魔方经常从机器人手中掉落。

他说：“我强调一下，这个成果本身给人留下了深刻的印象，但描述有误导，更恰当的标题应该是’用强化学习操纵魔方’或‘灵巧的机器人手操纵物体的进展” 或类似的句子。”

OpenAI 联合创始人、机器人团队负责人 Woj Zaremba 注意到马库斯的帖子，反驳道：

1. 你的前三个论点是一样的。

2. 泛化是从模拟到现实，而不是从一个物体到另一个物体。

3. 我们没有装配仪器得到的结果稍微弱一些。

4. 你确信我们不会将性能提升到 100% 吗？

马库斯回应道：

1. 我的前两个论点完全不同：先天性≠象征性。这些是不同的。第三个论点有一点重叠，但并不明显。

2. 我当然知道，但是为了稳健性，你需要推广到新物体上

3&4：我期待看到其他结果；我相信你们最终会做得更好。

尽管是马库斯率先提出质疑，但不少人的回复并不赞同马库斯的说法，有人回复道：

“这是一个有缺陷的批评，基于对魔方的误解。魔方不是像围棋那样是一种可以学习的任务，而是需要记忆解法和熟练操作的任务；人类玩魔方也遵循一种算法。”

马库斯仍表示：总的来说，他们 (OpenAI) 没有对我的观点做出回应，我的观点是那篇博客的框架与论文的内容不相符合，虽然我同意这个工作很重要，但炒作是有误导性的。

抱着质疑和批判的态度去看待每一项研究，你支持马库斯吗？

编辑：尹传儒

校对:黄利

DeepMind《星际争霸2》AI碾压人类遭Gary Marcus猛怼：通用智能就是空谈相关推荐

Google DeepMind顾问预言：五年后AI将在《星际争霸》中战胜人类
在纽芬兰和拉布拉多,正在用人工智能进行<星际争霸>比赛. <星际争霸>的幽灵机器人.(来自:维基共享资源) 接下来的两个星期里,在纪念大学(Memorial Universit ...
星际争霸2 AI 强化学习环境部署
星际争霸2 AI 强化学习环境部署 PySC2是DeepMind开发的星际争霸Ⅱ学习环境(SC2LE)的Python组件. 它封装Blizzard Entertainment的星际争霸Ⅱ机器学习API ...
java 写的星际争霸_用java写星际争霸的ai
一直有这个想法很久了.以前也知道可以用BWAPI这个API写星际争霸的ai.但是直接用那个的话一直没调试好,各种版本都搭配不好然后导致星际崩溃,C++又不是很懂只得作罢. 幸好最近发现了这个网站:ht ...
AlphaStar星际争霸10:1绝杀人类；苹果自动驾驶大裁员 | AI一周热闻
华为发布5G芯片天罡和巴龙5000 创新奇智完成超4亿人民币A轮和A+轮融资苹果裁撤自动驾驶项目员工 200 余人特斯拉揭秘"克隆行为"技术细节亚马逊推出机器人Scout,进 ...
AlphaStar的游戏——星际争霸2 AI综述
两天前,DeepMind直播展示了他们星际2AI的最新进展.AI名叫Alphastar,它在与两位职业选手的比赛录像中获得了全胜,其中一位还是世界前10的顶尖神族选手Mana.在与Mana最后一场万众 ...
DeepMind:星际争霸2：强化学习新挑战（论文翻译）
星际争霸2:强化学习新挑战原文下载链接:https://deepmind.com/documents/110/sc2le.pdf 整个论文分为: 摘要(Abstract) 1.介绍(Introduc ...
DeepMind:星际争霸2：强化学习新挑战（翻译）
DeepMind:StarCraftII:A New Challenge for Reinforcement Learning 星际争霸2:强化学习新挑战原文下载链接:https://deepmin ...
DeepMind星际争霸2开源机器学习平台
DeepMind 之前开源了<星际争霸2>的深度强化学习平台,这是个很好的训练环境,学起来也很有趣.下面是一份有关设置环境和训练模型的教程,基于Mac环境.我们会跑一遍训练脚本,使用Dee ...
Deepmind星际争霸2平台使用第一轮-完成采矿
这篇博文简单的介绍PySC2的基本使用以及分析一份网友提供的代码(使用DQN来让计算机玩星际2). ##1-PySC2 ## Deepmind公布的这段python与PySC2通信的源码主要包含以下的 ...

DeepMind《星际争霸2》AI碾压人类遭Gary Marcus猛怼：通用智能就是空谈

DeepMind《星际争霸2》AI碾压人类遭Gary Marcus猛怼：通用智能就是空谈相关推荐

最新文章

热门文章