来源:新智元

本文3635,建议阅读10分钟
本文介绍了Marcus对AI碾压人类以及未来通用智能研究意义的质疑。

针对DeepMind前几日发布的《星际争霸2》智能体AlphaStar进化版,他在Twitter再次提出了自己的质疑。不过这次,Marcus的质疑点并不是AlphaStar游戏表现本身,而是指向了更高的层面:对未来通用智能研究的意义

Marcus在Twitter上表示:

DeepMind最近的《星际争霸2》 AlphaStar取得了很不错的结果,但这能称得上通向通用智能的重要一步吗?这里有几个问题:

星际争霸要比Atari游戏难得多,这次DeepMind推出的新版Alphastar性能比1月份那版强力了很多,与真实世界中的玩家实现了复杂场景交互中的对战。但是:

1、在不经修改的情况下,AlphaStar能制霸其他游戏吗?虽然AlphaStar的雏形继承了击败围棋世界冠军的AlphaZero,但此次发布的模型是高度结构化的,其中单位、表示和训练域等要素都是高度针对《星际争霸2》开发并调试的。

2、对AlphaStar专有模型的训练,能否降低和《星际争霸2》类似的策略游戏AI的训练时间?比如《魔兽争霸3》?人类玩家是可以进行这种跨游戏的“经验转移“的。

3、游戏内的AlphaStar对于不同地图、不同种族都能胜任吗?人类玩家至少会擅长多张地图和不止一个种族。

4、只凭借大量人类精英玩家生成的数据,AlphaStar的未来迭代版本还能保持成功吗?系统所需的大量“replay”数据在现实世界中可能很难获取。

5、人类专业知识对于AlphaStar有多重要?2017年,DeepMind推出了AlphaZero因为宣称“无需任何人类知识”而引发大量关注,此次AlphaStar的成功离不开在《星际争霸2》的人类知识和真人对战的演示视频。也许现在是时候承认人类知识的重要价值了。

6、在《星际争霸》领域表现优异的AlphaStar,能否同样在其他开放端领域同样出色?如自然语言理解,该领域的句子范围基本上是无限的。

和上一次对OpenAI魔方机器手的“开炮”相比,本次的6点问题在语气上和深度上都弱了不少。产生的影响似乎也没有上次那么广泛了。毕竟DeepMind这次发布的AlphaStar是一款游戏AI,对于泛化性能也不是重点,只是在博客中提了一嘴。

从Twitter的网友回复中,也可以看出这一点。大部分网友认为Marcus说的有一定道理,但其实DeepMind在博客中已经承认,不利用人类的先验知识,几乎是不可能成功的。

还有网友表示,其实星际争霸这个游戏,精通多个种族可不是一件容易的事情,比如他自己,就只会玩人族,其它两个种族就是菜。

还有网友提出了新的问题:AlphaStar对战斗单位的强度修正(加强和削弱)的变化能做出有效应对吗?如果一些单位完全被移除,又会出现什么情况?
不过,这条Twitter目前为止热度一般,回复和讨论比前些日子Marcus质疑OpenAI"魔方机械手”时的热度差了不少。
到目前为止,DeepMind还没有做出回应。

DeepMind的《星际争霸2》游戏AI “AlphaStar”碾压99.8%人类玩家

接下来给大家补充一下剧情,马库斯这次质疑的DeepMind研究到底是什么。

今年1月,DeepMind的《星际争霸2》游戏AI “AlphaStar”初级版本的发布曾引发广泛关注。当时AlphaStar使用神族挑战了《星际争霸2》中的两个专业玩家并获得了胜利。

时隔9个多月,AlphaStar进化成为完全版,并实现了在战网真实对战中的宗师级水平,分位超过了99.8%的人类玩家。刊载相关成果的论文已发表在Nature上。

论文地址:

https://www.nature.com/articles/s41586-019-1724-z

DeepMind在近日发布了博客中特意将新版AlphaStar与旧版做了对比。具体来说,此次的“完全体AlphaStar”与旧版有4点主要区别:

1、  AlphaStar现在和人类在相同的限制条件下游戏,包括通过摄像头观察世界,对其动作操作频率也作出了更严格的限制,不会再发生APM高到离谱的现象。

2、  AlphaStar现在可以使用游戏中三个种族(人族、虫族、神族)的任意一种与人类玩家进行1v1对战,而不是像1月份时那样只会用神族。使用每个种族的智能体都是一个单独的神经网络。

3、  智能体在战网中的训练是完全自动化的,开始只由监督学习训练,而不像原来那样凭借过去的游戏经验进行训练学习。

4、  此次AlphaStar在暴雪官方战网和游戏服务器上进行游戏,使用的是和人类玩家相同的地图和条件。

DeepMind表示,新版AlphaStar智能体采用通用机器学习技术,包括神经网络、通过强化学习的自对战、多智能体学习、模仿学习等技术。利用这些技术,新版AlphaStar的游戏水平超过了战网99.8%的活跃玩家,使用三个种族都拿到了宗师级称号。


马库斯:深度学习怀疑论者,曾质疑OpenAI“单手解魔方”

Gary Marcus

加里 · 马库斯 (Gary Marcus) 是一位科学家、畅销书作家和企业家。他是 Robust.AI 公司的创始人和首席执行官,Geometric Intelligence 公司 (2016 年被优步收购) 的创始人兼首席执行官,出版著作包括《代数思维》、《怪诞脑科学 (Kluge)》、《思维的诞生》等,最新著作是与 Ernest Davis 合著的《Rebooting AI : 构建我们可以信任的人工智能》。

马库斯也是著名的深度学习怀疑论者。作为认知心理学家,他一直高调参与人工智能辩论,与 Yann LeCun、AAAI 前主席 Thomas Dietterich 等 AI 大牛都展开过激烈辩论。

在那篇批判深度学习的文章中,马库斯概括了深度学习的十大挑战,直言深度学习本身虽然有用,但它不可能实现通用人工智能。他建议把深度学习视为 “一种非普遍的解决方法,而只是一种工具。”

他说:“相比纯粹的深度学习,我呼吁混合模型,不仅包括深度学习的监督形式,还包括其他技术,例如符号处理(symbol-manipulation),以及无监督学习(它本身也可能被重新概念化)。我也敦促社区考虑将更多的内在结构纳入 AI 系统。”

就在前不久,马库斯对OpenAI“单手解魔方”提出质疑,认为 OpenAI 还原魔方的博客内容存在误导性,并表示:“鉴于 OpenAI 仍然没有更改关于 “解决魔方” 的误导性博客帖子 (博客标题是 “Solving Rubik’s Cube with a Robot Hand),所以我附上了详细的分析,将他们的说法和暗示与实际所做的进行了比较。依我之见,这些误导性对大多数对非专业人士来说并不明显。”

马库斯对 OpenAI“解决魔方” 的 7 条质疑如下:

1、这不是神经网络解决的;而是有 17 年历史的符号算法做到的。

2、这种算法是先天的,而不是学习的。

3、强化学习在选择转向哪个方向 (即大多数人所说的解决了魔方) 时不起作用。

4、所学到的是物体操纵,而不是解魔方。

5、只有一个物体被操纵,并且没有测试对其他对象的可推广性。

6、该物体装配了大量仪器 (如蓝牙传感器),机器手也安装了 LED。

7、成功率只有 20%;魔方经常从机器人手中掉落。

他说:“我强调一下,这个成果本身给人留下了深刻的印象,但描述有误导,更恰当的标题应该是’用强化学习操纵魔方’或‘灵巧的机器人手操纵物体的进展” 或类似的句子。”

OpenAI 联合创始人、机器人团队负责人 Woj Zaremba 注意到马库斯的帖子,反驳道:

1. 你的前三个论点是一样的。

2. 泛化是从模拟到现实,而不是从一个物体到另一个物体。

3. 我们没有装配仪器得到的结果稍微弱一些。

4. 你确信我们不会将性能提升到 100% 吗?

马库斯回应道:

1. 我的前两个论点完全不同:先天性≠象征性。这些是不同的。第三个论点有一点重叠,但并不明显。

2. 我当然知道,但是为了稳健性,你需要推广到新物体上

3&4:我期待看到其他结果;我相信你们最终会做得更好。

尽管是马库斯率先提出质疑,但不少人的回复并不赞同马库斯的说法,有人回复道:

“这是一个有缺陷的批评,基于对魔方的误解。魔方不是像围棋那样是一种可以学习的任务,而是需要记忆解法和熟练操作的任务;人类玩魔方也遵循一种算法。”

马库斯仍表示:总的来说,他们 (OpenAI) 没有对我的观点做出回应,我的观点是那篇博客的框架与论文的内容不相符合,虽然我同意这个工作很重要,但炒作是有误导性的。

抱着质疑和批判的态度去看待每一项研究,你支持马库斯吗?

编辑:尹传儒

校对:黄利


DeepMind《星际争霸2》AI碾压人类遭Gary Marcus猛怼:通用智能就是空谈相关推荐

  1. Google DeepMind顾问预言:五年后AI将在《星际争霸》中战胜人类

    在纽芬兰和拉布拉多,正在用人工智能进行<星际争霸>比赛. <星际争霸>的幽灵机器人.(来自:维基共享资源) 接下来的两个星期里,在纪念大学(Memorial Universit ...

  2. 星际争霸2 AI 强化学习环境部署

    星际争霸2 AI 强化学习环境部署 PySC2是DeepMind开发的星际争霸Ⅱ学习环境(SC2LE)的Python组件. 它封装Blizzard Entertainment的星际争霸Ⅱ机器学习API ...

  3. java 写的星际争霸_用java写星际争霸的ai

    一直有这个想法很久了.以前也知道可以用BWAPI这个API写星际争霸的ai.但是直接用那个的话一直没调试好,各种版本都搭配不好然后导致星际崩溃,C++又不是很懂只得作罢. 幸好最近发现了这个网站:ht ...

  4. AlphaStar星际争霸10:1绝杀人类;苹果自动驾驶大裁员 | AI一周热闻

    华为发布5G芯片天罡和巴龙5000 创新奇智完成超4亿人民币A轮和A+轮融资 苹果裁撤自动驾驶项目员工 200 余人 特斯拉揭秘"克隆行为"技术细节 亚马逊推出机器人Scout,进 ...

  5. AlphaStar的游戏——星际争霸2 AI综述

    两天前,DeepMind直播展示了他们星际2AI的最新进展.AI名叫Alphastar,它在与两位职业选手的比赛录像中获得了全胜,其中一位还是世界前10的顶尖神族选手Mana.在与Mana最后一场万众 ...

  6. DeepMind:星际争霸2:强化学习新挑战(论文翻译)

    星际争霸2:强化学习新挑战 原文下载链接:https://deepmind.com/documents/110/sc2le.pdf 整个论文分为: 摘要(Abstract) 1.介绍(Introduc ...

  7. DeepMind:星际争霸2:强化学习新挑战(翻译)

    DeepMind:StarCraftII:A New Challenge for Reinforcement Learning 星际争霸2:强化学习新挑战 原文下载链接:https://deepmin ...

  8. DeepMind星际争霸2开源机器学习平台

    DeepMind 之前开源了<星际争霸2>的深度强化学习平台,这是个很好的训练环境,学起来也很有趣.下面是一份有关设置环境和训练模型的教程,基于Mac环境.我们会跑一遍训练脚本,使用Dee ...

  9. Deepmind星际争霸2平台使用第一轮-完成采矿

    这篇博文简单的介绍PySC2的基本使用以及分析一份网友提供的代码(使用DQN来让计算机玩星际2). ##1-PySC2 ## Deepmind公布的这段python与PySC2通信的源码主要包含以下的 ...

最新文章

  1. VS2005相关----整理起始页面板
  2. 1.Power Designer 由数据库反向生成pdm文件
  3. 小时候糖吃多了,长大后记性会变差| Nature子刊最新研究
  4. 百兆以太网传输距离_新品推荐 16+2G口百兆/千兆监控接入型非标PoE交换机!
  5. 【opencv】17.提取RBG各种颜色c++代码
  6. 有n个人围成一圈,按顺序从1到n编号。从第一个人开始报数
  7. c# 标准正太分布函数_机器学习中常见的几种概率分布
  8. 关于DataAdapter打开和关闭连接
  9. python发送邮件-实操记录-发送一封普通的邮箱
  10. 佳能fax_l150如何打印_佳能faxl150说明书下载
  11. angular学习笔记
  12. IDEA插件推荐:Material Theme UI(把IDEA变得更加美观)
  13. 设计模式(2)-抽象工厂模式(Abstract Factory)与生成器模式(Builder)模式
  14. 基于java web的实验室设备管理系统的设计与实现
  15. 删除在计算机的没用东西,怎么删除电脑中没用的东西?
  16. 英语口语网站免费学习资源大全
  17. homepod怎么设置为中文_HomePod终于能听懂中文了,但它真能搞定智能家居吗?
  18. hls视频流_HLS视频流:它是什么,以及何时使用它
  19. 主要是web开发和android开发 最好是选择一个方向先专一去学, 半瓶子醋什么都想学你会发现到最后什么都不会,或者比别人多花出了太多的精力 我曾经学java的时候好高骛远,因为当时老师是一个c+
  20. 天边一朵云-书画双绝

热门文章

  1. 从一个资深面试官角度看Java面试:面试了20家大厂与面试了上百人之后,发现这样介绍项目经验,显得项目很牛逼!
  2. python文件管理_python——文件管理
  3. 寒假算法训练1-J(分棍子,求最长棍子的数量,另外学习map的排序方法)
  4. 怎样快速对二进制和十进制进行互转化——IP地址规划与设计总结
  5. 【前端页面缓存技术方案】
  6. 计算机辅助手段在英语教学中使用,试谈计算机在英语教学中的辅助作用
  7. Android 发展史:“吃货”就是这么练成的
  8. 程序员:品《漱玉词》看李清照生活审美
  9. java计算时间差(耗时计算)的三种方式
  10. Activiti进阶