原文链接:点击打开链接

摘要: 20世纪90年代后期,IBM深蓝(Deep Blue)研究了一系列的国际象棋算法,期望于打败当时的世界冠军加里•卡斯帕罗夫(Garry Kasparov)。终于,在1997年深蓝成功打败了卡斯帕罗夫,这是历史上计算机第一次在一对一的比赛中打败人类的世界冠军,此事在当时引起了众人极大的恐慌,由此也产生了许多在至今来看也不过时的科幻电影。

20世纪90年代后期,IBM深蓝(Deep Blue)研究了一系列的国际象棋算法,期望于打败当时的世界冠军加里•卡斯帕罗夫(Garry Kasparov)。终于,在1997年深蓝成功打败了卡斯帕罗夫,这是历史上计算机第一次在一对一的比赛中打败人类的世界冠军,此事在当时引起了众人极大的恐慌,由此也产生了许多在至今来看也不过时的科幻电影。而到了2017年,当阿尔法狗打败柯洁的消息传出来之后,众人却安心当起了吃瓜群众,并没有掀起多大的争议。我们整理了2017年在人类游戏里面被人工智能打败的游戏清单,大家一起来看一看。

20世纪50年代,提出“人工智能”概念的约翰•麦卡锡(John McCarthy)说国际象棋的角色就像是“人工智能的果蝇”,原因是前人对果蝇的研究对于基因学领域来说意义重大。所以,国际象棋成为了人工智能研究人员的眼中的一个基准。

到了21世纪早中期,科技的飞速发展使得计算机持续地在几乎所有比赛中战胜国际象棋的大师们。自然而然,人工智能的研发者们开始向其他更加复杂的游戏前进,去测试他们逐渐复杂但又十分精细的算法。在过去的十二个月里,人工智能突破了一系列的新门槛,最终成功在各种不同的游戏竞赛:从古老的围棋游戏到互动性的德州扑克,都一一战胜了人类

Going, going, gone

从尝试、进步到完成

九十年代末期,在计算机最终战胜了象棋大师后,普林斯顿大学的一位天体物理学家评论说:“计算机想要在围棋比赛中打败人类恐怕还要100年,甚至更久。”

计算机科学家们接受了这一挑战,他们将注意力转移到了这一古老的中国策略游戏,它看起来简单至极,但想要参透其中的精髓却非常复杂。

过去十年机器学习的发展培育了真正具有竞争力的人工智能围棋选手。2014年,谷歌开始研发一种叫阿法狗(AlphaGo)的深度学习神经网络。两三年后,在围棋游戏挑战接近成功时,开发小组开始尝试一些新的东西。

2016年末,一个神秘的在线围棋玩家“Master”出现在了弈城围棋网(Tygem)。接在下来短短的几天时间内,许多世界顶级选手都败给了这位神秘玩家。2017年1月4号,“神秘玩家”被正式确认,其就是DeepMind人工智能阿法狗的最新版。

2017年5月,阿法狗“Master”向围棋世界等级分第一的柯洁发起挑战。三次比赛阿法狗都完胜这位世界冠军。而且,最令人吃惊的是十月份谷歌宣布研发出比“Master”更复杂精准的AlphaGo版本。

Deepmind在《自然》(Nature)发布论文,报告了他们的最终版围棋程序AlphaGo Zero,这是一个能够完全自学围棋具有革命性意义的算法。不论何种游戏,只要告诉系统这个游戏的基本规则,它就能通过不断的自我对弈学习最终掌握游戏的核心。在21天的学习之后,AlphaGo Zero达到了大师级别。40天后它超越了之前所有的版本。

2017年12月,DeepMind又推出了一个叫AlphaZero的更新版本。这个新的人工智能可以在短短几小时内迅速学习掌握各种游戏。在仅仅八小时的自我学习后,这个更新版本系统不但能打败先前的AlphaGo Zero,还能成为国际象棋的大师和日本象棋冠军。

掌握虚张声势

虽然围棋提供了一个复杂环境的游戏,但掌握扑克游戏给了人工智能一个完全不同的命题。要想在扑克游戏中大胜,需要掌握欺骗的艺术。虚张声势和识别虚张声势在臭名昭著的纸牌游戏中是取胜的关键。

经过十多年的尝试,2017年出现的两个独立的研究证明了人工智能终于可以战胜顶尖扑克选手。艾伯塔大学的DeepStack展示了一个人工智能系统,它可以用人工智能式的“直觉”来全面战胜人类玩家。

卡内基梅隆大学的一个团队在2017年1月举行了更加公开的比赛,他们的Libratus人工智能系统花费了20天与4名专业扑克选手进行了120,000场无限下注德州扑克。虽然职业选手每晚都在讨论这套系统的弱点,但Libratus也在每天不断自我改进,在游戏中修补漏洞并改进策略。

人类大脑确实难以与机器难以抗衡。经过一个月的全天候游戏,Libratus增加了170万美元,每名专业选手却损失了数千美元的虚拟赌注。一名失利选手在比赛中途对Wired杂志说道:“与它比赛就像能看到我的手牌一样,我甚至以为自己是在和一个作弊的人比赛。”

伊隆•马斯克的人工智能实验

2015年,伊隆•马斯克和一小部分投资者成立了OpenAI组织。该项目旨在探索人工智能系统的发展,并特别关注强化学:让机器自己教自己如何针对特定任务进行改进。

2017年8月,OpenAI团队着眼于征服刀塔2(大型电子竞技锦标赛“The International”的核心游戏)。

在通过短短两周学习后,OpenAI机器人在比赛中被祭了出来,随后其击败了几个世界顶尖选手。虽然人工智能系统只是在简单的一对一版上进行了训练,但OpenAI团队正在教系统如何在五对五团队游戏中取胜。

分而治之:吃豆人挑战

几年前,谷歌的DeepMind在49个Atari 2600游戏中设置了自己的人工智能。虽然人工智能赢了很多游戏,但有的确实难以掌握,比如80年代经典的电子游戏吃豆人就让人工智能束手无策。

2017年,一家名为Maluuba的深度学习初创公司被谷歌收购,随后被并入了DeepMind。Maluuba的新机器学习方法被成为“混合奖励框架”(HRA)。将这种方法应用到吃豆人游戏的上面,发现该系统创建了超过150个单独代理,每个代理都负责具体目标:例如寻找特定的药丸或躲避鬼魂。

另外,HRA会产生一个类似于高级经理的顶级代理,这位顶级代理会在做出个人行动前,评估下级代理人的建议,这被称为“分而治之”,一个复杂的人物被分解成了更小的部分。人工智能把这一方法应用到吃豆人上面之后,很快取得了一个出人意料的结果:人工智能拿到了999990的惊人高分。

人工智能将会很快开始创造游戏

当人工智能几乎在所有游戏中打败我们之后,按照逻辑来思考,下一步将会如何发展呢?

一位来自法尔茅斯大学的研究人员最近展示了一种机器学习算法,他声称这种算法可以自己制造新的游戏让我们来玩。他给这一人工智能系统命名为Angelina,Angelina每天都在自我更新,现在它可以通过维基共享资源、网上的报纸和社交媒体等多种数据库摘取信息去制造新的游戏。

这意味着什么?

在2017年,最显著并且可怕的地方就是强化学习方面的巨大进展,因为这些系统可以高效地自我学习并去掌握新的技能。比如最新版的 AlphaZero就可以在短短几天的自我学习时间里在一些游戏竞赛中超过人类现有的水平。

对350名人工智能研究者的调查显示,用不了多久人工智能就可以打败一切。调查预测10年内人工智能会比我们做得更好,到2049年它就可以写出畅销小说了,而到了2053年,就可以代替人来做手术。而且,这份调查的结论是:到2060年,有一半的几率人工智能会把人类的全部工作做完,并且会做得更好。

2017年无疑是人工智能在越来越复杂的游戏中战胜人类的里程碑,虽然这看起来微不足道,但其影响力十分深远。甚至于这些人工智能开发公司已经着眼于现实世界的挑战,谷歌DeepMind已经将AlphaGo Zero系统从游戏转移到蛋白质折叠研究中,希望找到阿尔兹海默症和帕金森症等疾病的治疗方法。

“本质上我们希望利用这些算法上的突破去帮助解决各种紧迫的现实问题。”DeepMind联合创始人兼首席执行官杰米斯•哈萨比斯说。“如果相似的技术可以被应用于其他的结构性问题,例如蛋白质折叠,减少能源损耗或寻找革命性的新材料,研究结果可能会更新人类的认知,我们的生活也会产生积极的影响。”

2017败北清单:人工智能在这些游戏中战胜了人类相关推荐

  1. 人工智能(AI)在游戏中的应用(下)

    再回来看异形AI 我们知道,异形AI是控制异形行为的系统.它永远不会从管理者AI哪里得到有关玩家位置的信息.它会得到的信息包括大概在什么位置进行搜寻.剩下就只能靠自己来找到玩家了.它确实有一些工具可以 ...

  2. 人工智能(AI)在游戏中的应用(上)

    AI在视频游戏中的应用 副标题:游戏AI技术的发展现状以及在视频游戏领域的应用概览 (原作者:)Written by Laura E. Shummon Maass and Andy Luc 大多数人可 ...

  3. 德州python培训_人工智能在多人桌德州扑克比赛中战胜世界顶尖选手

    新华社华盛顿7月11日电(记者周舟)美国卡内基-梅隆大学11日宣布,该校和脸书公司合作开发的人工智能Pluribus在六人桌德州扑克比赛中击败多名世界顶尖选手,成为机器在多人游戏中战胜人类的一个里程碑 ...

  4. 【清华伯克利】提出全新算法RPG,通过奖励随机化发现多智能体游戏中多样性策略行为。

    深度强化学习实验室 官网:http://www.neurondance.com/ 论坛:http://deeprl.neurondance.com/ 作者:本文转载自机器之心 编辑.排版:DeepRL ...

  5. OpenAI在Dota 2游戏中虽败犹荣

    就在上周,人类对机器人进行了反击.实际上是在视频游戏中打败了他们. 在一场三强争霸赛中,两支职业战队打败了伊隆·马斯克创建的研究实验室OpenAI开发的人工智能机器人.他们所玩的Dota 2(刀塔:守 ...

  6. 《百面机器学习》试读 | AI热门应用之游戏中的人工智能

    小编温馨提示 首先掌声恭喜上周第五个留言获得福利的幸运小伙伴 @羊????????????,请通过后台联系我们,我们会将奖品尽快寄出噢- 铛铛铛,本周将会连载<百面机器学习>人工智能领域热 ...

  7. 人工智能在《LOL王者荣耀》游戏中的角色

    近期LOL和王者荣耀游戏已经充斥着真个朋友圈,但是谁又知道在火热的游戏进行中,又有一批批IT男在完成另一项重要的任务,那就是利用深度学习的知识去完成游戏直播的智能化,给现场欣赏比赛的观众不一样的感受. ...

  8. 自然语言处理技术(NLP)在推荐系统中的应用 原2017.06.29人工智能头条 作者: 张相於,58集团算法架构师,转转搜索推荐部负责人,负责搜索、推荐以及算法相关工作。多年来主要从事推荐系统以及机

    自然语言处理技术(NLP)在推荐系统中的应用 原2017.06.29人工智能头条 作者: 张相於,58集团算法架构师,转转搜索推荐部负责人,负责搜索.推荐以及算法相关工作.多年来主要从事推荐系统以及机 ...

  9. 大学生能从计算机游戏中受益,2017年12月英语四级作文范文:大学生玩游戏

    2017年12月英语四级作文范文:大学生玩游戏 [题目] Directions: For this part, you are allowed 30 minutes to write a compos ...

最新文章

  1. 最大子序列求和_最大子序列和问题
  2. 【转】DICOM的常用Tag分类和说明!!!!
  3. 习题:Dual Matrices(思路题/分治)
  4. 为什么Visual Studio的安装目录下有名为1033或2052的文件夹?
  5. Python入门--个数可变的位置参数和关键字参数
  6. pyspark指定schema
  7. java的package需要大写吗,java 数字转大写的小程序
  8. 短视频解析技术原理,去水印原理分析整理汇总
  9. 02 - Redis源码结构介绍
  10. 解决笔记本键盘禁用失败问题
  11. D - Sleepy Game
  12. 纳斯达克对经济泡沫的定义是:当交易价格远大于内在价值的时候,就称为泡沫(转)...
  13. ctor c语言,一步步分析-C语言如何面向对象编程
  14. 使用XMind打开.mmap文件不显示问题
  15. sendgrid html text,Laravel + SendGrid htmlspecialchars()期望参数1为字符串,给定对象
  16. 【opencv4.3.0教程】06之基础结构3之Scalar_结构详解
  17. 从三大行业看大数据应用的三重境界:数据、分析、成果
  18. 【权限维持】Windows自启动映像劫持粘滞键辅助屏保后门WinLogon
  19. autojs教程,启点科技自动脚本代码
  20. IPV6地址-格式和讲解

热门文章

  1. php股票价格实时刷新,使用ajax技术无刷新动态调用新浪股票实时数据
  2. vue 复选框默认选中_vue 实现单选框设置默认选中值
  3. 微信小程序教程(搭建简单的小程序示例)
  4. 【问题】如何避免并发情况下的重复提交
  5. error: refs/stash does not point to a valid object
  6. 可解释性(1)—— lstm可视化工具LSTMVis
  7. 算法修炼之练气篇(Python版)——练气一层初期
  8. Spring Boot SpotBugs
  9. Windows Practice_文件_文件分割器(二)
  10. 白头发越来越多怎么办?30多岁白头发越来越多怎么办?