现在,Google将通过强化学习和虚拟世界来“发展”更智能的算法了!

智能设计与进化不仅仅是人们在世界观上的一个分歧。这也是人工智能社区的一个分歧。直到几年前,AI的主要用途还只是代码中的智能算法——从银行欺诈检测器到视频游戏中的自主角色。但是有了大规模的服务器支持后,机器学习AI可以像脱缰的野马一样在人们生成的数据领域里疯狂地奔驰,而且往往比人类编写的算法更快更好。

下个阶段是让算法在环境中自由运行,这些环境与真实世界非常相似,包括田野、房屋、高速公路,以及其他3D游戏可以模拟的事物。

DeepMind是Google母公司Alphabet的一部分,它与游戏软件制作商Unity Technologies(主要作品有《精灵宝可梦Go》和《纪念碑谷》等)达成了合作,在虚拟世界人工智能培训方面发展良好。为了在物理现实环境中训练算法,DeepMind将大规模地运行软件,这也是AI日益发展的一种趋势。Unity或Unreal等游戏引擎为高级AI技术提供了可自定义的设置,例如强化学习,它的算法将通过反复试验追求目标,直到达成为止。

“游戏在很多很多方面都比人们想象的更接近真实,”Unity机器学习和人工智能副总裁Danny Lange说,“你可以在视觉、身体、认知以及社交方面互动。”这些都迫切需求算法的进步,就像大自然迫使生物进化一样,他说。

除此之外,DeepMind没有在这件事上做其他评论。Unity不会透露此次合作的许多细节,比如金钱交易等。6月份Unity与DeepMind的兄弟公司Google Cloud宣布达成协议,为在线游戏开发商提供服务。

从不知道如何移动,如今这个火柴人已经学会了跑步——尽管还很笨拙(图片来自Unity Technologies)

VÉRITÉ视频

有关游戏如何训练AI有一个很可爱的例子,Lange展示了一条学习如何捡东西的虚拟狗狗。背后所有的算法只是让它知道它必须捡回那根棍子:朝着目标进步就会得到数字的奖励,这可以鼓励它朝着更大的成功前进。最初,可怜的狗狗甚至不知道怎么用腿走路。但是它会在生物学模拟的参数和物理定律的范围内不断尝试,直到这个可爱的狗狗捡回棍子。

这项技术本身并不是新技术。研究人员和各家公司利用游戏引擎来训练AI已经有一段时间了。例如,Nvidia创建了一个名为Isaac的虚拟机器人训练系统,该系统在Unity上运行与Unreal Engine相竞争,后者是游戏《城堡之夜》的基础。

自动驾驶汽车算法可以通过数十亿英里精确模拟的道路行驶来学习,这可以大大增强它们在实际驾驶中所能学到的东西。Lange对这一点十分清楚,因为他在2016年12月进入Unity之前,建立了Uber的机器学习平台。

但是,Lange对于强化学习和其他人工智能在游戏世界中可以实现的目标非常乐观。 除了机器人之外,比如还可以利用虚拟人员开发更加舒适的建筑设计。“你可以让一千个不同的虚拟家庭居住在房子里,测试不同的设计。”

通常,强化学习是指推动虚拟代理实现一个不连续的任务。但在这个例子中,角色学习的困难程度可以帮助设计师评估他们的平面图的直观程度。

Lange表示,更宏大的模拟物理学可以进行虚拟化学实验,其中软件用虚拟化学物质进行的实验远超真人实验,可以缩小实际测试的范围。Lange预测基于游戏引擎的AI可能需要大约五年的时间实现这一目标(顺便提一下,一些倡导者认为量子计算开始模拟复杂化学的时间也大约是五年)。

现实世界的游戏玩家们都知道,游戏不仅仅要模拟物理。游戏《侠盗猎车手》不仅模拟了橡胶轮胎在沥青路面上的摩擦,也模拟了各角色之间的相互作用。 “这是一个新兴领域,”Lange在谈及社会动态建模时说,“如果你模拟多个对象,而且他们可以互相交流,那么他们会发明他们之间的讲话方式。“

Lange说,这可以深入了解人群的行为方式。例如,有一种潜在的可能性——但只是理论上,我们可以模拟聊天如何影响股票价格。“一个人说股票会上涨,另一个人说这股股价会下跌,那么人群会受到怎样的影响?”

以每秒1万帧的速度在24小时内训练1千只狗狗

在自然界中,动物在行走、跑步或购买股票之前必须学会爬行。强化学习也遵循相同的逐步进展规律。Lange说:“你会觉得你只是遇到难题,然后扔过去一台计算机就行了,但这并不会带来好结果。”

相反,你必须将难题分解成难度逐步增加的任务,也就像课程学习。算法在战胜了一个挑战后,会利用它所学到的知识来战胜下一个挑战,再下一个。Lange说,Unity的虚拟狗在学会捡回棍子后,很快学会了如何跳圈。

游戏的基本原理也是同样。随着玩家等级的提升,他们需要对抗越来越大的“敌人”。在这里,“玩家”就是算法。游戏引擎的另一个好处是:它们可以自己生成关卡,2016年的游戏《无人深空》就是个典型的例子。利用Hello Games自己的内部引擎,游戏可以生成18,446,744,073,709,551,616个独一无二的行星。

我问Lange是否喜欢玩电子游戏,他犹豫了一下,然后说:“呃,我玩很多人工智能的游戏,我们对我们与DeepMind的这种关系感到非常兴奋,因为它确实表明Unity拥有的不仅仅是纯粹的游戏。这比《精灵宝可梦Go》的玩家更多。”

事实上,DeepMind利用自己的游戏引擎软件已经有一段时间了。DeepMind联合创始人兼首席执行官Demis Hassabis说:“游戏和模拟从一开始就是DeepMind研究计划的核心部分,这种方法已经在人工智能研究方面取得了重大突破。”

也许是以前作为游戏设计师的经历让Hassabis愿意与消费者游戏制造商合作,并不是所有的东西都需要内部制作。Unity和Unreal等流行的引擎在商业上的驱动下,可以开发出更好的模拟,并且他们还拥有庞大的开发者社区。

一年前,Unity还通过ML(Agents工具包)的开源软件将游戏引擎与机器学习程序相结合,并借此将AI开发扩展到公众。Lange说,参与者包括AI研究人员和一些“著名的游戏开发者”。每个人都可以利用别人开发的东西——包括Unity,这是为了利用AI来发展出更好的“非玩家角色”。

Lange表示,与DeepMind的交易不仅仅是出售软件许可证,对他来说这是一次合作。“当你构建一个游戏引擎时,它需要在iOS、Android以及Xbox上快速运行。”但Lange表示,在数千甚至数万台服务器上运行Unity以推动深度学习是一项非常不同的任务,你需要针对这些需求调整和配置Unity。

只有大规模的深度学习才能带来快速发展。Lange说:“如果训练一只狗只需要五分钟,那么这步棋根本没必要。 但是,如果我以每秒1万帧的速度在24小时内训练一千只狗,那么所有这些狗都在做各种疯狂的事情。最后,在所有的这些尝试中,终归会有一只狗跳过一个圈。

原文:https://www.fastcompany.com/90240010/deepminds-ai-will-learn-inside-unitys-video-game-worlds

作者:Sean Captain,湾区的技术、科学与政策领域的记者。

译者:弯月,责编:郭芮

Google 要在游戏世界里训练 AI 了!相关推荐

  1. 3D游戏世界里的万向节锁

    我们通常认为当前世界是一个三维的世界,用坐标系来表示就是XYZ,在3D游戏世界里也是用这样的三维坐标系来表示的. X代表水平坐标,Y代表垂直坐标,Z代表的是由屏幕往里的一个深度坐标,也就是垂直于屏幕的 ...

  2. DeepMind和Unity合作,创建虚拟世界来训练AI

    郭一璞 发自 凹非寺  量子位 报道 | 公众号 QbitAI 下围棋.打<星际2>.吃豆豆,DeepMind一直很爱"玩游戏",现在,他们要把AI扔到更沉浸的游戏世界 ...

  3. MMORPG游戏的人工智能(AI)和行为树设计

    文 / alchemistli 什么是MMORPG的AI? 玩MMORPG的地球人都知道,MMORPG的AI实在是弱智的要死.即使是在WOW这样顶级的游戏中,AI也是有限得掉渣,绝大部分NPC都像一个 ...

  4. GAMES104实录 | 如何构建游戏世界(上)

    本期为GAMES104<现代游戏引擎:从入门到实践>视频公开课文字实录第8期.本课程由GAMES(图形学与混合现实研讨会)发起,游戏引擎技术专家王希携手游戏引擎一线开发者共同研发. 课程共 ...

  5. 若说耳机世界里有一股清流,那这款QCY耳机肯定是其中之一

    ▶前言: 对于喜欢音乐的人群来说,耳机必然是最常用的音频设备.当然,耳机的用途也不仅仅是畅听音乐,用途非常广泛. 不同的使用人群.消费人群,会选择不同类型.价位的产品.其中有物超所值的.有持平性价比的 ...

  6. 分析如何用金融学的知识促进修真世界、末日世界、游戏世界等世界的社会进步

    分析如何用金融学的知识促进修真世界.末日世界.游戏世界等世界的社会进步 前言 其实好久之前就想写,但是之前没学过经济学和金融学,只知道一点点零碎的知识.现在学习了经济学和金融学,想用这些知识去开脑洞. ...

  7. Games104现代游戏引擎入门-lecture3如何构建一个游戏世界

    Games104现代游戏引擎入门-lecture3如何构建一个游戏世界 1 游戏世界的构成 2 无人机案例 3 游戏世界如何动起来 4 如何探索 5 如何管理GO 6 总结 7 Q&A 1 游 ...

  8. 数字世界里的足球——数研院探索多智能体足球AI并取得新突破

    世界杯终于回来了,经历了疫情的三年时光,全世界的球迷都尤其期盼着这个也许是人类历史上意义仅次于1948年伦敦奥运会的盛大赛事--2022卡塔尔世界杯. 1863年,英国足球协会在伦敦正式成立,标志着真 ...

  9. 过去十年,我们用了哪些即时战略游戏训练AI?

    译者 | 李梦 编辑 | Vincent AI前线出品| ID:ai-front AI 前线导语:"在 RTS 游戏中进行 AI 研究有着悠久的历史.在过去的十多年里,研究人员一直致力于构建 ...

最新文章

  1. 最新版IDEA常用配置指南,打造你的最酷IDE
  2. 禁止input输入框输入指定内容
  3. Dropout层 tf.keras.layers.Dropout() 介绍
  4. 红帽、微软和 Codenvy 联合推出语言服务器协定(Language Server Protocol,LSP)项目
  5. 【渝粤教育】广东开放大学 劳动人事争议处理法 形成性考核 (51)
  6. css3制作炫酷导航栏效果 转
  7. 工信部推动第二批“5G+工业互联网”实践的通知
  8. linux set权限,Linux 特殊权限set_uid(示例代码)
  9. python位运算符_详细介绍Python语言中的按位运算符
  10. 故宫4天门票已售罄 五一假期大家都去哪儿“看一看”了?
  11. Spring通过注解的形式 将bean以及相应的属性值 放入ioc容器
  12. MyEclipse使用经验归纳
  13. 中国大学 MOOC C语言程序设计----编程部分答案解析
  14. ROSCon 2019 机器人操作系统国际盛会
  15. python熊猫弹幕_python奇闻杂技05 爬虫初步学习+jieba分词+词云库+哔哩哔哩弹幕爬取示例(数据分析pandas)...
  16. 游戏里的角色都什么格式图片_格斗游戏拳皇里的八神庵,为什么在玩家心中人气一直都很高...
  17. mysql auto_increment 原理_MySQL auto_increment间隙问题
  18. 工程师思维是什么?芯片工程师要有哪些思维习惯?
  19. 蔡康永的201堂情商课
  20. android模拟器启动boss,传说之下boss模拟器无敌版

热门文章

  1. leetcode python3 简单题7.Reverse integer
  2. 【图像处理】MATLAB:仅有噪声的复原(空间滤波)
  3. Flutter实战一Flutter聊天应用(十)
  4. 中国1,2,4-三氟苯市场趋势报告、技术动态创新及市场预测
  5. 2021年中国超光谱成像系统(HSI)市场趋势报告、技术动态创新及2027年市场预测
  6. ajax控件扩展,22.6 扩展控件
  7. 地面指示标志_消防应急照明和疏散指示标志设置要求,图文详解
  8. 主动出击,马斯克欲用 430 亿美元拿下 Twitter
  9. 打王者、调小酒、搭乐高,大厂女程序员的别样人生!
  10. ​CSDN疯狂盲盒来啦!iPhone 12、机械键盘、Switch等你来拿!