12月13日消息,据外媒报道,谷歌DeepMind和多伦多大学的研究人员在NeurIPS 2019会议上介绍了AI “Dreamer”,可以通过已知世界模型在新环境中对视觉图像的运动方式进行预测。Dreamer在观察到图像运动方式时,会先构想出一些可能的动作,然后判断这些构想动作可能得到的奖励,根据奖励来最终预测动作。

研究人员表示,Dreamer利用了与上一代PlaNet相比,达到相同性能的训练时间缩短了将近一半。并且这种训练方式将来可能在视觉复杂度更高的环境中得以应用。以下是对Venturebeat相关报道的原文编译。

一、运用了“想象力”的Dreamer

一些AI系统通过借助过去经验所提供的世界信息,可以在具有挑战性的环境中实现目标。他们把这些概括为新的情况(novel situations),这使他们在没有遇到过的设置环境中也可以完成目标。

事实证明,强化学习(reinforcement learning)这种利用奖励来推动软件策略朝着目标前进的培训技术,特别适合于学习总结AI经验的世界模型(world models),并通过扩展(extension)来促进新行为(novel behaviors)的学习。

来自DeepMind和多伦多大学的研究人员试图利用这一点,为此他们设计了名为“Dreamer”的AI,旨在将一个世界模型内化,并通过“想象(imagining)”行为的长期结果来提前计划如何选择行为。

研究人员表示,Dreamer不仅适用于任何学习型任务,并且在数据效率、计算时间、最终性能等方面都超越了现有方法。

二、使用复杂的潜在动力学模型

在AI的整个生命周期中,无论是交错(interleaved)的还是并行(in parallel)的,Dreamer都会学习一个潜在的动力学模型(latent dynamics model),然后从行动和观察中对回报进行预测。

在这种情况下,“潜在动力学模型”是指从输入的图像信息中学习并执行计划来总结新经验的模型。“潜在(latent)”表示它依赖于隐藏(hidden)或潜在状态的紧凑序列(compact sequence),这使得它能够学习更抽象的表示,例如对象的位置和速度。

▲Dreamer在钟摆任务中进行预测(中间行为预测行)

Dreamer使用了一个多部分(multi-part)潜在动力学模型,该模型在结构上有些复杂。

Dreamer总体来说分为四个部分,第一部分负责对图像运动进行观察并编码为机器可以理解的信息;第二部分根据这些已知信息,对图像中没有观察到的部分进行预测;第三部分是一个奖励组件,负责针对不同的预测动作给出奖励;最后一部分是一个价值模型,估计了预测动作可能得到的奖励,并据此不断优化预测动作,让其更加精准。

▲Dreamer在迷宫导航游戏中进行预测(中间行为预测行)

研究人员在DeepMind用于评估AI机器学习能力的仿真软件中,对Dreamer进行了20个视觉控制任务的测试。他们首先使用Nvidia V100图形芯片和10个处理器核对它进行训练,他们说,每106个环境步骤的花费时间是9小时。相比之下,Dreamer的上一代PlaNet花了17个小时才达到类似的性能。

▲Dreamer在Atari游戏中进行预测(中间行为预测行)

三、用已知世界模型解决未知问题

研究人员说,Dreamer有效地利用了从少量的经验中总结出来的已知世界模型(learned world models),它的成功证明了通过潜在的想象力(latent imagination)学习行为的效率已经可以优于先前的顶尖方法。他们还表示,Dreamer的价值模型即使在短期规划(short-term planning)中也表现良好,在20项任务中有16项任务的表现优于其他模型,在另外4个任务中打平。

研究人员写到:“表征学习(representation learning)的未来研究可能会将潜在的想象力放大到视觉复杂度更高的环境中。”他们在本周于温哥华举办的NeurIPS 2019上展示了他们的研究成果。Dreamer项目的代码已经在GitHub公开。

结语:Dreamer为表征学习领域研究提供新思路

此次DeepMind推出的Dreamer,相比前代的主要突破在于将“潜在想象力”运用在AI的训练中,不仅训练效率提升,也为今后在视觉更加复杂的环境中进行研究提供了新思路。

通过现有的认知信息建立模型,预测和解决新环境中的问题,是将来AI研究的大方向之一,我们也期待DeepMind后续有更多新突破。

文章来源:Venturebeat

能“预测未来”的AI来了!谷歌DeepMind推Dreamer,训练时间减半相关推荐

  1. ai 预测未来股市_是预测分析的未来,人工智能将如何将其提升到一个新的水平...

    ai 预测未来股市 AI, machine learning, and deep learning have opened up opportunities to use predictive mod ...

  2. 开源开放 | 熵简科技 AI Lab 开源金融领域中文预训练语言模型 FinBERT

    1 背景及下载地址 为了促进自然语言处理技术在金融科技领域的应用和发展,熵简科技 AI Lab 近期开源了基于 BERT 架构的金融领域预训练语言模型 FinBERT 1.0.相对于Google发布的 ...

  3. AI 天气预报准确度高于气象台,一张 GPU 1秒预测未来 90 分钟天气

    编译 | 禾木木 出品 | AI科技大本营(ID:rgznai100) 此次 DeepMind 聚焦天气预报这一重大挑战,与英国气象局合作将 AI 应用于预测降雨. 在天气现象中,雨尤其重要,因为它会 ...

  4. Yann LeCun:未来几十年AI研究的最大挑战是「预测世界模型」

    来源:机器之心 本文约4000字,建议阅读8分钟 本文为你介绍一种叫做分层 JEPA(联合嵌入预测架构)的架构. LeCun 认为,构造自主 AI 需要预测世界模型,而世界模型必须能够执行多模态预测, ...

  5. 近期活动盘点:基于雷达图像预测未来降水参赛经验分享、智慧政府讲座、金融AI思享会、数据法学研讨会(11.29-11.30)

    想知道近期有什么最新活动?大数点为你整理的近期活动信息在此: CIKM AnalytiCup 2017-基于雷达图像预测未来降水参赛经验分享 2017年11月29日 活动简介: 清华大学清华-青岛数据 ...

  6. 图灵奖获得者Yann LeCun:未来几十年AI研究的最大挑战是「预测世界模型」

    来源:机器之心 LeCun 认为,构造自主 AI 需要预测世界模型,而世界模型必须能够执行多模态预测,对应的解决方案是一种叫做分层 JEPA(联合嵌入预测架构)的架构.该架构可以通过堆叠的方式进行更抽 ...

  7. AI 创业公司 Kyndi 获850万美元融资,帮助公司预测未来

    雷锋网(公众号:雷锋网)8月10日消息,据外媒报道, Kyndi 是一家总部位于帕洛阿尔托的 AI 创业公司.该公司今天宣布,已经完成了850万美元的 B 轮融资. 本轮融资的资金来源包括 Pivot ...

  8. python人脸识别代码百度ai_强大的AI!Python几行代码,就能预测未来孩子的长相?...

    这次,将百度智能云中的人脸识别功能与python结合起来进行实验花了一些时间.结果非常令人满意,而且过程非常简单而不复杂.或许,你可以整合你孩子的外貌.让我们一起敲击键盘. 准备百度人工智能开放平台账 ...

  9. 计算机预测自己未来的相貌,AI算法预测未来相貌,准确率高达90%以上

    今天给大家分享一款可以预测未来相貌的小工具 在生活中中,看到小孩子有的人说长得想爸爸,有的人说长得像妈妈. 谁都希望自己生一个漂亮的宝宝,皮肤像妈妈一样白皙,鼻子像爸爸一样高挺,等等等等,宝宝最好把父 ...

最新文章

  1. 5G NPN 行业专网 — 媒体行业 5G 专网部署方案
  2. 【Python刷题】_7
  3. Spring全局异常捕捉实现HandlerExceptionResolver接口,在error-page配置捕捉异常
  4. codeforce 1311 C. Perform the Combo 前缀和
  5. Ubunt中卸载protobuf与安装3.6.0版本步骤
  6. 02_Spring Cloud Alibaba整合通用Mapper+Lombok+Mysql
  7. pssh批量远程管理
  8. 被黑客NeoN“附体” QQ为推产品谎报漏洞
  9. GhostBSD 19.04 发布,注重安全与稳定性的 FreeBSD 发行版
  10. SpringCloud-Config通过Java访问URL对敏感词加密解密
  11. 索罗斯说,我投机了,但我不觉得我做错了什么,我做的都是合法的。
  12. QueueUserWorkItem函数
  13. [2018.10.11 T2] 整除
  14. 6120:学长的沙包
  15. JVM和ART、DVM(dalvik VM)的区别
  16. 女生找工作,非常有用,好好 收藏,以后肯定能用得上 (转)
  17. CleanMyMac X真正好用的Mac电脑系统优化软件应用工具
  18. mysql connector java5.1.30_mysql connector java下载
  19. 更深层次理解Python的 列表、元组、字典、集合(工作面试学习必需掌握的知识点)
  20. 磁力小伙伴,配合使用效果极佳!

热门文章

  1. Gini指数、Gini系数、Gini不纯是一回事吗?
  2. nn.embding()使用注意点
  3. tf.reduce_mean解释
  4. 静态方法是一种特殊的成员方法,它不属于类的某一个具体的实例。
  5. 向大脑学习智能本质,探索通用 AI 的另一条可行路径
  6. 梦回93年,32岁的Yann LeCun在展示他的卷积网络...
  7. 47万实例数据集,智源联合旷视发布2020 CrowdHuman人体检测大赛
  8. 领域适配前沿研究——场景、方法与模型选择
  9. Vue.js 官方团队成员霍春阳新作,深入解析 Vue.js 设计细节
  10. Generative Adversarial Text to Image Synthesis --- 根据文字描述生成对应的图片