译者 | 王柯凝

编辑 | 明明

出品 | AI科技大本营(公众号ID:rgznai100)

【AI科技大本营导读】在童年记忆中,你是如何沿着路线去朋友家、学校或者商店的?那时候没有地图,只是简单的记住街景和沿途转向。随着开始尝试新的越来越复杂的线路,你变得更加自信,在这个过程中,或许你会暂时迷路,但是得益于熟悉的路标或太阳朝向,又能找到正确的路线。因此,导航是一种很重要的认知任务,人类或者动物不需要地图就能够在复杂的世界中进行远距离穿越。

在没有地图的城市中学习导航时,我们提供了一个交互式导航环境 —— 使用来自 Google 街景视图的第一视角并将其环境游戏化,来训练人工智能。作为街景图像的标准,人脸和车牌比较模糊以至于无法识别。我们建立了一个基于神经网络的人工智能体,使用视觉信息(来自街景视图图像的像素)来学习在多个城市中导航。请注意,这项研究适用于一般导航而不是汽车驾驶,在这里,我们既没有使用交通信息,也没有对车辆控制建模。



图注:我们的代理导航在多种视觉环境中导航,无需访问地图

当代理导航到达目的地(如指定经纬度坐标)时,该代理导航就会获得奖励,就像一个没有地图负责无限交付的快递员一样。随着时间的推移,人工智能代理以这种方式跨越整个城市进行学习。我们还证明了,代理导航可以在多个城市进行学习,然后适应新的城市。

图注:代理导航在巴黎训练的定格影片。图像与城市地图交叠,目标位置为红色,代理导航位置和视野为绿色。 请注意,代理程序看不到地图,它只能看到目标位置的经纬度坐标。

无需建立地图来学习导航

与传统的依赖指定映射和探索的方法不同(如进行本地化并同时绘制地图的制图师),我们的方法是:不使用地图、GPS 定位或其他辅助工具,只使用视觉观察,像人类走路那样进行导航。我们构建了一个神经网络代理,从环境中观察到的图像作为输入,并预测在环境中应该执行的下一个操作。类似于一些学习在复杂的 3D 迷宫中进行导航以及使用无监督辅助任务进行强化学习来玩游戏的模型,我们使用深度强化学习对它进行端到端的训练。与那些小型模拟迷宫环境中的研究不同,我们利用城市中的真实数据:伦敦、巴黎和纽约市的复杂交叉路口、人行道、隧道以及各种拓扑结构。此外,我们的方法支持城市针对性的学习和优化以及通用可转移导航行为。

可以适用于新城市的模块化神经网络架构

代理导航内部的神经网络由三部分组成:

1)可以处理图像并提取视觉特征的卷积网络;

2)特定区域的循环神经网络,记住环境并学习“ 这里“(代理当前位置)和”那里“(目标位置)的表示;

3)基于代理导航行为产生导航策略的区域不变循环网络,特定区域模块可互换,并且如其名称所示,代理导航对于每个城市都是唯一的,而视觉模块和策略模块是区域不变的。



图注:图 (a) 为 CityNav 体系结构,图 (b) 为每个城市特定区域路径的 MultiCityNav 体系结构,图 (c) 为当代理导航适应新城市时的训练和转移过程。

就像在谷歌街景图相同的是,代理导航可以在适当的位置进行旋转,或者在可能的情况下前进到下一个全景中;与谷歌地图和街景不同的是,代理导航不会看到小箭头、本地或全球地图或著名的Pegman,而是学习区分开放道路和人行道。目标位置在真实世界中可能是很多公里,这就需要代理导航通过数百个全景图一步步的找到目的地。

我们证明了该方法可以提供一种将知识转移到新城市的机制。和人类一样,当代理导航访问新城市时,我们会期望它必须学习一组新地标,但没有必要重新学习它的视觉表现或行为(如沿着街道向前缩放或转向交叉点)。 因此,使用 MultiCity 体系结构时,我们首先在许多城市中进行训练,然后冻结( freeze )决策网络和视觉卷积网络,并在新城市中只建立一个新的特定区域路径。 这种方法使代理导航不会忘记它已经学到了什么的同时,也能够获得新的知识,这和渐进式神经网络架构比较相似。

图注:本研究中使用的五个曼哈顿区域

导航是研究和开发人工智能的基础,并试图在人工代理导航中复制导航可以帮助科学家了解其生物学基础。

原文地址:

https://deepmind.com/blog/learning-to-navigate-cities-without-a-map/

招聘

AI科技大本营现招聘AI记者和资深编译,有意者请将简历投至:gulei@csdn.net,期待你的加入!

AI科技大本营读者群(计算机视觉、机器学习、深度学习、NLP、Python、AI硬件、AI+金融、AI+PM方向)正在招募中,和你志同道合的小伙伴也在这里!关注AI科技大本营微信公众号,后台回复:读者群,添加营长请务必备注姓名,研究方向。



AI科技大本营
公众号ID:rgznai100

☟☟☟点击 | 阅读原文 | 查看更多精彩内容

没有地图也能导航?DeepMind用街景来认路相关推荐

  1. 谁说导航一定要用地图?谷歌DeepMind的强化学习模型靠街景认路

    Root 编译自 DeepMind 量子位 出品 | 公众号 QbitAI 还记得小时候从家到学校的那段路怎么走吗? 那会儿你可能还不知道什么是地图,也没有导航软件.但那条路的画面都在脑子里刻着.茂密 ...

  2. wince搜狗地图_什么导航好用又准确

    展开全部 好用准确的导航有高德地图.百度地图.腾讯地图等,推荐62616964757a686964616fe78988e69d8331333433616236如下: 1.高德地图 高德地图,高德是苹果 ...

  3. 高德地图安卓 拖拽选点_行车记录仪当“眼睛” 高德地图手机AR导航再次升级...

    来源标题:行车记录仪当"眼睛" 高德地图手机AR导航再次升级 高德地图近日发布新版本,AR驾车导航服务再次升级,支持连接车内行车记录仪.由行车记录仪的摄像头充当"眼睛&q ...

  4. android app调用第三方地图路线规划导航(百度,高德,腾讯)

    android app调用第三方地图路线规划导航(百度,高德,腾讯) 因为直接使用高德的sdk提供的导航被投诉说不准,所以需要接第三方. 把BAT系的地图都接上了,有兄弟找到其他的地图调用方法告诉下小 ...

  5. IOS实现应用内打开第三方地图app进行导航

    用过微信的应该都知道这个功能,对方发一个位置给你,点进去地图展示对方跟你的当前位置,界面提供了选择各个地图应用进行导航,更好这次需求也要搞这个功能. 这个功能实现不难,个人感觉比应用内嵌入第三方地图导 ...

  6. 高德地图上线新能源导航 一站式充电服务缓解里程焦虑

    新能源汽车市场正快速发展,为更好地满足新能源车主的出行需求,高德地图在近日发布的V11.0新版本中,增加了专属的新能源导航,可为车主提供充电站一键查找与导航.充电接续路线规划.长途服务区充电提醒.扫码 ...

  7. 【Android】APP嵌入百度地图骑行导航一直初始化引擎失败解决办法

    [Android] APP嵌入百度地图骑行导航一直初始化引擎失败解决办法 最近手头上有个需求需要做骑行导航 首先百度地图开放平台http://lbsyun.baidu.com/ 按提示找到Androi ...

  8. 高德地图ar步行导航使用教程分享

    高德地图功能多,最近向用户展示了新功能--ar步行导航.很多小伙伴对这个功能还不太了解.所以换换为大家准备了详细的使用教程共享.一起看看吧! 高德地图ar步行导航使用教程 1.打开高德地图.选择下方& ...

  9. Android 打开第三方地图App进行导航

    Ⅰ.前言 接到产品新需求,模仿高德地图APP通过搜索关键词,在地图标识附近区域内 "关键词"所搜到的点,地图和列表之间有抽屉似的效果,具体的看下面效果图.而打开第三方地图APP进行 ...

最新文章

  1. EBS Form中数据提交方式(COMMIT)
  2. 我又发现了7款特别好用的神仙软件,让人心动!
  3. sqlplus 如何连接到指定数据库,并创建用户与授权
  4. 【深度学习入门到精通系列】Recurrent和Residual解释
  5. ubuntu18 安装 chrome
  6. Kindeditor富文本编辑器使用
  7. ssh连接局域网内ubuntu主机_ubuntu使用ssh连接远程电脑的方法
  8. 电脑销售渠道_双十一遇上英雄联盟S10,苏宁游戏装备销售增长258%
  9. 关于Java你不知道的10件事
  10. 网站开发的小知识参考(慢慢收集备用)
  11. java io 并发编程,JAVA进阶系列 - 并发编程 - 第1篇:进程线程并发并行
  12. SharePoint 2013 Step by Step——How to Create a Lookup Column to Another Site(Cross Site) 阅读目录...
  13. 标准模块 threading
  14. TAOCP中最大公约数算法理解
  15. javascript 字符串的排列与组合
  16. Codeforces Round #476 (Div. 2) 题解
  17. 充电桩检测设备TK4860E交流充电桩检定装置
  18. CSS3特效-自定义checkbox样式
  19. 美国本土四十八个州府48个州府所在城市的TSP旅行商回路17110km
  20. 哪个邮箱登录安全?163 VIP邮箱登录入口是哪个?

热门文章

  1. Android -- TextView与EditText 同步显示
  2. 用 GDI 操作 EMF 文件[2]: PlayEnhMetaFile、DeleteEnhMetaFile
  3. two years in cnblogs.com
  4. 用计算机画曲线教案,小学信息技术曲线工具教案
  5. 机器学习-----有监督,无监督,半监督学习的简单阐释
  6. Linux环境下命令行截图【转】
  7. QGC地面站参数调节
  8. 测试用例设计方法基础理论知识
  9. Python 函数初识 (1)
  10. Pycharm中如何安装python库