本文是计算机视觉领域国际顶级会议 CVPR 2019 入选论文《Multi Agent Tensor Fusion for Contextual Trajectory Prediction》的解读。该论文由 MIT 支持的自动驾驶初创公司 ISEE Inc,北京大学王亦洲老师课题组,UCLA,以及 MIT CSAIL 合作共同完成。该论文主要提出了一种基于深度学习的车辆和行人轨迹预测方法,提出了一个可以保持空间结构信息的多智能体张量融合网络,在机动车驾驶和行人轨迹数据集中对模型的性能进行了验证。

链接:https://arxiv.org/abs/1904.04776

简介

轨迹预测问题之所以具有挑战性,是因为智能体的动作是随机的,并且取决于他们的目的地、与其他智能体的社会交互、以及其所在场景的物理约束。预测还必须对不同场景中不断变动的智能体数量和类型具有泛化性。基于神经网络的预测算法往往很难编码类似的信息,因为标准的神经网络架构只接受固定的输入、输出和参数维度;而对于这类预测任务,这些参数维度会因场景而异。之前的论文或利用面向智能体(agent-centric)的方法进行轨迹预测,例如 SocialLSTM [1],Social GAN [2];或利用面向空间结构(spatial-centric)的编码方式解决这个问题,例如 Chauffeur Net [3]。面向智能体的编码在多个智能体的特征向量上运行聚合函数,而面向空间结构的方法则直接在鸟瞰视角的场景表示图上进行运算。

而多智能体张量融合(Multi-Agent Tensor Fusion, MATF)则提出了一种创新的多智能体张量融合编码器-解码器(Encoder-Decoder)网络架构。该架构结合了面向智能体和面向空间结构的轨迹预测方法的长处,通过端到端训练学习表示和推理有关社会互动和场景物理约束的所有相关信息。图 1 展示了 MATF 的核心张量 MAT 的构造,该张量在空间上将场景的特征编码与场景中每个智能体的过去轨迹的特征编码向量对齐,保持了静态场景以及多智能体的空间位置关系。接下来,通过全卷积网络(Fully Convolutional Layers)构造出融合的多智能体张量编码(见下一个小节)。这种编码方式一方面可以像面向空间结构的方法那样很自然地保持多智能体张量中的所有智能体和静态场景的空间结构以捕捉空间信息,另一方面也可以像面向智能体的方法那样敏感捕捉多智能体间的微妙社会互动。

MAT 编码是一个鸟瞰视角的静态场景和动态多智能体的特征图(Feature Map),包括多智能体编码通道(Multi-Agent Encoding Channels)(上)和静态场景编码通道(Scene Context Encoding Channels)(下)。单智能体长短时记忆网络(Single Agent LSTM)编码器输出的多智能个体特征向量(红色)在空间上根据这些智能体的坐标对齐,构造出多智能体编码通道。多智能体编码通道与静态场景编码通道(场景编码全卷积网络的输出特征图)对齐,以保持智能体与场景间的空间结构。

MAT 紧接着将融合了社会互动和场景物理制约的 MAT 编码结果解码,以同时预测场景中所有智能体的未来轨迹。现实世界中人的行为不是确定性的,智能体可以在同一个场景中做出不同的行为,MATF 使用条件生成对抗训练(Conditional GAN)来捕获预测轨迹的这种不确定性。

MATF 对新提出的模型在驾驶数据集和行人人群数据集上进行了实验验证。该论文报告了来自以下数据集的结果:公开的 NGSIM 驾驶数据集,斯坦福无人机行人数据集(Stanford Drone dataset),ETH-UCY 人群数据集,以及最近收集的暂未公开的马萨诸塞州驾驶数据集。文章汇报了定量和定性实验结果,显示了模型每个部分的贡献。与领域最先进论文的定量比较表明所提出的方法在高速公路驾驶和行人轨迹预测方面都有着最好的表现。

网络架构

多智能体张量融合(MATF)的网络架构简图如下所示:

该网络的输入是在过去时间段内的所有智能体的轨迹,以及鸟瞰视角下的静态场景图像。每个智能体的过去轨迹和静态场景图像分别通过循环(Single-Agent LSTM Encoders)和卷积编码流独立编码。编码后的多智能体向量和静态场景特征图在空间上对齐以构造出多智能体张量。例如,图中 3-D 黑框(下方)显示的是橙色智能体周围的多智能体张量切片。

接下来,结构类似 U-Net 的全卷积网络(Convolutional Operator: Multi-Agent Tensor Fusion)作用在构造出的多智能体张量上,用以推断社会交互和空间物理约束,同时始终保持空间结构和空间局部性特征,该全卷积网络最终输出融合的多智能体张量(上方)。每个融合的智能体向量从该张量切片得出,包含了推理加工过的相应智能体的社会互动信息、自身历史轨迹信息、以及其周围的场景物理约束信息。值得指出的是,因为 MATF 架构运行共享卷积运算,所以在同一次正向传播中可以计算得出的所有智能体的相应融合向量。例如,实心蓝框(上方)所表示的智能体融合向量融合了来自卷积层感受野内的该智能体附近的所有智能体和场景特征的综合推断信息。

MATF 在此之后将这些融合的特征向量作为残差(Residual)加到相应智能体的原始编码向量上,以获得最终智能体编码向量。这些向量最终将被循环神经网络解码器(Single-Agent LSTM Decoders)独立地解码为网络对这些智能体的未来的轨迹的预测结果。MATF 整个架构是完全可微的,并且支持端到端的训练。

驾驶数据集实验结果样例

马萨诸塞州驾驶数据集的定性实验结果样例如上所示。每辆车的过去轨迹以不同的颜色显示,其后连接的是网络对这些车未来轨迹的预测的采样。正确结果(Ground Truth)的轨迹以黑色显示,车道中心以灰色显示。

(a)一个涉及五辆车的复杂情景;MATF 准确地预测了所有车的轨迹和速度分布;

(b)MATF 正确地预测了红色车辆将完成换道;

(c)MATF 捕捉到红色车辆是否将驶入高速公路出口的不确定性。

(d)当紫色车辆通过高速公路出口后,MATF 预测它将不会退出。

(e)在这里,MATF 无法预测精确的真实未来轨迹;然而,一小部分采样轨迹成功预测到了红色车辆将持续变道。

行人数据集实验结果样例

斯坦福无人机数据集的定性实验结果样例如上所示。从左到右分别是 MATF 多智能体-场景推断模型,MATF 多智能体-无场景推断模型,和 LSTM 基准模型的预测结果,所有用来预测的模型都是确定性模型。蓝线显示的是过去的轨迹,红色是真实的未来轨迹,绿色的是三个模型分别预测的未来轨迹。MATF 可以通过一个正向传播同时预测该图所示的所有的智能体的未来的轨迹。绿色的预测轨迹越接近红色的真实未来轨迹,预测就越准确。MATF 多智能体-场景推断模型成功预测了:

(1)两个人或自行车从顶部进入环形交叉口,并将向左驶出;

(2)环形交叉路口左上方路径的一位行人正在转弯向左移动到图像的顶部;

(3)一个人在环形交叉路口的右上方建筑物门口减速;

(4)在一个有趣的失败案例中,环形交叉路口右上方的人向右转,向图像顶部移动;该模型成功预测了此次转弯,但失败在无法预测转弯的急缓程度。

MATF 多智能体-场景推断模型正确预测了这些和其他各种场景的轨迹情形,其中一些情形也被 MATF 多智能体-无场景推断模型近似地预测了出来,但大多数情形都没有被基准的 LSTM 模型预测出来。

参考文献:

[1] A. Alahi, K. Goel, V. Ramanathan, A. Robicquet, L. Fei Fei, and S. Savarese. Social lstm: Human trajectory prediction in crowded spaces. In Proceedings of the IEEE International Conference on Computer Vision and Pattern Recognition, 2016.

[2] A. Gupta, J. Johnson, L. Fei Fei, S. Savarese, and A. Alahi. Social gan: Socially acceptable trajectories with generative adversarial networks. In Proceedings of the IEEE International Conference on Computer Vision and Pattern Recognition, 2018.

[3] M. Bansal, A. Krizhevsky, and A. S. Ogale. Chauffeurnet: Learning to drive by imitating the best and synthesizing the worst. CoRR, abs/1812.03079, 2018

结构体内部申请空间_智能体张量融合,一种保持空间结构信息的轨迹预测方法...相关推荐

  1. 结构体内部申请空间_墙体的重要承重结构以及作用方向分类

    内容提要:墙体是房屋的重要承重结构,墙体也是建筑物的主夏围护结构.其造价.工程量和自重往往是建筑物所有构件中所占份額最大的,因此在建筑设计中,合理地选择墙体的材料.结构方案.构造做法十分重要.墙体在建 ...

  2. 【matlab】访问结构体内部元素

    [matlab]访问结构体内部元素 语法格式: 结构体名称.字段名: 如果给域换新值则: 结构体名称.字段名=新值: 例如:person.weight; 具体情况我们看一下代码: >> s ...

  3. Trajectron++| 生成性的多智能体轨迹预测方法

    作者 | 浅笑  编辑 | 汽车人 原文链接:https://zhuanlan.zhihu.com/p/513091095 点击下方卡片,关注"自动驾驶之心"公众号 ADAS巨卷干 ...

  4. 两步路轨迹文件位置_最新Uber ATG的轨迹预测方法LiRaNet介绍

    arXiv今年10月刚刚上传论文"LiRaNet: End-to-End Trajectory Prediction using Spatio-Temporal Radar Fusion&q ...

  5. 结构体内指针数组调用_指针的这些技巧你都掌握了吗

    点击上方蓝字"杜明c"一起玩耍 摘要 为什么需要用指针? 一些概念 数组指针 指针数组 指针数组和数组指针在内存中的关系 函数指针 函数指针例子 指针作为参数的传递 通过函数修改指 ...

  6. 结构体内元素不确定_查漏补缺!高中三年生物最易忽略、易错的30个知识点整理不容错过...

    高中生物的知识体系基本上是由大约数十个核心概念为基础构建起来的,这些概念包括细胞.细胞分裂.光合作用.呼吸作用.基因.染色体.遗传.变异.进化.生化系统等等,今天学姐来帮助你们整理一下高中三年中最容易 ...

  7. 结构体内元素不确定_农作物生长发育不可缺少的肥料,微量元素肥料,如何才能合理使用...

    随着农业生产的不断发展, 微量元素肥料在种植业当中的应用越来越广泛,是农作物生长发育不可缺少的一种肥料.常见的微量元素肥料有硼.锌.锰.铁.铜.钼六种肥料,微量元素在农作物的正常生长和各项生理活动当中 ...

  8. 结构体内元素不确定_氮长叶,磷长果,那么生物菌肥能长啥?看完终于不纠结了...

    农民朋友们都知道,"庄稼一枝花,全靠肥当家",肥料对于作物产量的高低起着决定性因素. 蔬菜的产量.品质.病虫害.早衰.死亡.落花.落果.干尖干叶等都与肥料有着密切的关系. 如今市面 ...

  9. 结构体内元素不确定_化工史话35:元素时代—有机化学发展史I

    说到有机化工,我们不能不说一下人类对于有机物认识的变化.这种认识最早来源于发酵产物与天然产物提取过程. 从树叶中利用纸层析法提取各种色素是中学常见的实验.在十八世纪以前,为了药用或其他用途,人们就开始 ...

最新文章

  1. 绝对不容错过:最完整的检测模型评估指标mAP计算指南(附代码)在这里!
  2. ie6 ie7 绝对定位 相对定位 层被遮住
  3. linux问答学知识
  4. 2019牛客暑期多校训练营(第七场)
  5. Unable to open /dev/sda的原因之一
  6. decode 大于比较 小于_关于Decode的用法,是不是里面的条件项不能超过10?
  7. 实现微信文章页面 http://mp.weixin.qq.com/s?__biz=MjM5MDI3OTAwMg==amp;mid=200337417amp;idx=1amp;sn=5959ed1...
  8. Java集合里的一些“坑”
  9. cocos2d-x-2.2.1环境搭建
  10. mybatis批量写入及批量更新
  11. 【情感识别】基于matlab GUI SVM语音情感识别【含Matlab源码 869期】
  12. python如何输入特殊符号_用Python打印列表中的特殊字符
  13. 2021阿里云双11云服务器配置表汇总!
  14. c++实现经典游戏——贪吃蛇
  15. Cisco设备telnet登录设置
  16. Anddroid IM来电铃声通过耳机播放
  17. 方便、免费的PDF在线处理网站汇总:PDF合并、文字编辑、页面提取与删除、格式转换…
  18. 微信小程序 云开发表数据一键清空
  19. 未能正确加载“Microsoft.VisualStudio.Editor.Implementation.EditorPackage”包
  20. Android必会的自动化测试

热门文章

  1. 125%屏幕缩放比,软件很糊解决方法
  2. 2018年LeetCode高频算法面试题刷题笔记——只出现一次的数字(开始之前)
  3. pytorch张量(tensor)常用高级操作函数
  4. 记一次有关于ubuntu20.04的Lustre文件系统安装
  5. 评论/点赞/分享/收藏/搜索/上传/下载的测试点
  6. 毕业设计-深度学习的施工安全帽图像检测算法
  7. 【协程】冷流flow详解
  8. 90N10-ASEMI的MOS管90N10
  9. 温度记录仪软件测试,温度分布测试规范
  10. 安徽工业大学计算机学院学生名单,计算机科学与技术学院举行2017-2018学年学生表彰大会...