作者丨少年依旧如风@知乎

来源丨https://zhuanlan.zhihu.com/p/417445881

编辑丨3D视觉工坊

论文:Exploring Simple 3D Multi-Object Tracking for Autonomous Driving

论文地址:https://arxiv.org/pdf/2108.10312.pdf

一、动机

在2D多目标跟踪领域中,tracking-by-detection是常用的跟踪方法,该方法首先在每一帧上得到检测框,然后匹配帧间的检测框来完成跟踪任务。

对于3D多目标跟踪领域,tracking-by-detection的方法更是居于主导地位。

作者认为基于tracking-by-detection方法最大的弊端是,启发式匹配步骤通常需要人工设计匹配规则和调试相关参数。这在实际的工程应用中带来了诸多困难:

1.人工设计的规则受限于工程师的领域和先验知识,其效果往往不如基于数据驱动的方法好

2.调试匹配规则参数时,往往费时费力。比如在无人驾驶场景中需要检测和跟踪多种类别目标(车、行人、两轮车等等),手动调参时,需要针对每一类别进行特定调试。

3.传统方法可扩展性比较差,容易重复劳动——这个数据场景调好的参数,可能在另一个数据场景效果不佳,需要重新调试。

针对上述三个弊端,作者尝试在点云3D目标跟踪任务中去除启发式匹配步骤。

作者提出的方法SimTrack,可以替换传统的tracking-by-detection模式,用于点云3D目标一体化检测和跟踪。该方法可以很方便地与基于pillar或者voxel的3D目标检测算法结合。SimTrack将目标关联、dead object清除、new-born object检测集成在了一起,降低了跟踪系统的复杂程度。

二、总体结构

给定原始点云数据,首先使用pillar或voxel方法将其体素化(voxelize),然后使用PointNet提取每个pillar或voxel的特征,在backbone中使用2D或3D卷积操作得到鸟瞰图特征。在detection head中使用centerness map上的位置表示目标所在位置,除了输出centerness map外,detection head还输出目标尺寸和朝向等信息。

算法的总体结构如下图所示:

结合回归分支输出的目标属性信息,得到最终结果,如上图最右侧所示。在上图右侧框中,ID为1的目标表示dead object,它有比较低的置信度;ID为2~4的目标为检测并跟踪到的目标,ID为5的目标为新出现的目标(new-born object)。在推理时,对于初始时刻的点云,只将该帧点云单独作为算法的输入,得到检测结果用于初始化 。

算法流程图:

三、Hybrid-Time Centerness Map

hybrid-time centerness map能够关联前一时刻与当前时刻的检测信息,同时还能滤除消失的目标,也可以检测新出现的目标。

hybrid-time centerness map 结合下一节所描述的motion updating分支,可以直接关联当前时刻的检测结果和前一时刻的检测结果,从而构建起目标的跟踪身份。

四、Motion Updating Branch

五、其他回归分支

七、实验

在实验时,使用PointPillars作为基于pillar的backbone,使用VoxelNet作为基于voxel的backbone,并分别在nuScenes和Waymo数据集上评估算法。

在nuScenes验证集和测试集上的测试结果如下表所示:

在Waymo验证集上的测试结果如下表所示:

在nuScenes验证集上可视化的跟踪过程如下图所示:

八、结论

在本文中,作者提出了SimTrack,一种用于激光雷达点云三维多目标跟踪的端到端可训练模型,作者的方法采取了第一步来简化现有手工制作的跟踪管道,这些管道涉及复杂的启发式匹配和手动跟踪管理。通过将提出的混合时间中心图和运动更新分支相结合,作者设计在一个统一的模型中无缝地集成了跟踪对象关联、新生对象检测和死对象移除。大量的实验结果证明了方法的有效性。

九、附录

此外,作者在论文的最后进行了四个小节的阐述:

1.举例说明了具有代表性的匹配启发法和相关超参数如何影响跟踪性能

现有的跟踪方法在启发式匹配中涉及多个超参数。一些广泛使用的方法包括匹配阈值、为死区轨迹保留的最大帧数、初始化新轨迹之前的最小帧数等等。

在启发式匹配中,跟踪性能对超参数设置非常敏感。对于基于卡尔曼滤波的跟踪,协方差矩阵的设置对跟踪结果影响很大。

为了强调为启发式匹配步骤设置超参数的关键作用,作者进行了以两个具有代表性的超参数进行比较:最大年龄和最大距离。前者用于固定轨道在移除前保留一定数量的帧。当对象偶尔在几帧内被遮挡并再次显示时,这会有所帮助。后者确定允许匹配的距离阈值。

得到下图结果:

2.介绍了SimTrack和CenterPoint之间的更多比较

作者提供了在不同召回率下SimTrack和CenterPoint之间MOTA和IDS的更详细比较。下图所示,作者提出的模型在高召回率下具有更少的身份切换:

基于这一优势,作者又绘制了汽车、行人和摩托车的MOTA召回曲线,如下图所示:

3.报告了模型的推断延迟

作者的联合检测和跟踪设计可以灵活地集成到三维目标检测网络中,并且只会给主干网络带来很小的计算开销。下表比较了仅检测模型和我们的联合检测和跟踪模型之间的推断延迟,该模型使用了基于支柱和体素的主干的不同中心度贴图分辨率。

4.提供了有关nuScenes和Waymo的更多结果

除了简化和改进跟踪,SimTrack还可以提高检测精度。下表比较了SimTrack和CenterPoint的检测结果。

本文仅做学术分享,如有侵权,请联系删文。

3D视觉精品课程推荐:

1.面向自动驾驶领域的多传感器数据融合技术

2.面向自动驾驶领域的3D点云目标检测全栈学习路线!(单模态+多模态/数据+代码)
3.彻底搞透视觉三维重建:原理剖析、代码讲解、及优化改进
4.国内首个面向工业级实战的点云处理课程
5.激光-视觉-IMU-GPS融合SLAM算法梳理和代码讲解
6.彻底搞懂视觉-惯性SLAM:基于VINS-Fusion正式开课啦
7.彻底搞懂基于LOAM框架的3D激光SLAM: 源码剖析到算法优化
8.彻底剖析室内、室外激光SLAM关键算法原理、代码和实战(cartographer+LOAM +LIO-SAM)

9.从零搭建一套结构光3D重建系统[理论+源码+实践]

10.单目深度估计方法:算法梳理与代码实现

11.自动驾驶中的深度学习模型部署实战

12.相机模型与标定(单目+双目+鱼眼)

13.重磅!四旋翼飞行器:算法与实战

重磅!3DCVer-学术论文写作投稿 交流群已成立

扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群,目前主要有3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、多传感器融合、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流、ORB-SLAM系列源码交流、深度估计等微信群。

一定要备注:研究方向+学校/公司+昵称,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,可快速被通过且邀请进群。原创投稿也请联系。

▲长按加微信群或投稿

▲长按关注公众号

3D视觉从入门到精通知识星球:针对3D视觉领域的视频课程(三维重建系列、三维点云系列、结构光系列、手眼标定、相机标定、激光/视觉SLAM自动驾驶等)、知识点汇总、入门进阶学习路线、最新paper分享、疑问解答五个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近4000星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

圈里有高质量教程资料、答疑解惑、助你高效解决问题

觉得有用,麻烦给个赞和在看~  

探索自动驾驶领域中的3D多目标跟踪(ICCV 2021)相关推荐

  1. 首个面向自动驾驶领域的3D点云目标检测教程!(单模态+多模态/数据+代码)

    背景介绍 3D检测用于获取物体在三维空间中的位置和类别信息,主要基于点云.双目.单目和多模态数据等方式.其中,点云数据由于具有较为丰富的几何信息,相比于其它单模态数据更为稳定,基于激光雷达点云数据的3 ...

  2. 面向自动驾驶领域的3D点云目标检测方法汇总!(单模态+多模态/数据+代码)

    背景介绍 3D检测用于获取物体在三维空间中的位置和类别信息,主要基于点云.双目.单目和多模态数据等方式.其中,点云数据由于具有较为丰富的几何信息,相比于其它单模态数据更为稳定,基于激光雷达点云数据的3 ...

  3. 面向自动驾驶领域的3D点云目标检测全栈学习路线!(单模态+多模态/数据+代码)...

    背景介绍 3D检测用于获取物体在三维空间中的位置和类别信息,主要基于点云.双目.单目和多模态数据等方式.其中,点云数据由于具有较为丰富的几何信息,相比于其它单模态数据更为稳定,基于激光雷达点云数据的3 ...

  4. 除了竞争,中美在自动驾驶领域可以有哪些合作

    智造观点 考虑到人工智能在生活中的普遍应用,毫无疑问,自动驾驶可以说是一项革命性的发展,很多汽车厂商和科技巨头也都参与其中,但也有很多人开始质疑这项技术对未来移动出行市场的意义.所以,不管是技术人员还 ...

  5. 从自动驾驶事故中探索有效的性能提升及判责策略

    作者 | Jessie 出品 | 焉知  知圈 | 进"域控制器群"请加微13636581676,备注域 蔚来汽车去年那场自动驾驶撞车事故再一次刷新了人们对智能汽车的认知,事故的责 ...

  6. 自动驾驶地图中的深度学习

    作者丨水管工张师傅@知乎 来源丨https://zhuanlan.zhihu.com/p/488024649 编辑丨3D视觉工坊 记录自己对刘兰个川大神文章的理解. 原文为:(貌似要翻墙) https ...

  7. 2021年4月自动驾驶领域重要动态速览

    进入2021年以来,自动驾驶领域发展持续推进,即将过去的4月份,自动驾驶相关动态频繁,包括一众自动驾驶初创企业和汽车巨头玩家等都有不少动作,值得关注.下面,小编盘点了部分主要事件,大家一起来看一看吧! ...

  8. AI未来说 | 听大牛论自动驾驶领域干货,看无人驾驶小车真实运作

    AI已来,而你来不来!? 人工智能论坛如今浩如烟海,有硬货.有干货的讲座却百里挑一."AI未来说"青年学术论坛第七期如约而至.本期论坛邀请了来自清华.北大.北理工.百度的各位专家和 ...

  9. 自动驾驶系统中视觉感知模块的安全测试

    本文由吴昊,王浩,苏醒,李明昊,许封元,仲盛联合创作 摘要 近年来,基于深度学习的视觉感知技术的发展极大地促进了车联网领域中自动驾驶的繁荣,然而自动驾驶系统的安全问题频出引发了人们对自动驾驶未来的担忧 ...

最新文章

  1. linux下挂载nas存储异常处理
  2. 今天将Notebook还原了, 第一次外加了外围电路
  3. 机器学习笔记(二十)——求解最大熵模型
  4. (转)Spring Boot(十七):使用 Spring Boot 上传文件
  5. 知乎通过港交所上市聆讯 2021年营收29.6亿元
  6. error: storage class specified for parameter问题-转
  7. 解决WINDOWS 7中显示摄像头的简易方法
  8. RTSP之主流安防厂家地址
  9. Facebook回应追踪无账号用户:源于网站插件漏洞
  10. vs2010字符集问题
  11. Windows任务管理器被procexp(Process Explorer)取代后如何恢复
  12. HEVC(h265)学习
  13. 当双绞线遇上光纤布线-NETLINK多模光纤收发器HTB-1100
  14. 揭秘闲鱼赚钱项目的高端玩法
  15. Re: 征男友征男友(有女友者勿回) (转载)
  16. 印象笔记:网页版与mac客户端工具栏都不一样
  17. 2018长三角数据智能合作(上海)峰会
  18. 题解报告(CDUT暑期集训——第一场)
  19. 计算机组成字扩展输出,字位扩展存储器示意图解析
  20. vCenter账号权限问题

热门文章

  1. Debian手动修改ip地址
  2. 阿里云文件存储和自我管理的云解决方案的TCO比较
  3. Error creating bean with name 'messageSource' defi
  4. JS和JSP之间值传递
  5. 原来这才是游戏上瘾的机制 如果把它用到生活中的话
  6. 揭秘百度微服务监控:百度游戏服务监控的演进
  7. 因 Redis Key 命令不规范,导致熬了一个通宵才把Key删完了!
  8. NIO中那些奇怪的Buffer
  9. 史上讲的最好的Java NIO与IO的区别与应用
  10. PingCode Wiki 多人实时协同编辑功能发布