点击上方“3D视觉工坊”,选择“星标”

干货第一时间送达

作者丨Penny@知乎

来源丨https://zhuanlan.zhihu.com/p/200924181

标题:Map Compressibility Assessment for LiDAR Registration

作 者:Ming-Fang Chang, Wei Dong, Joshua Mangelson, Michael Kaess, and Simon Lucey

来 源:IROS2021

编 译:单佳瑶

审 核:lionheart

摘要

本工作的目标是评估lidar-to-map的配准在压缩地图上的性能。现代自动驾驶汽车利用预先构建的 HD(高精度)地图来执行传感器到地图的配准,从而在位姿估计失败的场景进行重定位并减少大规模环境中的漂移。然而,传感器到地图的配准通常是通过将传感器配准到一个密集的3D模型来实现的,对于高清地图而言,这会占用大量的存储空间,需要大量的数据处理开销。因此使用压缩地图进行配准是一个可行的方案,但具体使用哪种地图压缩方式才能保证点云注册算法拥有最佳配准性能,目前仍未有人探索这一问题。

综合上,本工作提出了一种新颖且具有挑战性的基准,从三个角度评估现有的 LiDAR 到地图配准方法:地图可压缩性、鲁棒性和精度。我们比较了各种地图格式,包括原始点云、分层 GMM 和特征点,并在真实场景下的 LiDAR 数据集:KITTI odometry数据集和 Argoverse 跟踪数据集上展示了它们在可压缩性和鲁棒性之间的性能权衡。基准测试表明,当允许的地图尺寸上限很高时,最先进的基于深度特征点的方法明显优于传统方法。然而,当地图大小预算较低时,由于空间覆盖率差,在Argoverse 跟踪数据集中, 深度方法的性能低于使用更简单模型的传统方法。

Motivation

地图对于现代自动驾驶系统至关重要。具有丰富先验知识的地图提供了在线传感器无法观察到的有价值的离线精炼信息,从而提高了系统性能。现代地图,例如自动驾驶汽车使用的高精地图,大多包含高质量的密集 3D 模型和语义标签。然而,这些密集的 3D 模型需要巨大的存储空间并导致额外的在线数据处理开销。

密集的 3D 模型主要用于实现传感器到地图的精确配准,这是自动驾驶车辆在姿态估计失败时重新定位地图的关键任务,同时也减少了大规模场景下的姿态漂移误差。在实践中,除了重新定位之外,对于自动驾驶中的基本任务来说,密集的 3D 模型是不必要的。例如,运动规划、运动预测、目标跟踪和避障只需要传感器输入和带有粗略 3D 信息的语义地图标签,例如车道方向和交通灯的边界框。由于高清地图中的其他信息尺寸要小得多,因此在点云配准的过程中如果可以消除对稠密的3D模型的依赖会显著减少高精地图的尺寸大小。

虽然消除对密集 3D 模型的需求是可取的,但大多数现有的点云配准研究仅关注配准具有相似数据分布的两次扫描的准确性和速度,而传感器扫描和地图的数据分布则大不相同。相关基准通过重建精度而不是传感器到地图的配准精度来评估点云压缩性能 [1]。事实上,如果可以使用较轻量化的地图实现准确的传感器到地图配准,则无需加载完美重建的稠密3D模型。尽管一些工作已经针对所提出的特定数据格式针对地图压缩率评估了传感器到地图的配准,但没有通用标准可用于在不同压缩地图格式之间进行公平的定量比较[2], [3].

在本文中,我们关注一个通用的设置——将 3D LiDAR 点云帧注册到 3D 地图,这是现代自动驾驶汽车执行传感器到地图注册的最常见配置。这种情况下的原始地图是离线构建的高质量、密集、大规模的点云。我们建议传感器到地图配准算法应该直接在某种压缩地图格式上运行,而不是原始点云,以消除存储和处理原始大比例点云的需要。我们在下面将此过程称为压缩注册。如图 1所示,所提出的压缩配准管道与使用原始点云图的方法相比有几个优点:

1)地图特征可以离线预先计算,因为它不需要任何在线输入。

2)  如果需要,在线地图数据解压缩花费的时间更少,因为它不需要恢复密集的 3D 地图。

3)  占用更少的存储空间和数据传输时间。

图1 压缩注册的pipeline

主要贡献

  1. 提出了第一个压缩式的 LiDAR-to-map的点云注册基准. 从三个角度评估现有的 LiDAR 到地图配准方法:地图可压缩性、鲁棒性和精度

  2. 评估了最近的基于深度学习的和经典的点云配准方法,包括基于原始点、基于 GMM 和基于特征点的方法。定量结果揭示了不同方法的优劣,并为未来的研究提供了有价值的参考。

  3. 将向社区发布基准,以便将来方便地评估更多方法。

相关工作

参与对比的方法如下

其中,Map type表示了注册算法处理的数据格式。Data dimension表示使用的数据所拥有的特征维度。Deep表示是否使用深度学习。Global表示此方法是否需要一个较好的初始位姿。Scalable表示注册算法能否适应大场景的map。

方法流程

Overview

我们为各种压缩地图格式提出了一个用于压缩传感器到地图注册的通用基准。提出的压缩配准管道如图 1 所示。在管道中,我们首先执行离线地图特征计算和压缩,使用嘈杂的初始姿势裁剪局部地图,然后将输入 LiDAR 扫描注册到裁剪后的压缩地图。LiDAR 扫描被转换为评估配准方法中使用的相应格式,例如特征点或 GMM。设 P 为输入 LiDAR 扫描,Q 为局部地图,T ∈ SE(3) 为包含旋转矩阵和平移的变换矩阵。点云配准问题可以定义为:

其中f表示点云变换函数, L表示损失函数. 损失函数 L 因不同方法而异。例如,点对点 ICP 使用选定点对之间的欧几里德距离,而点对平面 ICP 使用从点到成对局部平面块的平方距离。对于在其他格式而不是原始点云上操作的方法,将 φ(.) 表示为一般特征提取函数,等式(1) 变成

其中φp(.) 和 φq(.) 不一定相同。例如,可以将原始点云注册到 GMM 模型。

Benchmark构建

本工作提出的benchmark与已有工作的不同之处在于,要匹配的两部分数据是不对称的。lidar scan更加稀疏, 携带噪声以及包含了运动目标。然而map更加稠密,并且离线构建好的,经历了去噪了移除运动物体等操作。

为了模拟实际场景中的初始位姿误差,本工作应用了随机均匀噪声。在xyz三个方向上的误差区间为[-10, 10]m,在roll pitch yaw三个角度上的误差区间为[-10, 10]度。这样的随机误差可以再现现实场景中的绝大多数可能的初始误差。

为了评估图一中的pipeline,本工作使用了KITTI Odometry以及Argoverse Tracking数据集。大概的流程是先将数据集预处理成若干数据对,每一对数据中包含局部地图以及lidar的点云帧。其中局部地图被裁剪为初始位姿周围40m的范围大小,接着被压缩成对应的形式, 点云压缩的实例如下图所示:

对于数据的预处理,我们对多帧lidar的点云进行聚合,以形成稠密的地图。由于KITTI中的真值噪声较多,我们使用SLAM替代了真值。而Argoverse中则是使用真值,对于移动物体的剔除,两个数据集同样存在差异。KITTI使用PVRCNN,Argoverse则是直接裁剪到可通行区域来移除车辆点。

Evaluation Metrics

1. Precision

该项主要评估平移和旋转的误差,令 R ∈ SO(3) 是一个旋转矩阵,t ∈ R3 是一个来自 T 的平移向量。我们通过以下方式测量精度:

2. Success Rate (SR)

平移和旋转误差都低于指定的阈值的数据对所占总数据对的比例。我们选择平移误差阈值为 2m, 旋转误差阈值为 5°

结果讨论

在我们的实验中,我们使用裁剪的地图作为目标,使用 LiDAR 扫描作为源。对于非对称方法,切换源和目标可能会影响结果。在我们评估的非对称方法中,我们使用从 GICP 和点到平面 ICP 的地图计算出的法线,因为地图更密集且噪声更少。对于 HGMR,我们在地图上构建 GMM 树,因为 GMM 树的压缩比比对原始点进行下采样更重要。我们还为 FilterReg 交换了源和目标,发现它的性能比当前配置差

对于基于点的方法,如果配准方法未提供分数,我们会随机对点进行下采样。还可以将其他下采样技术与评估方法一起应用以提高性能。

我们基于特征点的方法的结果表明,特征提取和对应过滤方法对于最终性能都至关重要。TEASER++ 通常优于经典的 RANSAC,但只有在我们的地图大小预算下与深度描述符一起使用时才能发挥最佳效果。

我们还注意到,当地图尺寸较小时,基于深度学习的方法失败主要是因为目标地图是基于特征点的,并且在密集下采样后过于稀疏。基于深度形状模型的方法可能会增加下采样地图的空间覆盖范围并提高性能。在不牺牲全局特征匹配精度的情况下进一步降低特征维度也值得更多研究。

定量实验

下面两个表格是分别在KITTI以及Argoverse数据集上的定量结果。SR表示成功率,TE表示平移误差,RE表示旋转误差。SR10 是指在给地图大小预算 10 字节/平方米的情况下测得的成功率。其他同理。

下表是成功率曲线。我们观察到,在 KITTI 和 Argoverse 中,在地图大小 = 1 字节/平方米的情况下,FCGF (TEASER++) 和 HGMR (L2) 的表现优于所有其他方法。

Abstract

We aim to assess the performance of LiDAR-to-map registration on compressive maps. Modern autonomous vehicles utilize pre-built HD (High-Definition) maps to perform sensor-to-map registration, which recovers pose estimation failures and reduces drift in a large-scale environment. However, sensor-to-map registration is usually realized by registering the sensor to a dense 3D model, which occupies massive storage space in the HD map and requires much data processing overhead. Although smaller 3D models are preferable, the optimal compressive map format for preservation of the best registration performance remains unclear.

In this paper, we propose a novel and challenging benchmark to evaluate existing LiDAR-to-map registration methods from three perspectives: map compressibility, robustness, and precision. We compared various map formats, including raw points, hierarchical GMMs, and feature points, and show their performance trade-offs between compressibility and robustness on real-world LiDAR datasets: KITTI Odometry Dataset and Argoverse Tracking Dataset. Our benchmark reveals that state-of-the-art deep feature point based methods outperform traditional methods significantly when the map size budget is high. However, when map size budget is low, deep methods are outperformed by the methods using simpler models in Argoverse Tracking Dataset due to poor spatial coverage. In addition, we observe that the recently published TEASER++ significantly outperforms RANSAC for the feature point methods. Our analysis provides a valuable reference for the community to design budgeted real-world systems and find potential research opportunities. We will release the benchmark for public use.

Reference

[1] Cao, C., Preda, M., & Zaharia, T. (2019). 3D point cloud compression: A survey. Proceedings - Web3D 2019: 24th International ACM Conference on 3D Web Technology. https://doi.org/10.1145/3329714.3338130

[2] Bai, X., Luo, Z., Zhou, L., Fu, H., Quan, L., & Tai, C. L. (2020). D3Feat: Joint learning of dense detection and description of 3D local features. Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition. https://doi.org/10.1109/CVPR42600.2020.00639

[3] Yin, H., Wang, Y., Tang, L., Ding, X., Huang, S., & Xiong, R. (2021). 3D LiDAR Map Compression for Efficient Localization on Resource Constrained Vehicles. IEEE Transactions on Intelligent Transportation Systems. https://doi.org/10.1109/TITS.2019.2961120

本文仅做学术分享,如有侵权,请联系删文。

3D视觉精品课程推荐:

1.面向自动驾驶领域的多传感器数据融合技术

2.面向自动驾驶领域的3D点云目标检测全栈学习路线!(单模态+多模态/数据+代码)
3.彻底搞透视觉三维重建:原理剖析、代码讲解、及优化改进
4.国内首个面向工业级实战的点云处理课程
5.激光-视觉-IMU-GPS融合SLAM算法梳理和代码讲解
6.彻底搞懂视觉-惯性SLAM:基于VINS-Fusion正式开课啦
7.彻底搞懂基于LOAM框架的3D激光SLAM: 源码剖析到算法优化
8.彻底剖析室内、室外激光SLAM关键算法原理、代码和实战(cartographer+LOAM +LIO-SAM)

9.从零搭建一套结构光3D重建系统[理论+源码+实践]

10.单目深度估计方法:算法梳理与代码实现

11.自动驾驶中的深度学习模型部署实战

12.相机模型与标定(单目+双目+鱼眼)

13.重磅!四旋翼飞行器:算法与实战

14.ROS2从入门到精通:理论与实战

重磅!3DCVer-学术论文写作投稿 交流群已成立

扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群,目前主要有3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、多传感器融合、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流、ORB-SLAM系列源码交流、深度估计等微信群。

一定要备注:研究方向+学校/公司+昵称,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,可快速被通过且邀请进群。原创投稿也请联系。

▲长按加微信群或投稿

▲长按关注公众号

3D视觉从入门到精通知识星球:针对3D视觉领域的视频课程(三维重建系列、三维点云系列、结构光系列、手眼标定、相机标定、激光/视觉SLAM自动驾驶等)、知识点汇总、入门进阶学习路线、最新paper分享、疑问解答五个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近4000星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

圈里有高质量教程资料、答疑解惑、助你高效解决问题

觉得有用,麻烦给个赞和在看~  

针对地图可压缩性的点云配准方法评估(IROS 2021)相关推荐

  1. GICP:基于体素泛化ICP方式的准确快速点云配准方法

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 标题: Voxelized GICP for Fast and Accurate 3D Point C ...

  2. 基于“分布 —— 多分布” 的点云配准方法

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 作者:iceytan | 来源:知乎 https://zhuanlan.zhihu.com/p/135 ...

  3. KSS-ICP: 基于形状分析技术的点云配准方法

    目录 1. 概述 2. 算法实现 3. 实验结果 总结 Reference 三维点云配准是三维视觉领域一个经典问题,涉及三维重建,定位,SLAM等具体应用问题.传统的配准可以被分为两条技术路线,即基于 ...

  4. 视频+课件| PointDSC:基于特征匹配的点云配准方法(CVPR2021)

    写在前面 感谢「3D视觉从入门到精通」知识星球嘉宾白旭阳博士为我们带来的主题为PointDSC:基于特征匹配的点云配准方法(CVPR2021)视频讲解,星球成员可免费观看学习.备注:白旭阳,香港科技大 ...

  5. 两种常见的点云配准方法ICPNDT

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 作者:于凡 https://zhuanlan.zhihu.com/p/96908474 本文转载自知乎 ...

  6. 重磅直播 | PointDSC:基于特征匹配的点云配准方法(CVPR2021)

    大家好,本公众号现已开启线上视频公开课,主讲人通过B站直播间,对3D视觉领域相关知识点进行讲解,并在微信群内完成答疑. 本期由香港科技大学计算机系白旭阳博士分享,分享的主题为<基于特征匹配的鲁棒 ...

  7. 点云配准方法原理(NDT、ICP)

    配准是点云处理中的一个基础问题,众多学者此问题进行了广泛而深入的研究,也出现了一系列优秀成熟的算法,在三维建模.自动驾驶等领域发挥着重要的作用. 本文主要介绍粗配准NDT (Normal Distri ...

  8. 点云配准方法:ICP与GICP

    ICP已经成为点云配准的主流算法,因此,这两天测试了PCL库中的两个ICP函数: pcl::GeneralizedIterativeClosestPoint< PointSource, Poin ...

  9. 用于精确导航和场景重建的 3D 配准方法(ICRA 2021)

    Differential Information Aided 3-D Registration for Accurate Navigation and Scene Reconstruction 作者: ...

最新文章

  1. 2019牛客暑期多校训练营(第三场)
  2. mysql9索引实战_课程介绍目录索引
  3. web前端 vue、react、angular三大框架对比 与jquery的对比
  4. Android -- setWillNotDraw()
  5. Ultra96_v2实现交通标示识别
  6. 【收集】常用网络上的Webservice地址
  7. 同时运行两个PHP吗,PHP-避免由两个工作人员同时运行后台作业
  8. Python数据分析与处理扩展库pandas常用选项设置
  9. DataTable两列转换四列
  10. 【10天基于STM32F401RET6智能锁项目实战第2天】GPIO与寄存器
  11. 【进阶修炼】——改善C#程序质量(9)
  12. Objective-C 常用结构体
  13. js时间戳写入mysql
  14. 有关不平衡学习与SMOTE算法
  15. kindle使用参考
  16. android 启动第三方APP的方式
  17. 计算机ppt以学校生活为主题的作文,以校园为主题的作文(通用5篇)
  18. 18位 身份证号 的 组成 部分
  19. cacheable更新_详解Spring缓存注解@Cacheable,@CachePut , @CacheEvict使用
  20. eNSP之防火墙简单实验(一)

热门文章

  1. Spring中使用缓存时你应该知道的知识
  2. 更新到10.11系统之后cocoapods遇到的问题
  3. JQUERY知识总结
  4. Android Wi-Fi基本操作
  5. 10款在线格式转化应用
  6. C#操作注册表全攻略
  7. Windows Server 2008 Server Core - 小脚印,大安全
  8. TIDB,面向未来的数据库到底是什么?
  9. “官宣”:程序员被正式纳入新生代农民工!
  10. 我又发现了7个让人心动的宝藏软件,很少有人知道