点击上方“3D视觉工坊”,选择“星标”

干货第一时间送达

作者丨paopaoslam

来源丨泡泡机器人SLAM

标题:A Technical Survey and Evaluation of Traditional Point Cloud Clustering Methods for LiDAR Panoptic Segmentation

作者:Yiming Zhao Xiao Zhang Xinming Huang

来源:ICCV 2021

编译:廖邦彦

摘要

激光雷达全景分割是一项新提出的自动驾驶技术任务。与流行的端到端深度学习解决方案相比,我们提出了一种结合现有用于提取语义信息的语义分割网络的和一种传统的激光雷达点云聚类算法用于分割每个实例对象的混合方法。我们认为,在SemanticKITTI 数据集的全景分割排行榜上,基于几何信息的传统聚类算法相较于所有已发表的端到端深度学习解决方案达到SOTA性能值得考虑。据我们所知,我们是第一个尝试用聚类算法进行点云全景分割。因此,本文对四种典型的聚类方法进行了全面的技术调查,以及其在基准上的性能。这四种聚类方法是最具有代表性的、具有实时运行能力的方法。它们在本文中使用C++实现,然后包装为一个python函数,与现有的深度学习框架无缝集成。我们为同行研究人员开源了代码,代码地址 https://github.com/placeforyiming/ICCVW21-LiDAR-PanopticSegmentation-TradiCV-Survey-of-Point-Cloud-Cluster

主要贡献

  • 我们提出了一种新的激光雷达全景分割框架。我们首次演示了用语义网络和传统的聚类方法来求解激光雷达全景分割的可行性。此解决方案优于最近发布的所有端到端神经网络解决方案。经典的聚类方法在CPU上以毫秒级运行,减轻了实例部分的标记工作,并有机会更好地适应全新的未训练过的场景,因为它对训练集没有偏好。作为一种传统的方法,它不是一个网络风格的黑盒,因此可以让人们清楚地知道该方法何时表现好或坏。

  • 我们建立了一个激光雷达聚类算法的基准。以往关于激光雷达聚类方法的一个研究问题是,由于存在大的非物体表面,比如墙壁和地面,所以对于这些物体存在评价度量模糊。在这篇文章,我们通过使用具有已发布代码和检查点的语义模型框架来过滤掉所有这些非对象点。因此,聚类算法只会关注属于对象的点。我们进一步使用公认的全景分割的评价指标来直接评估和比较不同聚类方法的有效性。感谢SemanticKITTI数据集和排行榜,未来关于激光雷达聚类主题的研究可以遵循我们的基准作为实际的比较基线。

方法概述

Selected Reviewed Methods

现有的点云聚类方法可以被大致总结为四种类型,基于3D欧式空间的方法,使用超栅格或者超点来聚类点云的方法,在深度图上的改进单通道连通域标记方法,和在深度图上的的改进两通道连通域标记方法。在这个方法回顾部分,我们在每种算法中选取最具代表性的算法并且基于更加详细的介绍。

Euclidean Cluster

欧式聚类是一种简单的聚类方法。首先在整个点云上构造kd树,然后将半径阈值内的所有邻点聚类成为一个实例。

Supervoxel Cluster

Supervoxel(SLIC)是一种著名的传统图像处理操作,它将局部像素分组为具有类似特征的更大像素。超体素被设计在RGB-D点云上,相对应于二维图像上的超像素。与超像素相比,超体素有三个主要的差异。第一个是关于初始化的种子点。在超体素中,聚类的种子点是通过三维空间分割得到的,而不是投影的图像平面。第二个区别是一个额外的约束,即在考虑聚类点的迭代聚类算法中,对被占用的体素采取严格的空间连通性约束。第三个是在k-means算法中使用的距离定义。在超体素中,不再考虑二维图像上的距离,而是进一步考虑法向量的角度以及颜色的相似性。请注意,点云库(PCL)中超体素距离的定义与原论文不同。我们选择了原论文在PCL中实现的一种。距离D在下式中定义。空间距离D_s通过种子点的分辨率进行归一化,颜色距离D_c为归一化RGB空间中的欧氏距离,法向距离Dn用于测量表面法向量之间的夹角。w_c、w_s和w_n分别为颜色权重、空间权重和法向权重。

在本文中,我们研究的是没有RGB颜色信息的激光雷达点云,因此我们将所有点的颜色距离D_c设置为零。剩余的迭代k-means算法与二维图像上的超像素SLIC相同。上式的公式能够有效平衡局部法向量和局部欧氏距离的平衡。

Depth Cluster

Depth Cluster算法是激光雷达深度图上的一种快速单通CCL(连通域标记)算法。二进制图像上的CCL算法需要检查两个相邻像素是否都有相同强度。但是,激光雷达深度图上的CCL需要确定两个相邻点是否来自同一对象的条件。在深度聚类算法中,通过使用图中所示的神奇角度β来定义该条件。作者认为,如果β大于一个角度阈值θ,那么点a和点B来自同一个对象。在本文中,我们选择θ=10o作为阈值。

Scan-line Run Cluster 

Scan-line Run(SLR)聚类是一种基于点云或深度图的逐行快速扫描算法。该方法是激光雷达深度图上基于图像的双通连通域标记(CCL)算法的对应方法。在SLR中,所有从相同的水平角度发出的点都被识别为一条扫描线。在一条扫描线中,所有更接近阈值Th_run的临近点都被聚类在一起,称为一个run。

一开始,SLR从第一行开始,然后将欧氏距离小于阈值Th_run的所有临近点分组在一起作为一个run。每个run都被分配一个唯一的标签作为初始聚类。接下来,SLR移动到第二行,重复运行分割,并检查第二行中的新run是否符合用新的阈值Th_merge定义的合并条件。如果两个run满足合并条件,则它们将被合并在一起。该标签也将被传递。如果第二行中的新run不符合以前任何运行的合并条件,则将分配一个新的聚类标签。对于这种情况,如果两个集群在一个新的线中相遇,SLR将把它们与较小的聚类标签合并。此过程将保持逐行移动,直到处理完所有激光雷达扫描线。我们在下图中可视化了这个过程。

该算法在下图中进行了总结。其中的查找最近邻函数的目标是在前一个扫描线中搜索最近的点。最初的论文提供了几种查询最近邻的方法。

实验结果

对于传统方法效果比较

对于使用Cylinder3D + SLR的方法和其它方法的比较

对于在SemanticKITTI数据集上使用Scan-line方法的一个可视化

最后是作者在其电脑上对于传统方法运算时间的比较

Abstract

LiDAR panoptic segmentation is a newly proposed technical task for autonomous driving. In contrast to popular end-to-end deep learning solutions, we propose a hybrid method with an existing semantic segmentation network to extract semantic information and a traditional LiDAR point cloud cluster algorithm to split each instance object. We argue geometry-based traditional clustering algorithms are worth being considered by showing a state-of-the-art performance among all published end-to-end deep learning solutions on the panoptic segmentation leaderboard of the SemanticKITTI dataset. To our best knowledge, we are the first to attempt the point cloud panoptic segmentation with clustering algorithms. Therefore, instead of working on new models, we give a comprehensive technical survey in this paper by implementing four typical cluster methods and report their performances on the benchmark. Those four cluster methods are the most representative ones with real-time running speed. They are implemented with C++ in this paper and then wrapped as a python function for seamless integration with the existing deep learning frameworks. We release our code for peer researchers who might be interested in this problem.

如果你对本文感兴趣,想要下载完整文章进行阅读

本文仅做学术分享,如有侵权,请联系删文。

3D视觉精品课程推荐:

1.面向自动驾驶领域的多传感器数据融合技术

2.面向自动驾驶领域的3D点云目标检测全栈学习路线!(单模态+多模态/数据+代码)
3.彻底搞透视觉三维重建:原理剖析、代码讲解、及优化改进
4.国内首个面向工业级实战的点云处理课程
5.激光-视觉-IMU-GPS融合SLAM算法梳理和代码讲解
6.彻底搞懂视觉-惯性SLAM:基于VINS-Fusion正式开课啦
7.彻底搞懂基于LOAM框架的3D激光SLAM: 源码剖析到算法优化
8.彻底剖析室内、室外激光SLAM关键算法原理、代码和实战(cartographer+LOAM +LIO-SAM)

9.从零搭建一套结构光3D重建系统[理论+源码+实践]

10.单目深度估计方法:算法梳理与代码实现

重磅!3DCVer-学术论文写作投稿 交流群已成立

扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群,目前主要有3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、多传感器融合、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流、ORB-SLAM系列源码交流、深度估计等微信群。

一定要备注:研究方向+学校/公司+昵称,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,可快速被通过且邀请进群。原创投稿也请联系。

▲长按加微信群或投稿

▲长按关注公众号

3D视觉从入门到精通知识星球:针对3D视觉领域的视频课程(三维重建系列三维点云系列结构光系列、手眼标定、相机标定、激光/视觉SLAM自动驾驶等)、知识点汇总、入门进阶学习路线、最新paper分享、疑问解答五个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近4000星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

圈里有高质量教程资料、答疑解惑、助你高效解决问题

觉得有用,麻烦给个赞和在看~  

综述:激光雷达全景分割的传统点云聚类方法的技术总结相关推荐

  1. 八种点云聚类方法(二)— KMeans

    传统机器学习聚类的方法有很多种,并且很多都能够应用在点云上.这是由于聚类方法一般是针对于通用样本,只是样本的维度有所不同.对于三维点云来说,其样本的维度为3.这里主要介绍几种典型的方法及其实现方式,包 ...

  2. 八种点云聚类方法(三)

    本文为博主原创文章,未经博主允许不得转载. 本文为专栏<python三维点云从基础到深度学习>系列文章,地址为"https://blog.csdn.net/suiyingy/ar ...

  3. [自动驾驶-目标检测] C++ PCL 连通域点云聚类

    文章目录 引言 标签连通域聚类原理 Octree + LCC 代码实现 Octree + LCC 测试结果 Octree + LCC 的优缺点 改进思路 参考文献 引言 在实际实现3D目标检测时,在不 ...

  4. 基于全景图像与激光点云配准的彩色点云生成算法(2014年文章)

    标题:The algorithm to generate color point-cloud with the registration between panoramic imageand lase ...

  5. 解决尺度不平衡,Facebook 全景分割新算法

    点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要10分钟 Follow小博主,每天更新前沿干货 转载自:机器之心 高分辨率图像上的全景分割面临着大量的挑战,当处理很大或者很小的物体时可能会遇 ...

  6. Facebook人工智能实验室提出「全景分割」,实现实例分割和语义分割的统一

    原文来源:arxiv 作者:Alexander Kirillov.Kaiming He1.Ross Girshick.Carsten Rother.Piotr Dollar 「雷克世界」编译:嗯~阿童 ...

  7. Transformer霸榜全景分割任务,南大、港大提出一种通用框架!

    来源:机器之心 本文中,来自南大.港大.英伟达等机构的研究者提出了一个使用 transformer 进行端到端全景分割的通用框架,不仅为语义分割与实例分割提供了统一的 mask 预测工作流程,而且使得 ...

  8. 更快更强,谷歌提出SWideRNet:全景分割新标杆来啦!

    作者丨Happy 编辑丨极市平台 导读 本文是DeepLab系列作者"Liang-Chieh Chen"大神在全景分割领域的又一力作.它在Wide-ResNet的基础上引入SE与& ...

  9. 拿transformer做E2E全景分割,这个通用框架霸榜挑战赛,南大、港大联合提出

    视学算法报道 机器之心编辑部 本文中,来自南大.港大.英伟达等机构的研究者提出了一个使用 transformer 进行端到端全景分割的通用框架,不仅为语义分割与实例分割提供了统一的 mask 预测工作 ...

最新文章

  1. JDK 序列化, 碰到serialVersionUID 不一致问题,怎么处理?
  2. 苹果向App Analytics添加新的指标和特性
  3. Win7+Ubuntu双系统,如何卸载Ubuntu系统?
  4. 使用aardio(快手)编程
  5. FPGA在各行业的应用分析
  6. HDU 4135 Co-prime
  7. OpenCV使用F变换过滤
  8. TIMING_04 时序约束的一般步骤
  9. 编程应该用 Mac ,还是 PC ?
  10. 如何使用JavaScript访问对象的键中有空格的对象?
  11. 7价 半导体掺杂_掺杂工艺(一)
  12. PHP uniqid()函数可用于生成不重复的唯一标识符,该函数基于微秒级当前时间戳。在高并发或者间隔时长极短(如循环代码)的情况下,会出现大量重复数据。即使使用了第二个参数,也会重复,最好的方案是结
  13. PHPExcel基本使用(2) 导入图片
  14. SSH 登录失败:Host key verification failed 的处理方法
  15. 163Editor 编辑器概览
  16. 现代文文言文转化器_初中语文丨7个文言文背诵技巧,不再为背书发愁,实用收藏...
  17. win7计算机怎么录屏,win7电脑怎么录屏?这个实用工具给你答案!
  18. CCFCSP历年认证考试真题解答汇总(已解决20道,持续更新ing)
  19. 窝囊同事做测试三年未涨工资,被开当天,bat全部大佬门口迎接!
  20. Grammarly:最优秀的日常英文写作辅助工具——论文英文校验

热门文章

  1. Open***2.4.3 基于用户名密码验证方式(实战)
  2. 开源中国git关联xcode操作步骤
  3. WEB客户端和服务器
  4. 剑指offer-面试题20.顺时针打印矩阵
  5. NClay.MVC是MVP?
  6. JDK8:Lambda表达式操作List集合
  7. 陷阱太多!究竟该如何应对逆袭神器期权?某程序员历经4次上市公司,终于顿悟!...
  8. 由SELECT *引发的多个生产故障,问题藏太深了吧……
  9. 不能精准定位bug?可能是你没get到这几个打印日志的诀窍!
  10. 面试官:说说你对ZooKeeper集群与Leader选举的理解?