摘要

我们介绍了相似性组提议网络(SGPN),这是一种用于点云上3D对象实例细分的简单直观的深度学习框架。  SGPN使用单个网络来预测点分组建议和每个建议的对应语义类,我们可以从中直接提取实例分割结果
   对于SGPN的有效性而言,重要的是其新颖的3D实例分割结果,以相似度矩阵的形式表示,该矩阵指示嵌入式特征空间中每对点之间的相似度,从而为每个点提供准确的分组建议。 在各种3D场景上的实验结果证明了我们的方法在3D实例分割中的有效性,并且我们还评估了SGPN改善3D对象检测和语义分割结果的能力。 我们还通过将2D CNN功能无缝集成到框架中以提高性能来证明其灵活性。

1. Introduction

最近,在2D图像上进行实例分割已经取得了可喜的成果[18,10,31,23]。 随着自动驾驶和机器人技术的兴起,近来对3D场景理解和3D场景数据可用性的需求迅速增长。 不幸的是,有关3D实例分割和对象检测的文献远远落后于2D实例。 使用卷积神经网络(CNN)[44、45、11]对3D体积数据的场景理解受到内存和计算成本高的限制。 最近,点云上的深度学习框架Point Net / Pointnet ++ [33,35]开辟了更高效,更灵活的方式来处理3D数据。
   继2D场景理解方面的开创性工作之后,我们的目标是为点云上的3D实例感知语义段开发端到端训练的新型深度学习框架,例如为2D场景理解任务建立baseline系统,是直观,简单,灵活和有效的。

在点云上进行实例分割的重要考虑因素是如何表示输出结果。 受到预测具有可变输出数量的任务的启发,我们引入了相似性小组提案网络(SGPN),该网络通过学习新的3D实例分段表示形式来制定对象实例的小组提案。 相似度矩阵。
   我们的pipeline首先使用PointNet / PointNet ++为点云中的每个点提取描述性特征向量。
   作为相似性度量学习的一种形式,我们强制执行以下想法:属于同一对象实例的点应具有非常相似的特征;例如, 因此,我们测量每对点的特征之间的距离,以形成一个相似度矩阵,该矩阵指示任何给定的点对是否属于同一对象实例。

我们的相似性矩阵中的行可以被视为立场候选者,我们将其与学习的置信度得分相结合,以生成合理的group proposals。
   我们还学习了语义分割图,以便对从小组建议中获得的每个对象实例进行分类
   我们还能够直接导出用于对象检测的紧密3D边界框
   通过简单地测量每对点的待定特征表示之间的距离,我们的相似度矩阵简化了我们的流程,因为我们仍然停留在通过点之间的关系定义对象的自然点云表示中。
   总而言之,SGPN具有三个输出分支,用于在点云上进行实例分割:相似矩阵生成按点分组建议,用于修剪这些建议的置信度图以及用于为每个组提供类别标签的语义分割图。
   我们在3D形状(ShapeNet [4])和真实3D场景(斯坦福室内语义数据集[1]和NYUV2 [42])上评估我们的框架,并证明SGPN在3D实例上取得了最新的成果 细分。 我们还进行了全面的实验,以展示SGPN在点云上实现3D语义分割和3D对象检测的高性能。 尽管简约框架已经给出了视觉上令人愉悦的结果(图1),但我们还展示了SGPN的灵活性,因为我们通过无缝集成RGBD图像中的CNN功能进一步提高了性能。

2.相关工作

2.1。 对象检测和实例分割

在2D图像上,对象检测[39、14、24、37、38、26、13、25]和实例分割[23、10、9、32、31]的最新进展取得了可喜的成果。 用于二维物体检测的R-CNN [15]通过引入区域提议作为候选物体区域建立了基线系统。
   更快的R-CNN [39]利用了CNN学习方案并提出了区域提议网络(RPN)。  YOLO [37]将图像分为网格,每个网格单元产生一个对象建议。 许多2D实例分割方法都是基于分割建议的。  DeepMask [31]学习生成分段提案,每个分段提案都具有相应的目标评分。 戴等。  [10]预测分段可以从边界框提议中做出贡献。 Mask R-CNN [18]通过在RPN顶部添加一个分支来生成对象遮罩以进行实例分割,从而扩展了快速R-CNN。
   在这些开创性的2D工作之后,出现了3D边界框检测框架[40、44、45、11、5]。Song和Xiao [45]使用体积CNN在体素化3D场景上创建3D RPN,然后针对每个方案在联合3D和2D对象识别网络中使用图像的颜色和深度数据。Deng和Latecki [11]仅基于RGBD图像外观特征对类3D边界框模型进行回归。  Armeni等[1]使用带有CRF的滑动形状方法在点云上执行3D对象检测。 据我们所知,没有以前的工作可以学习3D实例分割。

 2.2。  3D深度学习

卷积神经网络可以通过对体素执行卷积来完成某些任务,例如对象分类[34、48、27、51、41、29、30],形状重构[49、17、8],从而很好地将3D泛化为3D 以及第2.1节中提到的3D对象检测。 但是,体积表示法具有很高的存储和计算成本,并且在处理3D场景时有很大的局限性[7,1,46]。 最近已经引入了基于八进制的CNN [41、47、48],但是它们不像批量CNN那样灵活,并且仍然存在内存效率问题。
   点云是一种直观的,内存高效的3D表示形式,非常适合于使用深度学习来表示3D实例细分的详细大场景。  Point Net / Pointnet ++ [33,35]最近介绍了在3D点云上的深层神经网络,学习了对象分类,零件和语义场景分割等任务的成功结果。 我们基于PointNet / PointNet ++建立网络架构,从而实现了一种学习点云上3D实例分割的新颖方法。

2.3。 相似度度量学习

我们的工作也与相似度度量学习密切相关,相似度学习已广泛用于深度学习中的各种任务,例如人员重新识别[52],匹配[16],图像检索[12、50]和 人脸识别[6]。
   通过测量两个输入图像的相似度,将暹罗CNN [6、43、3]用于诸如跟踪[22]和单次学习[20]之类的任务。 亚历杭德罗等 al [28]引入了一种联合嵌入方法,通过强制同一组中的像素在其嵌入空间中应具有相似的值,而无需实际执行那些确切的值,从而将相似的像素分组以进行多人姿势估计和2D实例分割。 应该。 我们的方法以不同的方式利用度量学习,因为我们回归了属于同一组的两个点的相似似然度,并将相似度矩阵作为组提案来模拟以处理可变数量的实例。

3.方法

本文的目的是获取一个3D点云,并为每个点生成一个对象实例标签,为每个实例生成一个类标签。

利用点云深度学习的最新发展[33,35],我们引入了一个相似性组提议网络(SGPN),该网络使用3D点云并输出一组实例建议,每个实例建议都包含点组 在实例及其类标签中。

第3.1节介绍了SGPN的设计和属性。  3.2节提出了一种算法,用于合并相似的组并为每个点分配一个实例标签。  3.3节给出了实现细节。图2描绘了我们系统的概述。

 3.1。Similarity Group Proposal Network

SGPN是一个非常简单直观的框架。 如图2所示,它首先通过PointNets [33,35]启发的前馈特征提取网络传递大小为Np的点云P,学习点云中的全局和局部特征。 这个特征提取网络产生一个矩阵F.然后SGPN分成三个分支,每个分支使F通过单个PointNet层以获得大小为Np×Nf的特征矩阵FSIM,FCF和FSEM,我们分别使用它们来获得相似性矩阵, 置信度图和语义分割图。  Np×Nf特征矩阵中的第i行是Nf维向量,表示嵌入特征空间中的点Pi。 我们的损失L由以下三个分支的损失之和得出:L = LSIM + LCF + LSEM。 、
   相似度矩阵我们提出了一个新颖的相似度矩阵S,从中我们可以制定group proposal来直接恢复准确的实例分割结果。  S是维Np×Np,元素Sij对点Pi和Pj是否属于同一对象实例进行分类。
   S的每一行都可以视为构成候选对象实例的建议的点组合。
   我们利用属于同一对象的点应该具有相似的特征,并且在特征空间中非常接近。 对于每对点{Pi,Pj},我们通过简单地减去它们对应的特征向量{FSIMi,FSIMj}并采用L2范数,获得S。 这样可以将实例分割的问题减少到学习一个嵌入空间,该空间中同一实例中的点彼此靠近,而不同对象实例中的点彼此远离。
   为了更好地理解SGPN如何捕获点之间的相关性,在图3(a)中,我们可视化了给定点与点云中其余点之间的相似度(特征空间中的欧式距离)。 在不同情况下的点在特征空间中具有更大的欧氏距离,因此,即使它们具有相同的语义标签,其相似性也较小。 例如,在图3(a)的右下角图像中,尽管给定的桌腿点与其他桌腿点的相似度比桌面大,但仍可与其他桌腿区分开。

5.结论

我们提出了SGPN,这是一种用于点云上3D实例分割的直观,简单且灵活的框架。
   通过引入相似度矩阵作为我们的输出表示,可以轻松地从单个网络中生成具有类预测的group proposal。 实验表明,该算法在各种3D场景的实例分割中均能取得良好的性能,并简化了3D对象检测和语义分割的任务
   未来的工作尽管相似度矩阵可以提供直观的表示和易于定义的损失函数,但SGPN的局限性在于,随着Np的增加,相似度矩阵的大小将呈二次方缩放。 因此,尽管比体积方法具有更高的存储效率,但SGPN无法处理105点或更多点上的超大场景。 未来的研究方向可以考虑使用基于SGPN选择的种子来生成组,以减少相似性矩阵的大小。  SGPN也可以扩展到将来的工作中,以在无人监督的情况下学习或学习实例分割以外的更多不同类型的数据表示。

SGPN: Similarity Group Proposal Network for 3D Point Cloud Instance Segmentation相关推荐

  1. 03 PF-Net: Point Fractal Network for 3D Point Cloud Completion

    PF-Net: Point Fractal Network for 3D Point Cloud Completion 摘要 创新性 思路启发 网络结构 几点思考 参考资料 论文地址:https:// ...

  2. PF-Net: Point Fractal Network for 3D Point Cloud Completion

    PF-Net:用于三维点云补全的点分形网络 Abstract   在本文中,我们提出了一种点分形网络(PF-Net),一种新的基于学习的精确高保真点云补全方法.与现有点云补全网络不同,现有点云补全网络 ...

  3. (NeurIPS 2019) Learning Object Bounding Boxes for 3D Instance Segmentation on Point Clouds

    Abstract 我们提出了一种新颖的.概念上简单的通用框架,用于在3D点云上进行实例分割.我们的方法称为3D-BoNet,遵循每点多层感知器(MLP)的简单设计理念.该框架直接回归点云中所有实例的3 ...

  4. 3D Instance Segmentation via Multi-Task Metric Learning

    Abstract 我们提出了一种新方法,用于密集3D体素网格的实例标签分割.我们的目标是使用深度传感器或多视图立体方法获取的体积场景表示,并使用语义3D重建或场景完成方法进行处理.主要任务是学习有关单 ...

  5. 【文献翻译CVPR2022】SoftGroup for 3D Instance Segmentation on Point Clouds

    点云三维实例分割的软分组 目录 点云三维实例分割的软分组 摘要 1 简介 2 相关工作 3 方法 3.1 逐点预测网络 3.2 软分组 3.3 自上而下的精细化 3.4 多任务学习 4 实验 4.1 ...

  6. 两阶段3D目标检测网络 SIENet: Spatial Information Enhancement Network for 3D Object Detection from Point Cloud

    本文介绍一篇两阶段的3D目标检测网络:SIENet. 这里重点是理解本文提出的 Hybrid-Paradigm Region Proposal Network 和 Spatial Informatio ...

  7. 【论文研读】Similarity of Neural Network Representations Revisited (ICML2019)

    Title: Similarity of Neural Network Representations Revisited (ICML2019) Author:Simon Kornblith ...( ...

  8. 无人机数车--Drone-based Object Counting by Spatially Regularized Regional Proposal Network

    Drone-based Object Counting by Spatially Regularized Regional Proposal Network ICCV2017 数据库:https:// ...

  9. 目标检测方法简介:RPN(Region Proposal Network) and SSD(Single Shot MultiBox Detector)

    原文引用:http://lufo.me/2016/10/detection/ 最近几年深度学习在计算机视觉领域取得了巨大的成功,而在目标检测这一计算机视觉的经典问题上直到去年(2015)才有了完全使用 ...

最新文章

  1. Python面试基础题-2018-12-26
  2. vim配置及插件安装笔记
  3. 视图添加字段_使用ExploreByTouchHelper辅助类为自定义视图添加虚拟视图
  4. 使用ZooKeeper编程 - 一个基本教程
  5. 虚拟机运行Gazebo出现VMware: vmw_ioctl_command error
  6. WPF TextBox控件中文字实现垂直居中
  7. windows--bat--右键菜单
  8. K3 工业单据的对应相关表作用
  9. 题解第八届蓝桥杯B.等差素数列
  10. rgb的原理以及应用简介
  11. IBM应用SOA 开创网上“虚拟故宫”
  12. 汽车电子ECU bootloader工作原理及开发要点
  13. 桌面放大镜、演示工具推荐——ZoomIt
  14. python大一期末考试_python期末考试复习试卷
  15. 谷歌及360浏览器插件制作
  16. el-table设置表头样式,在table行间加入
  17. 百度飞桨的乌镇时刻:拿下的至高荣誉和背后的绝对实力
  18. android7.0/8.0使用第三方软件battery monitor等软件读取电池电量,显示电池容量与实际容量不符修改
  19. 消费者不好骗!2021过半,网红品牌为毛集体“玩崩”了?
  20. 方向标Directional Sign

热门文章

  1. Hxro将采用Solana作为第一层区块链,并过渡为完全去中心化的链上衍生品网络
  2. SAP License:最近事情的一些随笔
  3. 信贷中的SAS,一份关于它的系统性内容|含案例
  4. 《如何搭建小微企业风控模型》第一节 小微企业数据贷发展情况概述
  5. 14-----表单输入绑定
  6. 检测到目标服务器启用了TRACE方法
  7. 几何画板菜单栏有哪些功能
  8. 拖动窗体FormBorderStyle属性为None的窗体移动
  9. Android开发14——监听内容提供者ContentProvider的数据变化
  10. html/js/css资源