点击上方“小白学视觉”,选择加"星标"或“置顶

重磅干货,第一时间送达

本文对牛津大学、DeepMind 等单位合作完成的论文《Learning Object Bounding Boxes for 3D Instance Segmentation on Point Clouds》进行解读,该论文发表在NeurIPS 2019上,目前代码已公开。

链接: arxiv.org/abs/1906.0114

代码: https://github.com/Yang7879/3D-BoNet

论文第一作者为牛津大学博士生杨波,本文作者为这项工作的作者之一 Qingyong Hu。

该论文提出了一种新型的 3D 点云实例分割的框架——3D-BoNet。这是一种基于边界框回归的高效点云实例分割算法,通过最小化匹配代价函数来实现大致的边界框回归,并通过point mask预测来实现最终的实例分割。3D-BoNet 在 ScanNet 和 S3DIS 数据集上都达到了SOTA的效果,且更加高效。

先上图:

实现有效的三维场景理解(3D scene understanding)是计算机视觉和人工智能领域的关键问题之一。近年来,针对三维点云理解的研究取得了显著的进展,在诸如点云目标检测,语义分割等任务上都展现出了很不错的效果。然而,针对于点云实例分割的研究还处于较为初级的阶段。

当前主流的点云实例分割算法可以分为以下两类,如下图所示:

图1. 当前主流的点云实例分割算法对比

1)基于候选目标框(Proposal-based methods)的算法,例如3D-SIS[1],GSPN[2],这类方法通常依赖于两阶段的训练(two-stage training)和昂贵的非极大值抑制(non-maximum suppression, NMS)等操作来对密集的proposal进行选择。

2)无候选目标框的算法(Proposal-free methods),例如SGPN[3], ASIS[4], JSIS3D[5], MASC[6], 3D-BEVIS[7]等。这类算法的核心思想是为每个点学习一个discriminative feature embedding,然后再通过诸如mean-shift等聚类(clustering)方法来将同一个instance的点聚集(group)到一起。这类方法的问题在于最终聚类到一起的instance目标性(objectness)比较差。此外,此类方法后处理步骤(post-processing)的时间成本通常较高。

不同于上述两类方法,我们提出了一个single stage, anchor free并且end-to-end的基于边界框回归的实例分割算法(3D-BoNet)。该算法具有如下优势:

  • 相比于proposal-free的方法,3D-BoNet显式地去预测目标的边界框,因此最终学到的instance具有更好的目标性(high objectness).

  • 相比于proposal-based的方法,3D-BoNet并不需要复杂耗时的region proposal network以及ROIAlign等操作,因此也不需要NMS等post-processing步骤。

  • 3D-BoNet由非常高效的shared MLP组成,并且不需要诸如非极大值抑制,特征采样(feature sampling),聚类(clustering)或者投票(voting)等后处理步骤,因此非常高效。

Reference

[1] J. Hou, A. Dai, and M. Nießner. 3D-SIS: 3D Semantic Instance Segmentation of RGB-D Scans. CVPR, 2019

[2] L. Yi, W. Zhao, H. Wang, M. Sung, and L. Guibas. GSPN: Generative Shape Proposal Network for 3D Instance Segmentation in Point Cloud. CVPR, 2019.

[3] W. Wang, R. Yu, Q. Huang, and U. Neumann. SGPN: Similarity Group Proposal Network for 3D Point Cloud Instance Segmentation. CVPR, 2018.

[4] X. Wang, S. Liu, X. Shen, C. Shen, and J. Jia. Associatively Segmenting Instances and Semantics in Point Clouds. CVPR, 2019.

[5] Q.-H. Pham, D. T. Nguyen, B.-S. Hua, G. Roig, and S.-K. Yeung. JSIS3D: Joint Semantic-Instance Segmentation of 3D Point Clouds with Multi-Task Pointwise Networks and Multi-Value Conditional Random Fields. CVPR, 2019.

[6] C. Liu and Y. Furukawa. MASC: Multi-scale Affinity with Sparse Convolution for 3D Instance Segmentation. arXiv, 2019.

[7] C. Elich, F. Engelmann, J. Schult, T. Kontogianni, and B. Leibe. 3D-BEVIS: Birds-Eye-View Instance Segmentation. GCPR, 2019.

[8] H. W. Kuhn. The Hungarian Method for the assignment problem. Naval Research Logistics Quarterly, 2(1-2):83–97, 1955.

[9] H. W. Kuhn. Variants of the hungarian method for assignment problems.Naval Research LogisticsQuarterly, 3(4):253–258, 1956

[10] T.-Y. Lin, P. Goyal, R. Girshick, K. He, and P. Dollar. Focal Loss for Dense Object Detection. ICCV, 2017.

下载1:OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复:扩展模块中文教程即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2:Python视觉实战项目52讲

在「小白学视觉」公众号后台回复:Python视觉实战项目即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。

下载3:OpenCV实战项目20讲

在「小白学视觉」公众号后台回复:OpenCV实战项目20讲即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。

交流群

欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~

NeurIPS | 3D-BoNet:3D 点云实例分割的新框架相关推荐

  1. 3D-BoNet:比3D点云实例分割算法快10倍!代码已开源

    点击我爱计算机视觉标星,更快获取CVML新技术 本文转载自新智元(AI_era)   新智元报道   来源:投稿 编辑:元子 [新智元导读]本文提出了一种基于边界框回归的高效点云实例分割算法,通过最小 ...

  2. 基于感知能力的点云实例分割

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 来源:OpenCV中文网 论文标题:Instance-Aware Embedding for Poin ...

  3. PointGroup点云实例分割

    文章目录 简介 环境 项目文件 环境准备 spconv pointgroup_ops 数据集 下载脚本 下载数据集 划分数据集 训练 测试&可视化 可视化 简介 分类(Classify)和分割 ...

  4. 3D卷积GAN飞起!微软“可缩放”新框架只需2D数据即可生成逼真3D模型

    点击我爱计算机视觉标星,更快获取CVML新技术 本文转载自新智元.   新智元报道   来源:VB 编辑:元子 [新智元导读]Microsoft Research近日发表论文介绍了一种通过2D数据生成 ...

  5. 【CV】Mask R-CNN:用于目标实例分割的通用框架

    论文名称:Mask R-CNN 论文下载:https://arxiv.org/abs/1703.06870 论文年份:2017 论文被引:18354(2022/05/03) Abstract We p ...

  6. 基于三维点云场景的语义及实例分割:RandLA-Net和3D-BoNet

    本文整理自牛津大学的杨波和胡庆拥在深蓝学院的线上公开课论文演讲.两位作者都是来自牛津大学的博士生,RandLA-Net和3D-BoNet分别发表在CVPR20和NeurIPS19上,两份工作都具有非常 ...

  7. [CVPR 2020] RandLA-Net:大场景三维点云语义分割新框架(已开源)

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 本文由知乎作者Qingyong Hu授权转载,不得擅自二次转载.原文链接:https://zhuanl ...

  8. 点云的密度 曝光时间_200倍的提速!华人博士生提出大场景三维点云语义分割新框架...

    [新智元导读]今天分享一篇被今年CVPR接收的论文.该文提出的算法可以高效处理百万量级的点组成的大场景3D点云,同时计算效率高.内存占用少,能直接处理大规模点云,不需要复杂的预处理/后处理,比基于图的 ...

  9. 三维点云语义分割总览

    点云PCL免费知识星球,点云论文速读. 标题:三维点云语义分割总览 作者:吉祥街 欢迎各位加入免费知识星球,获取PDF文档,欢迎转发朋友圈,分享快乐. 希望有更多的小伙伴能够加入我们,一起开启论文阅读 ...

最新文章

  1. 2021《程序员》数字科技企业研发实力榜TOP50
  2. 现在的计算机专业(比如机器学习)已经沦为调包专业了吗?
  3. centos7 keepalived安装记录
  4. 《高性能JavaScript》第八章 编程实践
  5. Spring 事务处理参数
  6. Laravel大型项目系列教程(七)之7 扩展包和Artisan开发
  7. powershell 开发入门_详谈Ubuntu PowerShell(小白入门必看教程)
  8. 华为云推出限量NFT云宝,区块链技术为你的数字资产保驾护航
  9. System verilog随机系统函数$randomize使用方法
  10. 使用Postman测试https接口时的小问题记录
  11. JDBCUtils工具类
  12. c51转汇编语言窗口,在C51语言中如何嵌入汇编语言
  13. distinct 多列详解
  14. gridview生成的html,.NET_GridView生成的HTML代码示例对比,复制代码 代码如下: asp:GridV - phpStudy...
  15. 医院耗材管理系统开发_13
  16. CDMA2000中的Walsh码,PN码,短码序列的初相位偏置(PN OFFSET)之間的差別與關係(1)
  17. 18650锂电池保护板接线图_锂电池保护板的过流保护测试方案
  18. 【Modern Robotics】 Mechanics, Planning and Control现代机器人学:机构、规划与控制
  19. 浅谈CTP期货行情交易API
  20. 水果电商“异军突起”,资本市场为何竞相追捧?

热门文章

  1. 投稿2877篇,EMNLP 2019公布4篇最佳论文
  2. 科大讯飞刷新纪录,机器阅读理解如何超越人类平均水平? | 技术头条
  3. 英伟达Q4净利同比降49%,还能继续躺赚吗?
  4. 倒计时1天,2018 AI开发者报名通道即将关闭(附参会提醒)
  5. AI自动设计了“超级马里奥”新关卡,成功晋升游戏设计师(GECCO 2018最佳论文提名)...
  6. 热门 | Google Brain前员工深度盘点2017人工智能和深度学习各大动态
  7. 快讯 | 百度发布Apollo1.5 开放五大核心能力,未来3年花100亿投资100家公司
  8. Redis缓存使用技巧和设计方案
  9. 对比 MySQL 的 Binlog 日志处理工具
  10. 你这代码写得真丑,满屏的try-catch,全局异常处理不会吗?