1.动机

为了学习更区别的点云特征,我们将3D体素卷积网络和基于PointNet的方法提取特征相结合。既可以利用3D体素卷积网络高效的学习和高质量的建议,又利用了基于PointNet的网络的灵活感受野的优势。

2.怎么做的

首先采用稀疏3D体素卷积进行有效的特征编码并产生建议,为了更有效的池化3D建议对应的特征,我们用了两种新的操作:voxel-to-keypoint scene encoding:将场景中的所有体素汇总成少量关键点;point-to-grid RoI feature abstraction:将场景关键点特征聚集到RoI网格,用于建议置信度预测和位置细化。

3.网络

3.1 3D Voxel CNN for Efficient Feature Encoding and Proposal Generation

投影到BEV图上再产生建议,每个建议产生包括两个方向的anchor。

3.2. Voxel-to-keypoint Scene Encoding via Voxel Set Abstraction

Keypoints Sampling

首先仍要通过Furthest- Point-Sampling (FPS) algorithm从点云集中采样n个关键点。

Voxel Set Abstraction Module

我们用Voxel Set Abstraction (VSA) module去编码从3D体素特征到关键点的多尺度语义特征。(用的是PointNet++中的方法,区别是现在上一步中提取出的关键点的周围都是经过3D体素CNN处理过后带有多级语义特征的规则的体素,而不是PointNet++中的用PointNet学到的raw point的特征)


是第k层的每个体素的特征。

是第k层的体素的3D坐标。

Nk是第k层中非空体素的数量。


表示坐标的局部相对位置。

之后通过PointNet block产生关键点pi的特征

M表示从S中随机取样最多Tk个体素,G是多层感知机去解码体素特征和相对位置(也就是S中包含的两项)。

得到的f(pvk)i是关键点pi的特征向量。

并且我们要使用多个距离rk去得到多个尺度的特征(就像PointNet++中一样),再把得到的各个尺度的特征拼接起来。

Extended VSA Module

我们在上一步得到的特征中还加入了从原始点云和从2DBEV图中得到的关键点特征,原始点补充了体素化过程中的损失,2DBEV图在Z轴有更大的感受野。

也是根据这个公式产生的:

是将关键点投影到2DBEV图中产生的,并且使用了双线性插值。

所以,最终得到的关键点pi的特征:

Predicted Keypoint Weighting

FPS选取的关键点中有前景点也有背景点,前景点在建议细化时应该占更大的比重,而背景点应该占的少些。

通过标注可以知道某个关键点是属于真实3D框内部还是外部,从而判断它是前景点还是背景点,从而实行监督。

Predicted Keypoint Weighting(PKW) module计算公式如下:

3.3. Keypoint-to-grid RoI Feature Abstraction for Proposal Refinemen

RoI-grid Pooling via Set Abstraction

先将每个3D建议框分成6×6×6=216个grid

p是关键点,g是每个网格的中心点。

再通过与之前同样的公式(PointNet),得到每个grid的特征。

并且像之前一样,也采用了多个半径r来获得多个不同尺度获得的特征,再将它们拼接起来,经过一个两层的MLP得到256维的特征来代表整个建议框。

3D Proposal Refinement and Confidence Prediction

4.实验结果与消融实验

PV-RCNN的结果非常好

KITTI数据集

Waymo数据集

消融实验:


PV-RCNN: Point-Voxel Feature Set Abstraction for 3D Object Detection(group的是关键点周围的体素,而不是周围的点)相关推荐

  1. (CVPR 2020) PV-RCNN: Point-Voxel Feature Set Abstraction for 3D Object Detection

    Abstract 我们提出了一种新颖的高性能3D目标检测框架,名为PointVoxel-RCNN(PV-RCNN),用于从点云进行准确的3D目标检测.我们提出的方法深度集成了3D体素卷积神经网络(CN ...

  2. 详解两阶段3D目标检测网络PVRCNN:Point-Voxel Feature Set Abstraction for 3D Object Detection

    在<动手学无人驾驶(4):基于激光雷达点云数据3D目标检测>一文中介绍了3D目标检测网络PointRCNN.今天介绍该作者新提出的3D检测模型:PVRCNN,论文已收录于CVPR2020. ...

  3. 论文精读《OFT: Orthographic Feature Transform for Monocular 3D Object Detection》

    OFT: Orthographic Feature Transform for Monocular 3D Object Detection 文章目录 OFT: Orthographic Feature ...

  4. 【论文翻译】Orthographic Feature Transform for Monocular 3D Object Detection

    标题:<Orthographic Feature Transform for Monocular 3D Object Detection> 作者:Thomas Roddick, Alex ...

  5. 详解两阶段3D目标检测网络 Voxel R-CNN:Towards High Performance Voxel-based 3D Object Detection

    本文介绍一篇两阶段的3D目标检测网络:Voxel R-CNN,论文已收录于AAAI 2021. 这里重点是理解本文提出的 Voxel RoI pooling. 论文链接为:https://arxiv. ...

  6. 论文阅读:Disp R-CNN:Stereo 3D Object Detection via Shape Prior Guided Instance Disparity Estimation

    Disp R-CNN: Stereo 3D Object Detection via Shape Prior Guided Instance Disparity Estimation 摘要(理解) 作 ...

  7. 【论文笔记】:Enriched Feature Guided Refinement Network for Object Detection

    &Title Enriched Feature Guided Refinement Network for Object Detection 代码 中文翻译 &Summary 提出了一 ...

  8. 【论文阅读笔记】MFRDet:A single-shot multi-level feature reused neural network for object detection

    论文名:A single-shot multi-level feature reused neural network for object detection 引用:Wei L, Cui W, Hu ...

  9. Extended Feature Pyramid Network for Small Object Detection

    Extended Feature Pyramid Network for Small Object Detection 论文链接:https://arxiv.org/abs/2003.07021v1 ...

最新文章

  1. C++11多线程创建的三种方法
  2. 机器学习模型部署文章存档
  3. jenkins+postman+newman环境搭建自动化测试
  4. uc浏览器手机模拟_UC、华为、OPPO等8款手机浏览器被重点集中整治!原因是.........
  5. Android Studio如何创建尺寸以及API通用的模拟器
  6. 【BZOJ】1002: [FJOI2007]轮状病毒 递推+高精度
  7. Ubuntu 下如何执行脚本文件
  8. 基于springboot的房屋租赁系统
  9. 开发电商App哪家好
  10. iPhone 手机存储空间没有了
  11. 简单工厂、工厂、抽象工厂
  12. 2022考研笔记-政治(马原-马克思主义哲学)
  13. T9270 mjt树
  14. c加加高级语言循环结构,高级C语言循环结构程序设计.ppt
  15. python @符号
  16. day 32 css后续补充以及js 简单入门
  17. 工欲善其事!有这些工具你才能修出一张完美的照片
  18. 寒门再难出贵子(下)
  19. threejs加载3D模型
  20. FC SAN交换机许可申请--Brocade光纤交换机端口许可申请

热门文章

  1. PHP大数据量(大于50万)导出到Excel解决方案
  2. 计算机操作员考试模拟在线考试,计算机操作员高级问答集考试卷模拟考_试题...
  3. 11g Rac 配置 Linux
  4. office 文档在线预览新姿势之永中云转换
  5. Unity 场景烘焙原理
  6. java 使用itext导出PDF文件,中文不显示问题解决
  7. 官场直升机 鸿蒙笔著,担当和尚:老衲笔尖无墨水,要从空处想鸿蒙
  8. 主合同与补充合同的区别有哪些?
  9. 移动端UI一致性解决方案
  10. php面包屑导航实现思路,WordPress实现面包屑导航的方法