作者:Tom Hardy
Date:2020-2-12
来源:汇总|3D点云目标检测算法

前言

前面总结了几种基于激光雷达点云数据的3D目标检测算法,还有一些算法不再单独列出,这里做个简单总结来分享下!

基于激光雷达点云的3D目标检测算法

1、End-to-End Multi-View Fusion for 3D Object Detection in Lidar Point Clouds(Waymo和Google联合提出)

主要提出了一种新的端到端多视图融合(MVF)算法,该算法能有效地学习利用透视图和点云信息。具体地说,论文介绍了动态体素化,它与现有的体素化方法相比有四个优点:
1、 消除了预先分配具有固定大小的张量需要;
2、 克服了由于随机点/体素丢失引起的信息损失;
3、 产生确定的体素嵌入和更稳定的检测结果;
4、 建立点和体素之间的双向关系,这为跨视点特征融合奠定了基础;
通过采用动态体素化,提出的特征融合体系结构可以使每个点学习融合来自不同视图的信息。MVF对点进行操作,可以自然地从激光雷达点云扩展到其他方法。在最新发布的Waymo开放数据集和KITTI数据集上广泛评估了MVF模型,并证明它比可比较的单视图点柱baseline显著提高了检测精度。

2、LaserNet: An Efficient Probabilistic 3D Object Detector for Autonomous Driving(Uber提出, CVPR2019)

本文提出了一种基于激光雷达数据的自动驾驶三维目标检测算法LaserNet。这项工作提出了一种有效的方法来学习一个端到端的概率三维目标检测器。当有足够的训练数据时,通过使用一个小而密集的范围图像,而不是一个大而稀疏的鸟瞰图像,可以在显著降低运行时间的情况下获得最新的检测性能。该方法不仅为每个检测产生一个类概率,而且在检测边界盒上产生一个概率分布。本文提出的方法是第一个通过模拟包围盒角点的分布来捕捉检测的不确定性。通过估计检测的精度,该方法可以使全自动驾驶系统中的下游部件在具有不同不确定性的物体周围表现出不同的行为。


3、BirdNet: a 3D Object Detection Framework from LiDAR information

本文针对3D检测任务,提出了一种面向激光雷达数据的新的网络框架BirdNet。首先,将激光雷达数据投影到一种新的用于鸟瞰投影的cell编码中。然后,通过一个最初设计用于图像处理的卷积神经网络来估计目标在平面上的位置和方向。最后,在后处理阶段计算面向3D的检测任务。

4、LMNet: Real-time Multiclass Object Detection on CPU using 3D LiDAR(英特尔提出)

本文描述了一种优化的单级深层卷积神经网络LMNet,它只使用点云数据来检测城市环境中的目标。此功能使该方法能够在一天中的任何时间和照明条件下工作。提出的网络结构采用扩展卷积,随着深度的增加,感知场逐渐增大,计算时间减少约30%。网络输入包括无组织点云数据的五种透视表示,网络为每个点输出对象贴图和边界框偏移值。实验表明,使用反射、范围和三个轴上的每个轴上的位置有助于改善输出边界框的位置和方向。在KITTI数据集评估服务器的帮助下进行了定量评估,获得了最快的处理速度,使其适合实时应用。本文在一辆装有Velodyne HDL-64的实车上实现并测试了网络。基于桌面GPU实现了高达50 FPS的执行速度,在单个Intel Core i5 CPU上实现了高达10 FPS的执行速度。

5、PIXOR: Real-time 3D Object Detection from Point Clouds(Uber和多伦多大学提出)

本文在自主驾驶环境下,研究了基于点云的实时三维目标检测问题。计算速度至关重要,因为检测是安全的必要组成部分。然而,由于点云的高维性,现有的方法在计算上是昂贵的。论文通过从鸟瞰图(BEV)中表示场景来更有效地利用3D数据,并提出了PIXOR,一种proposal-free的单级检测器,它输出从像素级神经网络预测解码的定向3D对象估计。网络特别设计了输入表示、网络结构和模型优化,以平衡高精度和实时性。论文在两个数据集上验证了PIXOR:KITTI-BEV目标检测数据集和large-scale 3D车辆检测基准。两个数据集表明,所提出的检测器在平均精度(AP)方面明显优于其他最先进的方法,而且速度上仍高于28fps。


6、PointRCNN: 3D Object Proposal Generation and Detection from Point Cloud(香港大学提出,CVPR2019)

本文提出了一种基于点云的三维目标检测方法。整个框架由两个阶段组成:第一阶段用于自下而上的3D region proposal,第二阶段用于在标准坐标系中细化proposal以获得最终的检测结果。第一阶段子网络没有像以前的方法那样从RGB图像或投影点云到鸟瞰图或体素中生成建议,而是通过将整个场景的点云分割成前景点和背景,以自下而上的方式直接从点云生成少量高质量的3D建议。第二阶段子网络将每个方案的集合点转换为规范坐标,以学习更好的局部空间特征,并结合第一阶段学习到的每个点的全局语义特征,进行精确的box细化和置信度预测。在KITTI数据集的三维检测基准上进行的大量实验表明,本文提出的架构仅使用点云作为输入,其性能优于最新的方法,并且具有显著的边缘。


7、YOLO3D: End-to-end real-time 3D Oriented Object Bounding Box Detection from LiDAR Point Cloud

基于YOLOv2进行改进的文章,主要将3D点云在二维透视图像空间进行映射,并在在二维透视图像空间的一次回归元结构成功的基础上,对其进行扩展,从LiDAR点云生成面向三维对象的bounding box。本文的主要贡献是将YOLO v2的损失函数扩展为包含偏航角、笛卡尔坐标系中的3D box中心和box高度的直接回归问题。文章创新度不大,但是效果和速度值得借鉴:Titan X GPU上实现了实时性能(40 fps)。

8、FVNet: 3D Front-View Proposal Generation for Real-Time Object Detection from Point Clouds(上海交大&腾讯优图)

与二维点云相比,原始点云和稀疏点云的三维目标检测得到的处理要少得多。
本文提出了一种新的基于点云的三维前视图生成和目标检测框架FVNet。它包括两个阶段:前视图proposal的生成和三维bounding box参数的估计。本文没有从相机图像或鸟瞰图中生成proposal,而是先将点云投影到柱面上,生成保留丰富信息的前视特征图。然后引入一个region proposal网络,从生成的地图中预测三维区域proposal,并进一步从整个点云中提取出感兴趣的对象。最后,论文提出了另一个网络,从提取出的目标点中提取点特征,并在标准坐标系下回归最终的三维bounding box参数。FVNet以每个点云样本12毫秒的速度实现实时性能。在三维检测基准KITTI上进行的大量实验表明,所提出的结构在精度上和速度上优于以相机图像或点云为输入的最新技术。

3D点云目标检测算法汇总相关推荐

  1. 面向自动驾驶领域的3D点云目标检测方法汇总!(单模态+多模态/数据+代码)

    背景介绍 3D检测用于获取物体在三维空间中的位置和类别信息,主要基于点云.双目.单目和多模态数据等方式.其中,点云数据由于具有较为丰富的几何信息,相比于其它单模态数据更为稳定,基于激光雷达点云数据的3 ...

  2. 如何提高3D点云目标检测的难例精度?

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 文章导读 本文是一篇将注意力机制应用在点云目标检测中的文章<TANet: Robust 3D O ...

  3. 史上最全综述:3D目标检测算法汇总!

    来源:自动驾驶之心 本文约16000字,建议阅读10+分钟 本文将演示如何通过阈值调优来提高模型的性能.本文的结构安排如下:首先,第2节中介绍了3D目标检测问题的定义.数据集和评价指标.然后,我们回顾 ...

  4. 三维目标检测算法汇总学习笔记

    原文链接:https://mp.weixin.qq.com/s/_HdGVC6orkL2zfiv5sqrMw 2D与3D区别 3D目标检测面临更多的挑战,主要的体现在不仅要找到物体在图像中出现的位置, ...

  5. DETR系列大盘点 | 端到端Transformer目标检测算法汇总!

    点击下方卡片,关注"自动驾驶之心"公众号 ADAS巨卷干货,即可获取 点击进入→自动驾驶之心[目标检测]技术交流群 后台回复[2D检测综述]获取鱼眼检测.实时检测.通用2D检测等近 ...

  6. 3D点云补全算法汇总及最新进展

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 Part 1  前言 在探讨3D 点云补全专题前,先介绍三个概念: 概念一:partial obser ...

  7. 首个面向自动驾驶领域的3D点云目标检测教程!(单模态+多模态/数据+代码)

    背景介绍 3D检测用于获取物体在三维空间中的位置和类别信息,主要基于点云.双目.单目和多模态数据等方式.其中,点云数据由于具有较为丰富的几何信息,相比于其它单模态数据更为稳定,基于激光雷达点云数据的3 ...

  8. 面向自动驾驶领域的3D点云目标检测全栈学习路线!(单模态+多模态/数据+代码)...

    背景介绍 3D检测用于获取物体在三维空间中的位置和类别信息,主要基于点云.双目.单目和多模态数据等方式.其中,点云数据由于具有较为丰富的几何信息,相比于其它单模态数据更为稳定,基于激光雷达点云数据的3 ...

  9. 3D点云目标检测:MPPNet网络训练waymo数据集

    MPPNet网络训练waymo数据集 一.waymo数据预处理 1.1.waymo数据简介 1.2. waymo数据集预处理 二.训练centerpoint网络 三.训练mppnet网络 四.训练结果 ...

  10. 基于激光雷达点云的3D目标检测算法—端到端多视图融合

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 作者丨Rubicon007@知乎 来源丨https://zhuanlan.zhihu.com/p/44 ...

最新文章

  1. 一图看懂《中关村人工智能产业培育行动计划》
  2. PHP开发工具 zend studio
  3. 如何查看windows版本号?
  4. 分布式入门,怎样用PyTorch实现多GPU分布式训练
  5. 【数据库原理及应用】经典题库附答案(14章全)——第四章:关系系统及其优化
  6. 使用WebBrowser自动登录阿里妈妈网站
  7. QA:rustup-init error: caused by: 拒绝访问。 (os error 5)出现权限拒绝
  8. python安装opencv出现错误_通过pip安装opencv时出错
  9. 安装python失败的方法_安装python不失败的方法
  10. linux如何卸载anaconda
  11. 【Qt设计开发】GUI界面设计开发
  12. 颗粒归仓水稻总体产量5500吨 国稻种芯-洪江:怀化水稻秋收
  13. 开源软件 AnimeGANv2:一键生成宫崎骏动漫风格照
  14. python拼音检查
  15. 数据库的学习笔记(一)
  16. vue3如何暴露内容
  17. FreeBSD之防火墙配置
  18. 程序员工作经验谈之商贸平台
  19. 简单的建站流程来啦!
  20. 弃IBM持苹果,股神巴菲特眼中的科技迭代

热门文章

  1. AC日记——贪婪大陆 洛谷 P2184
  2. 解题报告——-2018级2016第二学期第三周作业
  3. Python成长笔记 - 基础篇 (七)python面向对象
  4. Hearing Range
  5. if else if与if if语句的区别
  6. C++11 regex库
  7. 47. 不用加减乘除做加法(C++版本)
  8. linux 移出权限,如何在 Ubuntu 上为用户授予和移除 sudo 权限
  9. FISCO BCOS(十二)——— 区块链关键概念
  10. 枚举smb共享期间出错_大量三星手机黑屏系统崩溃,客服:闰4月计算出错