基于深度连续融合的多传感器三维目标检测

点击上方“小白学视觉”，选择加"星标"或“置顶”

重磅干货，第一时间送达

单眼视觉系统以低成本高性能实现令人满意的效果，但无法提供可靠的3D几何信息。双目摄像机可以提供3D几何信息，但是它们的计算成本很高，并且无法在高遮挡和无纹理的环境中可靠地工作。另外，该系统在复杂的照明条件下鲁棒性较低，这限制了其全天候能力。激光雷达不受光照条件的影响，可以提供高精度的3D几何信息。但是它的分辨率和刷新率很低，而且成本很高。

Camera-Lidar融合提高了性能和可靠性并降低了成本，但这并不容易。首先，相机通过将现实世界投影到相机平面上来记录信息，而点云以原始坐标的形式存储几何信息。此外，就数据结构和类型而言，点云是不规则，无序和连续的，而图像是规则，有序和离散的。这导致图像和点云处理算法的巨大差异。

参考文献中 [1] 提出了一种新颖的3D目标检测器，它可以利用激光雷达和摄像机进行非常精确的定位。为了实现这一目标，他们设计了一种端到端的可学习架构，该架构利用连续卷积融合不同分辨率级别的图像和LIDAR特征图。这使我们能够设计基于多个传感器的新颖，可靠，高效的端到端可学习3D对象检测器。

模型架构

总体架构包括两个流，其中一个流从LIDAR鸟瞰图（BEV）提取图像特征，另一流从LIDAR鸟瞰图（BEV）提取特征，它们设计了一个连续融合层以桥接两侧的多个中间层，从而执行多传感器融合在多个尺度上。

首先，使用ResNet18分别提取图像流和点云流（BEV）中的特征，然后对图像特征执行多尺度融合，并使用连续融合层将多尺度图像特征融合到图像的四个残差组中。

连续融合层

给定输入的摄像机图像特征图和一组LIDAR点，连续融合层的目标是创建一个密集的BEV特征图，其中每个离散像素都包含从摄像机图像生成的特征。对于密集地图中的每个目标像素，使用欧几里得距离找到其在2D BEV平面上最接近的K个LIDAR点，然后反向投影到3D空间，然后将这k个点投影到相机视图中，并找到与每个点，然后利用MLP融合来自这K个最近点的信息，以在目标像素处插值未观察到的特征。

对于每个目标像素，MLP通过对其所有邻居的MLP输出求和来输出D_o维输出特征。也就是说：

其中fj是点j的输入图像特征，xj-xi是从相邻点j到目标i的3D偏移，而concat（·）是多个向量的串联。然后，通过元素逐级求和将MLP的输出功能与前一层的BEV功能进行组合，以融合多传感器信息。

他们使用简单的检测头来提高实时效率。在最终的BEV层上计算一个1×1卷积层以生成检测输出。在每个输出位置，他们使用两个具有固定大小和两个方向的锚，分别为0和π/ 2弧度。

每个锚点的输出包括每个像素类的置信度及其关联的框的中心位置，大小和方向。接下来是非最大抑制（NMS）层，基于输出映射生成最终对象框。损失函数定义为分类损失和回归损失之和。

参考文献 [1] 在KITTI和TOR4D数据集上评估了其多传感器3D目标检测方法。在KITTI数据集上，与3D目标检测和BEV目标检测中的现有高级方法进行了比较，并进行了模型简化测试，并比较了不同的模型设计。在TOR4D数据集上，此方法在长距离（> 60m）检测中特别有效，这在自动驾驶的定时和目标检测系统中起着重要作用。

结论

对于BEV检测，此模型比中度AP测得的所有其他方法要好。对于3D检测，此模型排名第三，但在简单子集中具有最佳AP。在保持高检测精度的同时，该模型可以实时高效运行。检测器以大于每秒15帧的速度运行，这比其他基于LIDAR和基于融合的方法要快得多。

参考文献

[1] Ming Liang, Bin Yang , Shenlong Wang , and Raquel Urtasun .Deep Continuous Fusion for Multi-Sensor 3D Object Detection

下载1：OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复：扩展模块中文教程，即可下载全网第一份OpenCV扩展模块教程中文版，涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2：Python视觉实战项目52讲

在「小白学视觉」公众号后台回复：Python视觉实战项目，即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目，助力快速学校计算机视觉。

下载3：OpenCV实战项目20讲

在「小白学视觉」公众号后台回复：OpenCV实战项目20讲，即可下载含有20个基于OpenCV实现20个实战项目，实现OpenCV学习进阶。

交流群

欢迎加入公众号读者群一起和同行交流，目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群（以后会逐渐细分），请扫描下面微信号加群，备注：”昵称+学校/公司+研究方向“，例如：”张三 + 上海交大 + 视觉SLAM“。请按照格式备注，否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告，否则会请出群，谢谢理解~

基于深度连续融合的多传感器三维目标检测相关推荐

目标检测YOLO实战应用案例100讲-基于深度学习的自动驾驶车辆三维目标检测方法研究与应用
目录基于深度学习的车辆目标检测方法研究基于卷积神经网络的目标检测技术
无人驾驶汽车系统入门（二十六）——基于深度学习的实时激光雷达点云目标检测及ROS实现
无人驾驶汽车系统入门(二十六)--基于深度学习的实时激光雷达点云目标检测及ROS实现在前两篇文章中,我们使用PCL实现了在点云中对地面的过滤和点云的分割聚类,通常来说,在这两步以后我们将对分割出来的 ...
自动驾驶系统进阶与项目实战（三）基于全卷积神经网络的点云三维目标检测和ROS实战
自动驾驶系统进阶与项目实战(三)基于全卷积神经网络的点云三维目标检测和ROS实战前面入门系列的文章中我介绍了几种点云三维分割/目标检测模型,在做点云预处理上,有通过球面投射(SqueezeNet)得 ...
无人驾驶汽车系统入门：基于深度学习的实时激光雷达点云目标检测及ROS实现...
参加 2018 AI开发者大会,请点击 ↑↑↑ 作者:申泽邦(Adam Shan),兰州大学在读硕士研究生,主要研究方向无人驾驶,深度学习:兰大未来计算研究院无人车团队负责人,自动驾驶全栈工程师. 近 ...
目标检测YOLO实战应用案例100讲-基于深度学习的交通场景多尺度目标检测算法研究与应用
目录基于深度学习的交通目标检测算法研究传统的目标检测算法基于深度学习的目标检测算法 </
【论文速读】基于图像的伪激光雷达三维目标检测
点云PCL免费知识星球,点云论文速读. 标题:End-to-End Pseudo-LiDAR for Image-Based 3D Object Detection 作者:Rui Qian, Divy ...
Complexer-YOLO：基于语义点云的实时三维目标检测与跟踪
泡泡点云时空,带你精读点云领域顶级会议文章标题:Complexer-YOLO: Real-Time 3D Object Detection and Tracking on Semantic Poin ...
【Stereo R-CNN 解读】基于立体R-CNN的自动驾驶三维目标检测
摘要本文充分利用立体图像中的稀疏.密集.语义和几何信息,提出了一种用于自动驾驶的三维目标检测方法.我们的方法,称为 Stereo R-CNN,扩展了 Faster R-CNN 用于立体输入,以同时检 ...
基于多视角融合的夜间无人车三维目标检测
基于多视角融合的夜间无人车三维目标检测人工智能技术与咨询来源:<应用光学>,作者王宇岚等摘要:为了提高无人车在夜间情况下对周围环境的物体识别能力,提出一种基于多视角通道融合网络的无 ...

基于深度连续融合的多传感器三维目标检测

基于深度连续融合的多传感器三维目标检测相关推荐

最新文章

热门文章