点击上方“小白学视觉”,选择加"星标"或“置顶

重磅干货,第一时间送达

单眼视觉系统以低成本高性能实现令人满意的效果,但无法提供可靠的3D几何信息。双目摄像机可以提供3D几何信息,但是它们的计算成本很高,并且无法在高遮挡和无纹理的环境中可靠地工作。另外,该系统在复杂的照明条件下鲁棒性较低,这限制了其全天候能力。激光雷达不受光照条件的影响,可以提供高精度的3D几何信息。但是它的分辨率和刷新率很低,而且成本很高。

Camera-Lidar融合提高了性能和可靠性并降低了成本,但这并不容易。首先,相机通过将现实世界投影到相机平面上来记录信息,而点云以原始坐标的形式存储几何信息。此外,就数据结构和类型而言,点云是不规则,无序和连续的,而图像是规则,有序和离散的。这导致图像和点云处理算法的巨大差异。

参考文献中 [1] 提出了一种新颖的3D目标检测器,它可以利用激光雷达和摄像机进行非常精确的定位。为了实现这一目标,他们设计了一种端到端的可学习架构,该架构利用连续卷积融合不同分辨率级别的图像和LIDAR特征图。这使我们能够设计基于多个传感器的新颖,可靠,高效的端到端可学习3D对象检测器。

模型架构

总体架构包括两个流,其中一个流从LIDAR鸟瞰图(BEV)提取图像特征,另一流从LIDAR鸟瞰图(BEV)提取特征,它们设计了一个连续融合层以桥接两侧的多个中间层,从而执行多传感器融合在多个尺度上。

首先,使用ResNet18分别提取图像流和点云流(BEV)中的特征,然后对图像特征执行多尺度融合,并使用连续融合层将多尺度图像特征融合到图像的四个残差组中。

连续融合层

给定输入的摄像机图像特征图和一组LIDAR点,连续融合层的目标是创建一个密集的BEV特征图,其中每个离散像素都包含从摄像机图像生成的特征。对于密集地图中的每个目标像素,使用欧几里得距离找到其在2D BEV平面上最接近的K个LIDAR点,然后反向投影到3D空间,然后将这k个点投影到相机视图中,并找到与每个点,然后利用MLP融合来自这K个最近点的信息,以在目标像素处插值未观察到的特征。

对于每个目标像素,MLP通过对其所有邻居的MLP输出求和来输出D_o维输出特征。也就是说:

其中fj是点j的输入图像特征,xj-xi是从相邻点j到目标i的3D偏移,而concat(·)是多个向量的串联。然后,通过元素逐级求和将MLP的输出功能与前一层的BEV功能进行组合,以融合多传感器信息。

他们使用简单的检测头来提高实时效率。在最终的BEV层上计算一个1×1卷积层以生成检测输出。在每个输出位置,他们使用两个具有固定大小和两个方向的锚,分别为0和π/ 2弧度。

每个锚点的输出包括每个像素类的置信度及其关联的框的中心位置,大小和方向。接下来是非最大抑制(NMS)层,基于输出映射生成最终对象框。损失函数定义为分类损失和回归损失之和。

参考文献 [1] 在KITTI和TOR4D数据集上评估了其多传感器3D目标检测方法。在KITTI数据集上,与3D目标检测和BEV目标检测中的现有高级方法进行了比较,并进行了模型简化测试,并比较了不同的模型设计。在TOR4D数据集上,此方法在长距离(> 60m)检测中特别有效,这在自动驾驶的定时和目标检测系统中起着重要作用。

结论

对于BEV检测,此模型比中度AP测得的所有其他方法要好。对于3D检测,此模型排名第三,但在简单子集中具有最佳AP。在保持高检测精度的同时,该模型可以实时高效运行。检测器以大于每秒15帧的速度运行,这比其他基于LIDAR和基于融合的方法要快得多。

参考文献

[1] Ming Liang, Bin Yang , Shenlong Wang , and Raquel Urtasun .Deep Continuous Fusion for Multi-Sensor 3D Object Detection

下载1:OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复:扩展模块中文教程即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2:Python视觉实战项目52讲

在「小白学视觉」公众号后台回复:Python视觉实战项目即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。

下载3:OpenCV实战项目20讲

在「小白学视觉」公众号后台回复:OpenCV实战项目20讲即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。

交流群

欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~

基于深度连续融合的多传感器三维目标检测相关推荐

  1. 目标检测YOLO实战应用案例100讲-基于深度学习的自动驾驶车辆三维目标检测方法研究与应用

    目录 基于深度学习的车辆目标检测方法研究 基于卷积神经网络的目标检测技术

  2. 无人驾驶汽车系统入门(二十六)——基于深度学习的实时激光雷达点云目标检测及ROS实现

    无人驾驶汽车系统入门(二十六)--基于深度学习的实时激光雷达点云目标检测及ROS实现 在前两篇文章中,我们使用PCL实现了在点云中对地面的过滤和点云的分割聚类,通常来说,在这两步以后我们将对分割出来的 ...

  3. 自动驾驶系统进阶与项目实战(三)基于全卷积神经网络的点云三维目标检测和ROS实战

    自动驾驶系统进阶与项目实战(三)基于全卷积神经网络的点云三维目标检测和ROS实战 前面入门系列的文章中我介绍了几种点云三维分割/目标检测模型,在做点云预处理上,有通过球面投射(SqueezeNet)得 ...

  4. 无人驾驶汽车系统入门:基于深度学习的实时激光雷达点云目标检测及ROS实现...

    参加 2018 AI开发者大会,请点击 ↑↑↑ 作者:申泽邦(Adam Shan),兰州大学在读硕士研究生,主要研究方向无人驾驶,深度学习:兰大未来计算研究院无人车团队负责人,自动驾驶全栈工程师. 近 ...

  5. 目标检测YOLO实战应用案例100讲-基于深度学习的交通场景多尺度目标检测算法研究与应用

    目录 基于深度学习的交通目标检测算法研究 传统的目标检测算法 基于深度学习的目标检测算法 </

  6. 【论文速读】基于图像的伪激光雷达三维目标检测

    点云PCL免费知识星球,点云论文速读. 标题:End-to-End Pseudo-LiDAR for Image-Based 3D Object Detection 作者:Rui Qian, Divy ...

  7. Complexer-YOLO:基于语义点云的实时三维目标检测与跟踪

    泡泡点云时空,带你精读点云领域顶级会议文章 标题:Complexer-YOLO: Real-Time 3D Object Detection and Tracking on Semantic Poin ...

  8. 【Stereo R-CNN 解读】基于立体R-CNN的自动驾驶三维目标检测

    摘要 本文充分利用立体图像中的稀疏.密集.语义和几何信息,提出了一种用于自动驾驶的三维目标检测方法.我们的方法,称为 Stereo R-CNN,扩展了 Faster R-CNN 用于立体输入,以同时检 ...

  9. 基于多视角融合的夜间无人车三维目标检测

    基于多视角融合的夜间无人车三维目标检测 人工智能技术与咨询 来源:<应用光学>,作者王宇岚等 摘 要:为了提高无人车在夜间情况下对周围环境的物体识别能力,提出一种基于多视角通道融合网络的无 ...

最新文章

  1. oracle 导出 cuow,直通伍伦贡大学的升学保障— 伍伦贡大学学院(UOWC)
  2. OpenStack Weekly Rank 2015.08.24
  3. HDOJ 2642 HDU 2642 Stars ACM 2642 IN HDU
  4. Java面试题-Java中的锁
  5. [PHP] - Laravel 5 的 Hello Wold
  6. CentOS7 bcc 与 bpftrace环境搭建
  7. 真正的卡巴斯基key 教你使用正版KASPERSKY授权到2008年
  8. 基于Ntrip的实时多线程RTCM数据流接收及解码
  9. Proteus与emu8086实现流水灯联调
  10. php网上阅卷源码,翰林金榜网上阅卷
  11. chrome浏览器Flash Player版本太低,不能使用该上传功能!
  12. 班德瑞1-9,神秘园1-4全集下载
  13. python 基于Tkinter的姻缘测试器
  14. cpu(处理器)、内存、硬盘之间的关系
  15. python判断纯英文和纯数字
  16. 简单的外汇市场赚钱方法
  17. 2、气体灭火系统的设计灭火浓度
  18. 4k笔记本刺眼睛_2020戴尔笔记本怎么选?哪个系列好?附5款高销量戴尔笔记本电脑型号推荐!【超高性价比】...
  19. 阿里云OSS图床搭建方法
  20. Google Pixel获取root权限的方法【完整版】

热门文章

  1. 维基百科联手谷歌翻译,结果“惨不忍睹”!
  2. 程序员,快通知你们老板上吴恩达的最新AI课
  3. TensorFlow tfjs 0.10.3 发布
  4. 干货 | 上手机器学习,从搞懂这十大经典算法开始
  5. Spring Boot + Redis 实现各种操作,写得太好了吧!
  6. 如何使用 Arthas 定位 Spring Boot 接口超时 ?
  7. 强烈不建议你用 a.equals(b) 判断对象相等!
  8. 难以想象SpringBoot中的条件注解底层居然是这样实现的
  9. 拥抱并行流,提高程序执行速度
  10. 五分钟体验分布式事务框架Seata