来源 | 知乎专栏(黄浴)

编辑 焉知智能汽车

关于传感器融合,特别是摄像头、激光雷达和雷达的前融合和和特征融合,是一个引人注意的方向。

1 “YOdar: Uncertainty-based Sensor Fusion for Vehicle Detection with Camera and Radar Sensors“, 11,2020

基于不确定性的融合方法。后处理采用gradient boosting,视觉来自YOLOv3,雷达来自1D segmentation network。

FCN-8 inspired radar network

Image of a radar detection example with four predicted slice bundles

YOdar

2 “Warping of Radar Data into Camera Image for Cross-Modal Supervision in Automotive Applications”,12,2020

将雷达的range-Doppler (RD) spectrum投射到摄像头平面。由于设计的warping函数可微分,所以在训练框架下做BP。该warping操作依赖于环境精确的scene flow,故提出一个来自激光雷达、摄像头和雷达的scene flow估计方法,以提高warping操作精度。实验应用涉及了direction-of-arrival (DoA) estimation, target detection, semantic segmentation 和 estimation of radar power from camera data等。

model pipeline

DRISFwR overview (deep rigid instance scene flow with radar)

Automatic scene flow alignment to Radar data via DRISFwR:

RGB image and RD-map with two vehicles

Scale-space of radar data used in DRISFwR with energy & partial derivative

Power projections

RD-map warping into camera image:

Loss in scale-space:

最后实验结果比较:

Qualitative results of target detection on test data examples

Qualitative results of semantic segmentation on test data examples

Overview of the model pipeline for camera based estimators for NN training:

Qualitative results of SNR prediction on test data:

3 "RODNet: A Real-Time Radar Object Detection Network Cross-Supervised by Camera-Radar Fused Object 3D Localization", 2 2021

雷达目标检测网络RODNet,但训练是通过一个摄像头-雷达监督算法,无需标注,可实现射频(RF)图像的实时目标检测。原始毫米波雷达信号转换为range-azimuth坐标的RF图像;RODNet预测雷达FoV的目标似然性。两个定制的模块M-Net和temporal deformable convolution分别处理multi-chirp merging信息以及目标相对运动。训练中采用camera-radar fusion (CRF) 策略,另外还建立一个新数据集CRUW1。

cross-modal supervision pipeline for radar object detection in a teacher-student platform

workflow of the RF image generation from the raw radar signals

The architecture and modules of RODNet

Three teacher’s pipelines for cross-model supervision

temporal inception convolution layer

4 “Radar Camera Fusion via Representation Learning in Autonomous Driving”,4,2021

重点讨论data association问题。而rule-based association methods问题较多,故此讨论radar-camera association via deep representation learning 以开发特征级的交互和全局推理。将检测结果转换成图像通道,和原图像一起送入一个深度CNN模型,即AssociationNet。另外,设计了一个loss sampling mechanism 和 ordinal loss 来克服不完美的标注困难,确保一个类似人工的推理逻辑。

associations between radardetections (radar pins) and camera detections (2D bounding boxes).

AssociationNet

architecture of the neural network

process of obtaining final associationsfrom the learned representation vectors

illustration of radar pins, bounding boxes, and association relationships under BEV perspective

the red solid lines represent the true-positive associations; and the pink solid lines represent predicted positive associations but labeled as uncertain in the ground-truth

The added green lines represent the false-positive predictions; and the added black lines represent the false-negative predictions

本文仅做学术分享,如有侵权,请联系删文。

下载1

在「3D视觉工坊」公众号后台回复:3D视觉即可下载 3D视觉相关资料干货,涉及相机标定、三维重建、立体视觉、SLAM、深度学习、点云后处理、多视图几何等方向。

下载2

在「3D视觉工坊」公众号后台回复:3D视觉github资源汇总即可下载包括结构光、标定源码、缺陷检测源码、深度估计与深度补全源码、点云处理相关源码、立体匹配源码、单目、双目3D检测、基于点云的3D检测、6D姿态估计源码汇总等。

下载3

在「3D视觉工坊」公众号后台回复:相机标定即可下载独家相机标定学习课件与视频网址;后台回复:立体匹配即可下载独家立体匹配学习课件与视频网址。

重磅!3DCVer-学术论文写作投稿 交流群已成立

扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群,目前主要有3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、多传感器融合、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流、ORB-SLAM系列源码交流、深度估计等微信群。

一定要备注:研究方向+学校/公司+昵称,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,可快速被通过且邀请进群。原创投稿也请联系。

▲长按加微信群或投稿

▲长按关注公众号

3D视觉从入门到精通知识星球:针对3D视觉领域的视频课程(三维重建系列、三维点云系列、结构光系列、手眼标定、相机标定、orb-slam3等视频课程)、知识点汇总、入门进阶学习路线、最新paper分享、疑问解答五个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近2000星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

圈里有高质量教程资料、可答疑解惑、助你高效解决问题

觉得有用,麻烦给个赞和在看~  

几个摄像头和雷达融合的目标检测方法相关推荐

  1. python怎么实现打开摄像头_python开启摄像头以及深度学习实现目标检测方法

    最近想做实时目标检测,需要用到python开启摄像头,我手上只有两个uvc免驱的摄像头,性能一般.利用python开启摄像头费了一番功夫,主要原因是我的摄像头都不能用cv2的VideCapture打开 ...

  2. 一个雷达和摄像头融合的3D目标检测方法CenterFusion

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 本文转自:计算机视觉工坊 以前提到过此文(在想法中),WACV'2 ...

  3. 利用红外-可见光图像数据集OTCBVS打通图像融合、目标检测和目标跟踪

    文章目录 前言 一.任务概述 二.常见红外-可见光图像数据集 2.1 OTCBVS 2.2 TNO image fusion dataset 2.3 INO image fusion dataset ...

  4. 通过形状先验引导的3D目标检测方法(Disp R-CNN解读)

    来源丨AI 修炼之路 问题,我们提出在不需要雷达点云的情况下,使用统计形状模型生成密集视差伪真值,这使得我们的系统具有更广泛的适用性.在KITTI数据集上进行的实验表明,即使在训练时不使用雷达数据,D ...

  5. 基于CNN目标检测方法(RCNN,Fast-RCNN,Faster-RCNN,Mask-RCNN,YOLO,SSD)行人检测,目标追踪,卷积神经网络

    一.研究意义 卷积神经网络(CNN)由于其强大的特征提取能力,近年来被广泛用于计算机视觉领域.1998年Yann LeCun等提出的LeNet-5网络结构,该结构使得卷积神经网络可以端到端的训练,并应 ...

  6. 值得收藏!基于激光雷达数据的深度学习目标检测方法大合集(下)

    作者 | 黄浴 来源 | 转载自知乎专栏自动驾驶的挑战和发展 [导读]在近日发布的<值得收藏!基于激光雷达数据的深度学习目标检测方法大合集(上)>一文中,作者介绍了一部分各大公司和机构基于 ...

  7. 值得收藏!基于激光雷达数据的深度学习目标检测方法大合集(上)

    作者 | 黄浴 转载自知乎专栏自动驾驶的挑战和发展 [导读]上周,我们在激光雷达,马斯克看不上,却又无可替代?>一文中对自动驾驶中广泛使用的激光雷达进行了简单的科普,今天,这篇文章将各大公司和机 ...

  8. 目标立体检测 红外图像_一种有效的红外小目标检测方法

    [3]CHEN Bing-wen, WANG Wen-wei, QIN Qian-qing. Infrared dim target detection based on fuzzy-ART neur ...

  9. 一文览尽LiDAR点云目标检测方法

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 转载于 :计算机视觉之路,作者:山涧一壶酒 / 导读 / 自动驾驶中的激光雷达点云如何做特征表达,将基 ...

最新文章

  1. mysql数据库中的十进位是什么意思?
  2. c语言的程序灵魂是什么,C语言 第二章 程序的灵魂--算法
  3. AT2376-[AGC014D]Black and White Tree【结论,博弈论】
  4. 如何更新Chrome
  5. c++检测固定usb端口有无设备接入_电脑USB技术白皮书
  6. I00012 打印三位数的水仙花数及其个数
  7. Amazon S3 API
  8. php编写一个学生类_PHP 结合 Boostrap 结合 js 实现学生列表删除编辑及搜索功能
  9. 分内外网,下载个东西真不方便,一肚子火
  10. 软件工程之软件维护与再工程
  11. 面试问题之AOP实现原理
  12. flv.js构建及下载
  13. 2022蓝帽杯初赛部分wp
  14. Unity3D Dither 抖动Shader实现
  15. Optimal Rough Terrain Trajectory Generation for Wheeled Mobile Robots 论文阅读笔记
  16. 主流浏览器有哪些?这些浏览器的内核分别是什么?
  17. C++水电管理信息系统
  18. 前端ThinkJS框架解析
  19. Postman安装newman
  20. hive的自定义函数以及自定义加密函数

热门文章

  1. spi ioctl无效参数解决
  2. spark入门三(RDD基本运算)
  3. mysql 时间段分组,MySQL 按时间单位进行分组
  4. CMD命令批量抽取指定文件夹下所有文件路径
  5. python浮点数比较大小_浮点数的相等比较
  6. (已发布源码)图像修复——上下文编码器以及加入全局判别器的改进(Context Encoder and Global and Local Discriminator)
  7. linux+gif+编辑,从Ubuntu的命令行创建和编辑动画GIF | MOS86
  8. android notification 自定义声音,Android和iOS自定义通知声音
  9. linux--Segfault详解
  10. 使用自己的INDEMIND相机来运行ORBSLAM2单目,双目和深度模式(小觅相机和realsense通用)