题目是AV是Autonomous Vehicles,太长写不下了。如有错漏,还望指正。

Radar-Camera Sensor Fusion for Joint Object
Detection and Distance Estimation in Autonomous Vehicles (2020)
作者: Ramin Nabati, Hairong Qi
原文传送门:paper


介绍:据作者说,对于一个two-stage的网络,proposals生成的网络比较影响检测精度,所以他们提出的这个网络尝试用雷达点去提高proposals生成的准确程度。具体来说,作者把基于radar和基于camera生成的proposals融合,然后再交给Fast R-CNN去做分类。

文章目录

  • 一、网络结构
  • 二、Radar Proposal Network
  • 三、Image Proposal Network
  • 四、Distance Refinement
  • 五、Loss Function

一、网络结构


作者把网络里生成proposals的地方成三个部分:
Radar Proposal Network + Image Proposal Network + Distance Refinement

二、Radar Proposal Network

下图红框就是radar proposal network:

步骤:

  1. 对每一个radar点生成2n个3D锚框 ( x , y , z , w , l , h , r ) (x,y,z,w,l,h,r) (x,y,z,w,l,h,r),其中:
    ( x , y , z ) (x,y,z) (x,y,z)——中心点坐标;
    ( w , l , h ) (w,l,h) (w,l,h)——3D锚框大小,由训练集每个类别的标注框平均大小得到;
    ( r ) (r) (r)——汽车的相对坐标系的转角,在这篇论文里, r = 0 ° , 90 ° r=0°, 90° r=0°,90°;
    n n n——数据集中种类数。
  2. 用找最小包围框的办法把3D锚框画到图像平面上;
  3. 依靠雷达点生产的2D proposals和图片卷积以后的特征图一起输入到Radar Proposal Refinement(RPR)里面去。RPR里面的Box Regressor会用在radar proposal里面的图像特征来对proposal的中心点进行回归(具体怎么做还没看代码);Box classification会为每一个radar proposal估计一个表示proposal里面的物体是前景还是背景的objectness score。该文中正负例子的区分阈值和R-CNN系列的是一样的。

三、Image Proposal Network


图像的proposals生成还是沿用RPN,不过在卷积层的顶上加了一层fully connected distance regression layer用来简单估计深度。基于图像生成的proposals有两个好处:一个相比radar proposals,更不容易遗漏像行人这样的小物体;第二个是用两种不同的传感器生成proposals的话,结合起来可能可以互补一下,让结果更好。

四、Distance Refinement

这里先用NMS把多余的proposals过滤掉,具体来说是先算radar proposals和image proposals的IOU,然后把IOU高于阈值radar proposals的深度覆盖image proposals,然后再在下一步对所有proposals做NMS。

五、Loss Function

同Faster R-CNN。

赶工读文章(2)— Radar-Camera Sensor Fusion for Joint Object Detection and Distance Estimation in AV相关推荐

  1. 论文阅读 End-to-End Multi-View Fusion for 3D Object Detection in Lidar Point Clouds

    [论文阅读] End-to-End Multi-View Fusion for 3D Object Detection in Lidar Point Clouds 原文链接:https://arxiv ...

  2. 论文阅读 2017 —— Sensor Fusion for Fiducial Tags: Highly Robust Pose Estimation from Single Frame RGBD

    这是一篇发表在IROS的一篇论文,用RGBD相机提升码标(Aruco)的位姿精度.尽管在增强现实和计算机视觉中可以应用多种码标,但是在机器人应用中,从这些码标中获得准确的位姿目前仍然是个挑战.难点很清 ...

  3. 论文《Learning Spatial Fusion for Single-Shot Object Detection》解读

    标题:基于学习空间融合的单发目标检测 摘要: 金字塔形特征表示法是解决目标检测尺度变化挑战的常用方法. 但是,对于基于特征金字塔的单次检测器来说,不同特征尺度之间的不一致是主要限制. 在这项工作中,文 ...

  4. 【论文阅读】An Extrinsic Calibration Tool for Radar, Camera and Lidar

    目录 An Extrinsic Calibration Tool for Radar, Camera and Lidar Abstract I. INTRODUCTION II. RELATED WO ...

  5. PointFusion: Deep Sensor Fusion for 3D Bounding Box Estimation

    摘要 我们提出了PointFusion,一种利用图像和3D点云信息的通用3D对象检测方法.与使用多级管道或保持传感器和数据集特定假设的现有方法不同,PointFusion在概念上简单且与应用程序无关. ...

  6. Object Detection经典代码与文章

    转载自Object Detection Papers Deep Neural Networks for Object Detection paper: http://papers.nips.cc/pa ...

  7. Seeing Through Fog Without Seeing Fog:Deep Multimodal Sensor Fusion in Unseen Adverse Weather (翻)

    Title:Seeing Through Fog Without Seeing Fog:Deep Multimodal Sensor Fusion in Unseen Adverse Weather ...

  8. 读文章笔记(八):多模态情感分析数据集整理

    读文章笔记(八):多模态情感分析数据集(Multimodal Dataset)整理 双模态(一般是文本.图像和语音的两两组合) 三模态(一般是文本.图像加语音) 作者:骑着白马的王子 地址:https ...

  9. Sensor Fusion

    1. 概述 首先明确几个概念和名词: Sensor Fusion - 传感器融合 IMU (Inertial Measurement Unit) - 惯性测量单元 AHRS (Attitude and ...

最新文章

  1. 半监督+标签传播算法
  2. Selenium + Python操作IE 速度很慢的解决办法
  3. 域 无法管理计算机,计算机无法加入域的终级解决方法
  4. npm命令,开发依赖,版本号【正解】
  5. 送给微软中文.NET社区的一份礼物,.NET FM
  6. 北京大学药学院张亮仁教授/刘振明研究员课题组博士后招聘启事
  7. python rs232_使用Python進行RS-232通信返回垃圾信息
  8. 搜狗输入法电脑版_搜狗输入法上线墨水屏定制版
  9. au人声处理_Audacity音频处理
  10. SpringBoot加载自定义yml文件
  11. 使用malloc分别分配2KB的空间,然后用realloc调整为6KB的内存空间,打印指针地址...
  12. Tomcat 调优之从 Linux 内核源码层面看 Tcp backlog
  13. 曼切斯特编码波特率和比特率的关系
  14. NES模拟器[H_NES]
  15. 13_大数据之数据可视化_note
  16. 熟悉Hive 实验2
  17. PDF如何裁剪页面,PDF裁剪页面的小技巧
  18. 常用数据指标缩写以及说明(uv、pv、br、cr、dau……):
  19. matlab(simulink)里怎么求一个波形的动态平均值
  20. storm DRPC问题

热门文章

  1. android cne服务,android 自带APP 作用
  2. AAAI和李飞飞等推出K12人工智能教育项目,AI教育低龄化真的好吗?
  3. Android 设备管理概览-DevicePolicyManager
  4. 1848年欧洲革命:欧洲史上最大规模的革命运动
  5. 【财经期刊FM-Radio|2020年12月18日】
  6. MT4/MQL4入门到精通EA教程第七课-MQL语言常用函数(七)-指标取值功能函数
  7. 过去时代的诗与人 : 李太白
  8. 小周资源导航站——导航站
  9. 2013年5月11日 13:44:13
  10. 河源环境监测站实验室建设布局考虑归纳