1、 为什么要做这个研究(理论走向和目前缺陷) ?
之前的3D目标检测都不用高精地图,而是直接基于感知设备获得的数据做感知,高精地图一般只用于规划,白白浪费了这么简单易得的提升检测效果的方法。
2、 他们怎么做这个研究 (方法,尤其是与之前不同之处) ?
还是将点云进行体素化分成3D网格(占有网格,即网格中有点记为1,无点记为0),但是现有点云减去了地图中的地面高度信息,以实现将有坡度的地面拉直。同时增加了1个点云强度通道,1个来自地图中的道路区域通道。将这些通道连接在一起作为输入,做3D目标检测。考虑到并不是所有地方都有高精地图,提出利用一个基于U-Net的在线地图生成模块来产生地图,且提出Data dropout实现对无地图(地图通道输入置为空)时模型也能够鲁棒的数据增强方法。
3、 发现了什么(总结结果,补充和理论的关系)?
1)发现有地图先验会比没地图要好。2)地图中的地面高度先验比道路先验效果要好。3)离线地图(即真实的高精地图)比预测的高精地图效果好,且距离主车距离越远,好得越明显。

摘要:本文提出利用高精度(HD)地图的先验知识可以有效提高3D目标检测的准确率。为此,我们设计了一个可以从高精度地图里提取几何特征和语义特征的单阶段的检测器。因为,并不是所有场景都有HD地图,故还提出了一个HD地图预测模块,这个模块以lidar数据作为输入并预测鸟瞰图角度的hd地图。本文提出的检测器速度20帧。

1、 引言
自动驾驶汽车一般包含以下几个模块:感知、预测、规划、控制。其中感知是指感知障碍物比如车、人,预测是指预测障碍物的意图、轨迹。

高精地图广泛用于规划,但在感知里很少用或者不用。本文提出的检测器作用于鸟瞰图视角,并且可以融合雷达信息和网格地图信息。实验表明,融合了高精地图的信息之后,可以有效提升较远处目标的检测效果。

模型总体架构:

2、 相关研究
2.1 利用点云做3D目标检测:MV3D, PIXOR, FAF
2.2 利用了地图先验的方法

3、 探索利用高精地图实现3D目标检测
3.1 输入表达
首先我们将点云数据投影到鸟瞰图,然后将来自高精地图的先验加入到该鸟瞰图中,加入过程如下图所示:

我们将z作为一个特征通道,考虑到效率,采用2D卷积而非3D卷积。故需要沿z轴方向有较为有分辨力的特征,但是如果地面存在下坡或上坡,在距离比较远的地方这些点云中的3D点就没那么有分辨力了,因为点云很稀疏,往往很难分得清是地面还是目标。
为了解决这个地面坡度问题,我们研究从高精地图里获取准确的地面信息。对应于一个3D点(xi,yi,zi)其对应位置的地面上的点为(xi,yi,z0), 那么重新计算此3D点的位置为(xi, yi, zi-z0)。这样从新表征z值之后的3D点云进行体素化为一个3D空间占有网格(网格内有点记为1,无点记为0)。具体来说,上述的3D网格共有H/dh个通道,除此之外,我们还另外加了两个在设定的高度H范围之外的2个空间占有通道,1个点云强度通道以及1个来自高精地图的道路语义通道(一个mask通道,是道路的用1表示,非道路用0表示)。这样共计是H/dh+4个通道作为网络输入。

3.2 网络结构
主干网络和网络头如下左图所示:

输入到网络头的特征应用了主干网络的多尺度特征,网络头输出采用密集预测,每个像素点预测7个量:

P代表目标分类的置信度,剩下的用于预测3D框。

3.3 学习和推断
训练过程中要保证网络不能过度依赖先验地图,即使没有地图网络也可以预测准确的3D框,故进行对地图层进行随机置为空(应该就是像素点置为0),此操作命名为Data dropout。
训练时的正负例像素点是根据此像素点距离gt框中心点距离确定的,分类损失focal loss,回归smooth l1损失。

4 在线高精地图预测
为了解决并不是所有地方都能获得高精地图的情况,利用单束雷达光束来在线生成地图先验。具体来说就是利用U-Net来同时生成道路先验和地面高度先验。训练时的用已有的高精地图的作为监督。

5、实验
在两个数据集KITTI BEV和TOR4D上做了实验,TOR4D是自带有高精地图的,而KITTI不带高精地图,baseline用的是基于PIXOR改进的PIXOR++。实验结果如下图所示:

5.1 TOR4D实验结果:
TOR4D实验结果表明,1)有离线地图或者在线生成的地图加持的话效果会有提升,且在离线地图的情况下距离越远提升越明显。而在在线预测的地图的情况下,由于距离越远道路预测不准确,反倒提升不那么明显。2)地面高度地图(几何先验)比道路地图(语义先验)效果更好,两个都有的话会信息互补。

5.2 KITTI BEV实验结果
KITTI BEV数据集由于没有高精地图,故直接用TOR4D训练出来的地图预测模块来进行实时生成,且不做fine-turn。

5.3 消融研究
主要研究的是地图预测中的道路预测(语义先验)、地面高度预测(几何先验)以及随机抛弃地图(置为空, data dropout)对模型性能的影响。实验结果如下:

6、结论
本文提出的基于点云的数据的3D目标检测方法可以结果高精地图里的地面高度先验和道路先验实现更好的检测效果。由于高精地图并不是任何地方都有的,故提出了一个基于U-Net的地图生成模块。

【3D目标检测】HDNET: Exploiting HD Maps for 3D Object Detection论文综述(2018)相关推荐

  1. 【3D目标检测】WEAKM3D: TOWARDS WEAKLY SUPERVISEDMONOCULAR 3D OBJECT DETECTION

    目录 概述 细节 背景 算法流程 最终损失 几何目标点云对齐损失 射线追踪损失 基于点密度的点级损失平衡 边界框参数预测的解耦 概述 [2022][WEAKM3D] 研究的问题: 核心问题:如何以2D ...

  2. 目标检测 | RetinaNet:Focal Loss for Dense Object Detection

    论文分析了 one-stage 网络训练存在的类别不平衡问题,提出能根据 loss 大小自动调节权重的 focal loss,使得模型的训练更专注于困难样本.同时,基于 FPN 设计了 RetinaN ...

  3. 旋转目标检测:The KFIoU Loss for Rotated Object Detection(Under review in ICLR 2022)

    关键词:KFIoU, 倾斜IoU(SkewIoU) 参考博客: https://zhuanlan.zhihu.com/p/447286823 论文原文下载: https://openreview.ne ...

  4. 目标检测--Beyond Skip Connections: Top-Down Modulation for Object Detection

    Beyond Skip Connections: Top-Down Modulation for Object Detection CVPR2017 under review code :(comin ...

  5. 目标检测(二)--Hough Forests for Object Detection

    原文: http://www.cnblogs.com/walccott/p/4956860.html 09年cvpr上提出霍夫森林的文章--Class-Specific Hough Forests ...

  6. Stitcher-小目标检测算法 | Stitcher: Feedback-driven Data Provider for Object Detection

    刚出来的小目标检测论文 论文地址:https://arxiv.org/pdf/2004.12432.pdf Abstract: 目标检测器通常会根据尺寸不同具有不同性能表现,其中小物体的性能最不令人满 ...

  7. 【目标检测】61、Dynamic Head Unifying Object Detection Heads with Attentions

    文章目录 一.背景 二.方法 2.1 scale-aware attention 2.2 spatial-aware attention 2.3 task-aware attention 2.4 总体 ...

  8. 目标检测——detr源码复现【 End-to-End Object Detection with Transformers】

    1.环境 2.文档 detr源码地址 detr论文地址 3.数据集 自定义coco数据集 4.模型 在github上面下载 链接:https://pan.baidu.com/s/1fmOYAOZ4yY ...

  9. 3D目标检测论文阅读摘要

    3D目标检测论文阅读摘要 2D Object Detection 的研究已经非常成熟了,代表作品有RPN系列的FasterRCNN,One Shot系列的YOLOv1-YOLOv3,这里推荐一个2D ...

最新文章

  1. java 父线程_Java父线程(或是主线程)等待所有子线程退出的实例
  2. redis有序集合类型sort set
  3. (笔记)电路设计(三)之0欧姆电阻、磁珠、电感的应用
  4. [转]开发者需要了解的WebKit(mark)
  5. SQL基础【九、Update】
  6. mysqli模块的安装
  7. 流程流转相关业务与流转的分离
  8. 布里斯托大学计算机科学专业排名,2021年布里斯托大学世界及专业排名 多个领域位居全英前十!...
  9. 史上最狠降价!锤子加速清仓直降2200,买的人却很少
  10. 今日恐慌与贪婪指数为92 贪婪程度有所上升
  11. Python如何在Dataframe中新添加一列
  12. mysql联合查询怎么去重_MySql 联合查询
  13. 一分钟解决微信小程序截图(截屏问题)
  14. 利用计算机网络实现OA的功能,中小企业oa办公系统解决方案怎么做?
  15. Excel的外部数据的引用
  16. 利用ESP8266+OLED(I2C)打造智能时钟(网络校时+实时天气+天气预报)
  17. React有哪些性能优化的手段?
  18. 关于css中line-height(行高)设置无效的问题
  19. java jms activemq_JMS-ActiveMQ与Java消息服务
  20. 单点登录技术:微软Passport单点登录协议和自由联盟规范

热门文章

  1. Navicat_12安装与破解教程
  2. 3D模型展示 | 手机秒变3D扫描仪,给鞋子拍摄建模
  3. 第四讲 四点共圆问题
  4. 爬虫基础(案例:爬取英雄联盟全皮肤)
  5. 字符串编码(utf8)
  6. python微信api_Python调用微信公众平台接口操作示例
  7. 世图兹公司与TSI公司合作设计模块化数据中心产品
  8. 施密特触发器的作用-摘录+自解
  9. linux 命令行x,向日葵X for Linux Terminal 使用教程(命令行版本)
  10. Linux系统GIC驱动程序分析