Second算法是一种基于三维点云的目标检测算法。Second算法采用了几乎与Voxelnet三维目标检测算法完全一致的设计思路,主要差异表现在将Voxelnet CML(Convolutional Middle Layer)卷积提取特征层改为采用三维稀疏卷积进行特征提取。因此,在理解Second算法之前,推荐先看一遍voxelnet算法,详细介绍请参考之前的博客【三维目标检测】VoxelNet(三):模型详解_Coding的叶子的博客-CSDN博客_voxelnet 点云 目标检测。

1 稀疏卷积简介

以二维图像为例,如果图像中绝大多数像素取值都为0,那么我们可以称这个图像是稀疏的。对于三维点云,体素中很多点的取值都是空的,或者置为0,因而也是稀疏的。对于取值为0的点,在进行卷积计算时仍然是0,因而很大一部分点是不需要参与计算或占用计算图内存。因此,稀疏卷积的意义在于记录这些不为0的数据位置,然后重新构建一个计算方式,使得仅仅不为0的点参与卷积计算,从而节省了计算资源并提高了计算速度。

本质上,我们仍然可以把稀疏卷积当作普通卷积来看,只是稀疏卷积采用了特殊的计算方法,针对稀疏数据进行了优化。因此,稀疏卷积和普通卷积一样,通常是不断地提升通道数量、特征维度和感受野,降低特征图维度。

因此,我们可以把稀疏卷积当作普通卷积去理解,如果需要深入理解稀疏卷积,可以参考其他资料,或者查看其实现源码。

2 源码与输入数据

源码采用的是mmdetection3d框架中的second模型。mmdetection3d安装和调试验证可参考本博客之前的专栏,里面有详细介绍。

数据采用的是kitti,为了快速进行算法调试、训练、评估和验证,以及快速下载,我制作了一个mini kitti数据集,数据集的文件目录结构与完整KITTI数据集保持一致。其中,小型的KITTI数据集,即 mini kitti保存了20个训练样本和5个测试样本。下载地址为:minikitti数据集-深度学习文档类资源-CSDN下载。

下载的数据包含4个部分,即激光雷达数据velodyne、图像数据image_2、校准数据calib和标注数据label_2。如果需要对应的ImageSets,请下载:train_val_testforminikitti-深度学习文档类资源-CSDN下载,将下载的文件夹重名为ImageSets即可。

关于KITTI各个部分的介绍请分别参考以下内容:

KITTI数据集简介(一) — 激光雷达数据_Coding的叶子的博客-CSDN博客_雷达数据集

KITTI数据集简介(二) — 标注数据label_2_Coding的叶子的博客-CSDN博客_kitti数据集标注

KITTI数据集简介(三) — 图像数据image_2_Coding的叶子的博客-CSDN博客

KITTI数据集简介(四) — 图像数据calib_Coding的叶子的博客-CSDN博客

数据预处理部分可以参考Voxelnet的数据处理方式加以理解:【三维目标检测】VoxelNet(二):数据处理_Coding的叶子的博客-CSDN博客。

3 模型结构、推理过程

模型详细结构及推理过程请参考下一篇博客:【三维目标检测】Second 模型 (二)_Coding的叶子的博客-CSDN博客。

4 【python三维深度学习】python三维点云从基础到深度学习_Coding的叶子的博客-CSDN博客_三维点云深度学习

更多三维、二维感知算法和金融量化分析算法请关注“乐乐感知学堂”微信公众号,并将持续进行更新。

【三维目标检测】Second 模型 (一)相关推荐

  1. Complexer-YOLO:基于语义点云的实时三维目标检测与跟踪

    泡泡点云时空,带你精读点云领域顶级会议文章 标题:Complexer-YOLO: Real-Time 3D Object Detection and Tracking on Semantic Poin ...

  2. 【三维目标检测】CenterPoint(一)

    CenterPoint是一种anchor free的三维目标检测算法模型,发表在CVPR 2021,论文名称为<Center-based 3D Object Detection and Trac ...

  3. 【三维目标检测】SSN(一)

    本文为博主原创文章,未经博主允许不得转载. 本文为专栏<python三维点云从基础到深度学习>系列文章,地址为"https://blog.csdn.net/suiyingy/ar ...

  4. 【三维目标检测】Second 模型 (二)

    Second模型的基本介绍.稀疏卷积.mini kitti数据集等请参考本专栏的上一篇博文:[三维目标检测]Second 模型 (一)_Coding的叶子的博客-CSDN博客.本节将介绍模型的详细结构 ...

  5. 【三维目标检测】Complex-Yolov4详解(二):模型结构

    Complex-Yolo网络模型的核心思想是用鸟瞰图BEV替换Yolo网络输入的RGB图像.因此,在完成BEV处理之后,模型的训练和推理过程基本和Yolo完全一致.Yolov4中输入的RGB图片的尺寸 ...

  6. ICCV2019论文点评:3D Object Detect疏密度点云三维目标检测

    ICCV2019论文点评:3D Object Detect疏密度点云三维目标检测 STD: Sparse-to-Dense 3D Object Detector for Point Cloud 论文链 ...

  7. 三维目标检测算法原理

    三维目标检测算法原理 输入输出接口 Input: (1)图像视频分辨率(整型int) (2)图像视频格式(RGB,YUV,MP4等) (3)左右两边的车道线位置信息摄像头标定参数(中心位置(x,y) ...

  8. 【论文速读】基于图像的伪激光雷达三维目标检测

    点云PCL免费知识星球,点云论文速读. 标题:End-to-End Pseudo-LiDAR for Image-Based 3D Object Detection 作者:Rui Qian, Divy ...

  9. CVPR 2021 | 视觉目标检测大模型GAIA:面向行业的视觉物体检测一站式解决方案

    作者丨常清 编辑丨机器之心 中国科学院自动化研究所智能感知与计算研究中心联合华为等企业提出面向行业的视觉物体检测一站式解决方案 GAIA. 在深度学习与大数据的浪潮下,视觉目标检测在各个基准数据集上已 ...

最新文章

  1. LeakCanary 源码解析
  2. Python 中文分词(结巴分词)
  3. 推荐系统的十个关键点
  4. 加密文件忘记密码怎么解密_MyBatis 配置文件 用户密码加密存储
  5. Android char数据类型乱码��解决方法
  6. 四部门对蚂蚁集团提出整改要求,蚂蚁集团:已立即着手制定整改方案
  7. php cpp,PHPCPP安装以及hello world
  8. crontab定时任务语法及应用
  9. hadoop 笔记(hive)
  10. java程序: 倒计时的小程序 (GridPane, Timer, Calendar, SimpleDateFormat ...)
  11. python3.5和python3.6关于json模块的区别
  12. RedHat 5.6_x86_64 + ASM + RAW+ Oracle 10g RAC (二)
  13. movingpandas时空数据分析——旧金山出租车轨迹数据集处理
  14. 产品经理——产品方法论
  15. 蓝桥杯 java 楼梯,递归1之楼梯问题
  16. phpstud使用教程_phpstudy使用方法详细图文教程
  17. word如何一次将所有英文改为新罗马字体
  18. 在VB中如何使IE窗口最大化
  19. 蓝桥:8皇后·改(⼋皇后问题)
  20. 从无序到有序的负熵力量

热门文章

  1. 如何下载python编译器,以及python 编译器如何使用 图文详解
  2. 【牛客】幸运数字II题解
  3. 【面试相关】数据分析面试前必看知识点QA③
  4. 数据库集合运算与关系代数
  5. SpringBoot整合opencv实现全景图切割
  6. 『随感。』:生活琐事
  7. 公司邮箱一般用哪个?
  8. 长安链赋能北京140余个政务服务应用场景
  9. web浏览器中的base64编码解码
  10. [Reading]THIRD BASE