SECOND: Sparsely Embedded Convolutional Detection

论文链接: https://www.researchgate.net/publication/328158485_SECOND_Sparsely_Embedded_Convolutional_Detection

项目连接: https://github.com/traveller59/second.pytorch

一、Problem Statement

目前的voxel-based 3D 卷积网络速度慢和方向预测差。

二、Direction

  1. 利用sparse convolutional network 提高运行速度。
  2. 提出Data Augmentation 使得收敛速度提高以及提升了精度。
  3. 对于方向预测表现差的问题,提出了一个新的 angle loss。

三、Method

1. 网络结构

网络结构主要分三个部分: voxelwise feature extractor、 a sparse convolutional middle layer、 an RPN

(1) voxelwise feature extractor

和voxelnet一样,先把pointcloud grouping,然后用VFE(voxelwise feature extractor)进行特征提取。大致上就是把点云分割成规定数量的voxel,然后每个voxel里面的point是有限制的。详细可以看voxelnet论文解析。

(2) a sparse convolutional middle layer

middle extractor是用来学习z轴上的信息,并且把稀疏的3D数据转换为2D BEV图像。这个包含了两种卷积: sparse convolution 和 submanifold convolution。

(3) an RPN

Region propose network 与 SSD 类似, 其包含三个dowsample阶段,最后输出class, regression offsets 和 direction。

2、目标函数

整体的目标函数如下:
Ltotal=β1Lcls+β2(Lreg−θ+Lreg−other)+β3LdirL_{total} = \beta_1 L_{cls} + \beta_2(L_{reg-\theta} + L_{reg-other}) + \beta_3 L_{dir} Ltotal=β1Lcls+β2(Lregθ+Lregother)+β3Ldir

(1) sine-Error Loss for Angle Regression

voxelnet 直接预测弧度补偿,面临着一个角度相反的问题(adversarial example problem),比如0度和180度。它们两个角度相反,但是bounding box都是一样的,如果误识别了,会导致loss很大。因此提出了sin-Error loss:
Lθ=SmoothL1(sin(θp−θt))L_{\theta}=SmoothL1(sin(\theta_p - \theta_t)) Lθ=SmoothL1(sin(θpθt))

其中θp\theta_pθp是预测值。

这个loss 有两个优点:

  1. 解决了adversarial example problem。
  2. 它自然地根据角度偏移函数对IoU进行建模

(2) direction loss

上面的angle loss 把相反的bounding box视为一样,则在direction loss 使用了 softmax loss 进行区分。如果yaw 旋转相对于真值的z轴大于0,则为positive, 否者为negative。

(3) classification loss

分类使用的是focal loss

FL(pt)=−α(1−pt)γlog(pt)FL(p_t) = -\alpha (1-p_t)^\gamma log(p_t) FL(pt)=α(1pt)γlog(pt)

3、数据增强

(1) sample ground truths from the database

建立一个数据库,包含真值的label和对应的点云数据。然后在训练的时候,随机选择数据库里面的真值,进行插入补充。为了避免重叠,还会进行collision test。

(2) object noise

与voxelnet一样, randomly transformed, random rotations, random linear transformation。

(3) global rotation and scaling

对整个点云进行全局的旋转以及scaling。

四、 Conclusion

提出的 angle loss 和 数据增强值得学习。

五、Reference

  1. https://zhuanlan.zhihu.com/p/110502915

SECOND: Sparsely Embedded Convolutional Detection 论文笔记相关推荐

  1. 【3D目标检测】SECOND: Sparsely Embedded Convolutional Detection论文解读(2018)

    1. 为什么要做这个研究(理论走向和目前缺陷) ? VoxelNet这种直接对点云进行特征提取而非手工设计特征的3D检测算法效果还行但是很慢.以前的方案朝向预测不准. 2. 他们怎么做这个研究 (方法 ...

  2. 论文笔记 : SECOND: Sparsely Embedded Convolutional Detection

    SECOND: Sparsely Embedded Convolutional Detection 重庆大学,输变电设备与系统安全国家重点实验室,2018,KITTI 总结 基于体素划分的3D卷积网络 ...

  3. 论文阅读 SECOND:Sparsely Embedded Convolutional Detection

    标题:SECOND:Sparsely Embedded Convolutional Detection 作者:Yan Yan,Yuxing Mao,and Bo Li 来源:sensors 2018 ...

  4. 【论文阅读】SECOND: Sparsely Embedded Convolutional Detection

    论文链接: https://www.researchgate.net/publication/328158485_SECOND_Sparsely_Embedded_Convolutional_Dete ...

  5. SECOND: Sparsely Embedded Convolutional Detection

    Abstract 基于LiDAR或基于RGB-D的目标检测被用于从自动驾驶到机器人视觉的众多应用中.一段时间以来,基于体素的3D卷积网络在处理点云LiDAR数据时被用于增强信息的保留.然而,问题仍然存 ...

  6. 【3D目标检测】SECOND: Sparsely Embedded Convolutional Detection

    目录 概述 细节 网络结构 稀疏卷积 方向分类 损失函数 概述 首先,本文是基于点云,并且将点云处理成体素的3D目标检测网络,提出的SECOND可以看做是VoxelNet的升级版. 提出动机与贡献 V ...

  7. (2018, sensors) SECOND: Sparsely Embedded Convolutional Detection

    paper: https://www.mdpi.com/1424-8220/18/10/3337 code: https://github.com/traveller59/second.pytorch ...

  8. End-to-End Object Detection with Fully Convolutional Network 论文笔记

    background 任务:目标检测任务中,去除不可训练的NMS,实现端到端的训练 关键词:POTO,3DMF Introduction 传统的目标检测会用到不可训练的NMS,严重阻碍了端到端的训练. ...

  9. 【优化训练】RePr:Improved Training of Convolutional Filters论文笔记

    论文题目     RePr:Improved Training of Convolutional Filters 这是2019年CVPR的一篇文章,主要针对卷积神经网络的训练方法,提出一种新的训练模式 ...

最新文章

  1. python刷CSDN阅读量
  2. Android编程获取网络连接状态(3G/Wifi)及调用网络配置界面
  3. MiniGUI编程--静态框[转]
  4. 数组在内存中存储方式
  5. 的文件夹结构_小白指南:WordPress文件及目录结构解析
  6. gcc oracle mysql_[转]Windows下用GCC连接MySQL数据库
  7. 《设计模式详解》行为型模式 - 备忘录模式
  8. 《代码整洁之道》—第1章1.1节要有代码
  9. Ant编译SWF、SWC例子脚本
  10. 你必不可能错过的java开源商城项目
  11. ps切图后 JAVA开发_PS切图工具
  12. 修改yum源带来的问题 curl: (35) Cannot communicate securely with peer: no common encryption algorithm(s).
  13. c#笔记--程序集(Assembly)、模块(Module)、类型(class)、命名空间、反射
  14. 模拟unity自带地形的grass
  15. 生活随记 - 2020国庆第七天
  16. 游戏中常用的设计模式
  17. mathtype安装
  18. Proactol什么是脂肪燃烧
  19. centos离线安装docker
  20. Whistle pc抓包,手机抓包,https抓包

热门文章

  1. 成都工业大数据研究院
  2. 汽车维修管理系统(RPMS)项目
  3. Android Watchdog分析
  4. Joplin安装使用及结合teracloud同步
  5. 钢材规格解读的软件_钢材规格表及软件下载
  6. jieba分词自定义词库无效果
  7. Java 下载zip文件
  8. js 数组去重 的5种方法
  9. Ubuntu20.04安装QQ
  10. 程序员们,阿里、腾讯和百度的公司职级、薪资待遇,你有了解吗?