Abstract

在这项工作中,我们消除了对 3D 点云进行手动特征工程的需要,并提出了 VoxelNet,这是一种通用的 3D 检测网络,它将特征提取和边界框预测统一到一个单一的阶段、端到端的可训练深度网络中。

Specifically,VoxelNet 将点云划分为等间距的 3D 体素,并通过新引入的体素特征编码(VFE)层将每个体素内的一组点转换为统一的特征表示。

Introduction

手动设计选择引入了信息瓶颈,阻碍了这些方法有效利用 3D 形状信息和检测任务所需的不变性。图像识别和检测 任务的重大突破是由于从手工制作的特征转向机器学习的特征。

RPN是一种高度优化的算法,用于有效的目标检测,但是这种方法要求数据稠密并以tensor结构组织,但LiDAR点云不是如此。本文缩小了用于3D检测任务的点集特征学习和RPN之间的差距。

VoxelNet以端到端的方式同时从点云中学习特征并预测准确的 3D 边界框。设计了VFE(voxel feature encoding)将逐点特征与局部聚合特征相结合,实现体素内的点间交互。堆叠多个 VFE 层允许学习用于表征局部 3D 形状信息的复杂特征。VoxelNet 将点云划分为等间距的 3D 体素,然后通过VFE对体素编码,然后3D卷积进一步聚合局部体素特征,将点云转换为高维体积表示。最后,RPN 使用体积表示并产生检测结果。

Related Work

当有丰富而详细的 3D 形状信息可用时,这些手工制作的特征会产生令人满意的结果。然而,它们无法适应更复杂的形状和场景,也无法从数据中学习所需的不变性,导致在

VoxelNet 阅读相关推荐

  1. VoxelNet阅读笔记

    作者:Tom Hardy Date:2020-02-11 来源:VoxelNet阅读笔记

  2. 超详细的3D视觉学习路线汇总

    微信公众号推荐 [3D视觉工坊简介] 公众号[3D视觉工坊],致力于3D视觉算法.SLAM算法.三维重建.点云处理.深度学习.目标检测.语义分割.自动驾驶感知算法等领域的技术传播,注重内容的原创分享和 ...

  3. 汇总 |计算机视觉系统学习资料下载

    微信公众号推荐 关注公众号 后台回复 「资料」,即可下载 计算机视觉干货资料,涉及相机标定.三维重建. 立体视觉.SLAM.深度学习.点云后处理.姿态估计.多视图几何.多传感器融合等方向 [计算机视觉 ...

  4. 3D视觉学习路线汇总

    微信公众号推荐 [3D视觉工坊简介] 公众号[3D视觉工坊],致力于3D视觉算法.SLAM算法.三维重建.点云处理.深度学习.目标检测.语义分割.自动驾驶感知算法等领域的技术传播,注重内容的原创分享和 ...

  5. 汇总|3D视觉系统学习资料下载

    微信公众号推荐 关注公众号 后台回复 3D视觉  即可下载 3D视觉相关资料干货,涉及相机标定. 三维重建.立体视觉.SLAM.深度学习.点云后处理.多视图几何等方向 [3D视觉工坊简介] 公众号[3 ...

  6. 三维目标检测论文阅读:VoxelNet: End-to-End Learning for Point Cloud Based 3D Object Detection

    VoxelNet: End-to-End Learning for Point Cloud Based 3D Object Detection 理解了PointPillars这篇文章后,看这篇文章就清 ...

  7. 论文阅读笔记 | 三维目标检测——VoxelNet算法

    如有错误,恳请指出. 文章目录 1.背景 2. 网络结构 2.1 体素特征表示 2.2 卷积特征提取 2.3 RPN网络 3. 实验结果 paper:<VoxelNet: End-to-End ...

  8. 3D目标检测论文阅读摘要

    3D目标检测论文阅读摘要 2D Object Detection 的研究已经非常成熟了,代表作品有RPN系列的FasterRCNN,One Shot系列的YOLOv1-YOLOv3,这里推荐一个2D ...

  9. 【论文阅读】【综述】3D Object Detection 3D目标检测综述

    目录 写在开头 3D Object Detection 相关博客: Sliding window Vote3Deep: Fast Object Detection in 3D Point Clouds ...

最新文章

  1. 20 种小技巧,玩转 Google Colab
  2. 【c语言】查找200以内既是3的倍数又是5的倍数的数
  3. [导入]看图说话,编写VS2005插件,增强VS2005 IDE
  4. 如何激励用户为你的app评分?
  5. [计数排序]leatcode--1365. 有多少小于当前数字的数字
  6. 西安交大计算机考研分数线2020院线,西安交通大学2020研究生复试分数线预计4月中旬左右公布...
  7. SCOM Rule 介绍 [SCOM中文系列之六]
  8. vantUI弹框组件 message文字,如何换行 ?
  9. 用Golang构建gRPC服务
  10. python sklearn生成分类、回归任务数据集(可选切分训练数据/测试数据)
  11. C语言实现2048小游戏
  12. Java 多维数组 三维数组 初始化 赋值 打印
  13. matlab元素相同,Matlab:访问所有堆叠结构中的相同元素
  14. 单双面打印价格一样吗_正式合同应该打印单面还是双面?
  15. SVN创建分支/合并分支/切换分支
  16. mysql handler socket_mysql-handlersocket
  17. 阿里云网站域名备案流程全过程(图文讲解)
  18. java web 表单提交_Java Web 表单(form)提交问题!
  19. Revit插件建模助手尺寸定位标注和标注避让操作
  20. 世纪佳缘水分有多大?

热门文章

  1. android 蓝牙无法连接,无法通过蓝牙连接
  2. Generator 快速理解
  3. Softmax激活函数
  4. python中用什么函数读取字符串_Python(2)字符串的主要方法
  5. 控制台忘记mysql登录密码_许久没登录的MYSQL忘记了密码,这样操作不用重装
  6. result returns more than one elements 解决办法
  7. Taurus.MVC 如何升级并运行在NET6、NET7
  8. 品牌对比|斯凯奇 VS 李宁
  9. php做微信支付和支付宝支付的方法
  10. 数据可视化之绘制世界人口地图