标注猿的第55篇原创    

   一个用数据视角看AI世界的标注猿  

上一篇文章我们讲了基于图像的目标检测技术,但对于标注人员来说这部分内容就相对比较难一些,只是作为一个了解就可以,但是如果想向人工智能训练师或者更高职位的发展就一定要了解。

从目前的标注需求来看自动驾驶的标注需要一定是占据了标注行业的半壁江山的而从数据需求来看有是足够持续的,毕竟做自动驾驶的“金主爸爸们”都是非常富足的。

本文就继续就基于激光雷达的目标检测方法做学习。

基于激光雷达的目标检测方法

虽然在图像领域可以利用双目视觉来重建三维场景,能为基于图像的3D目标检测方法提供深度信息,但是所提供的深度细心本身具有一定损失,因此为了获得更加精准的三维信息,激光雷传感器是不可或缺的。

目前基于激光雷达进行3D目标检测的方法,根据其数据表示方法可以分为体素的表示方法和基于原始点云的表示方法。

是将不规则点云转换为类似于图像的规则形式,以便利用3D卷积神经网络进行特征提取。方法包括以下几种:

  • 基于体素的表示方法:

    1. PointPillar:基于立体柱(Pillar)形式的目标检测方法以PointPillar为代表,其将点云以立体柱的形式体素化,每个Pillar中随机保留固定数量的点云,并使用PointNet网络提取Pillar中点云全局特征,作为Pillar的特征。该体素化方式将整个三维点云空间压缩到了二位,并且使用二位的卷积神经网络实现了端到端的3D点云学习。

    2. VoxelNet:基于体素(Voxel)形式的目标检测方法以VoxelNet为 代表,其将点云3D空间等间距分割成多个Voxel,经过点的随机采样以及归一化后,对每个一个非空Voxel使用若干VFE(Voxel Feature Encoding,体素特张编码)层进行局部特征提取,得到体素级特征,然后经过3D卷积神经网络层进一步抽象得到局部的特征,最后使用RPN对物体进行分类检测与位置回归。

      其中VFE层,对于Voxel中N个采样点使用全连接网络抽象点级特征,在使用最大池化方法得到布局特征,这与PointNet的处理方式类似。

      此外,由于点云具有高度的稀疏性以及密度不均匀性,我们利用哈希表查询的方式,可以做到快速找到每一个Voxel中的点在三维点云中的具体位置。

    3. SECOND:SECOND同样使用了Voxel的表示形式,相比于VoxelNet来说,其创新点在于使用了3D稀疏卷积和子流形稀疏卷积来提升目标检测的速度。

      由于点云的稀疏性,其生成的体素网格同样具有很强的稀疏性,因此使用稀疏卷积极大的提高了检测的效率。

      此外,该方法在数据增强时使用了数据库采样操作,该操作将训练数据集中的所有的正样本的点云保存到数据库中,在训练过程中从数据库中随机选择对应类的正样本,加入到该帧训练数据中,从而增强了数据的多样性。

  • 基于原始点云的表示方法:

    为了避免体素化过程中由于丢失精确的三维信息而导致识别结果不准确,可以基于原始点云进行表示。基于原始电影进行3D目标检测的方法包括PointNet、PointNet++、PV-RCNN,SAPV-RCNN。

    1. PointNet:PointNet是基于原始点云进行目标检测的开创性方法。由于原始电影的无序性和不规则问题,传统的卷积神经网络算法难以在原始电影上进行特征提取。

      但是要在原始点云提取特征,必须解决点云的无序性和旋转不变性问题。原始点云的无序性即对于一个特定点集,其不会随点输入顺序改变而改变,因此模型需要对不同输入顺序的相同点集有相同的分类或语义分割结果。

      针对该问题,PointNet使用对称函数保证序列不变,这里用到了最大池化来做对称函数。原始点云的变换不变性,即旋转和平移不改变点云含义,因此模型需要对经过旋转或平移的相同点集有同样结果。

    2. PointNet++:原始点云之间每个点都不是孤立的,因此模型需要可以提取点与相邻点的局部特征能力,PointNet++主要针对PointNet中无法提取局部点云特征做出了改进。

      在PointNet中利用多层感知机对每个点分别提取特征,然后使用对称性函数Max-Pooling来提取全局点云特征,没有考虑到局部特征。

    3. PV-PCNN:PV-RCNN结合了体素化的表示形式和原始点云表示形式的优点,是一个两阶段的网络,从而在可控的内存消耗下提高了3D对象检测的性能。

      第一阶段:产生的检测框是有体素化特征得到的,因此其三维坐标准去度不足。

      第二阶段:对于每个检测框提取了基本原始点云的特征,经过提议求精(Proposal Refinement)模块生成修正的目标检测结果。

    4. SAPV-RCNN:无论是体素法还是原始点云法,更多地都是关注单个类别目标检测效果的提升,尽管网络可以迁移到不同目标类别上完成不同目标检测任务,但是难以训练出统一的网络来对尺度差异较大的多类目标同时完成检测,因此这种方案的扩展性差,必须通过仔细调整模型设计、尝试不同的超参数才能完成新模型的训练,实现多类别高精度检测。

      因此,提出SAPV-RCNN方法,在模型构建时加入尺度自适应模块,通过自适应地学习潜在目标的尺度信息,来指导特征提取范围,从而保证小尺度的物体不会因为特征提取范围过大造成信息完全损失;

      同时,大尺度的物体不会由于特征提取范围过小导致无法提取物体整体信息,从而实现尺度适应的三维目标检测。

以上就是本文基于激光雷达的目标检测方法的介绍。有感兴趣的小伙伴也可以看《基于5G的智能驾驶技术与应用》一书,是北邮的网络与交换国家重点实验室组编,非常适合小伙伴做基础理解和行业了解为主的学习。

相关文章阅读:

  1. 自动驾驶采标系列三:基于图像的目标检测技术(内附标注猿专属定制新年礼品)

  2. 自动驾驶采标系列二:车载感知与车载传感器标定(内附标注猿专属定制新年礼品)

  3. 自动驾驶采标系列一:自动驾驶数据采集资质及采集数据出境的调研分析

下一篇文章预告:

《自动驾驶采标系列五:图像与激光雷达联合目标检测方法》”

-----------------------完---------------------

公众号:AI数据标注猿

知乎:AI数据标注猿

CSDN:AI数据标注猿

-----------------------完---------------------

自动驾驶采标系列四:基于激光雷达的目标检测方法相关推荐

  1. 自动驾驶采标系列六:复杂场景语义理解-交通识别检测技术

        标注猿的第57篇原创        一个用数据视角看AI世界的标注猿   前几篇文章从两种数据的角度去学习了基于图片和激光雷达数据的算法,较为通俗的说明了其算法的逻辑,从而为理解其标注数据在使 ...

  2. 自动驾驶采标系列七:复杂场景语义理解-可行驶区域检测

        标注猿的第58篇原创        一个用数据视角看AI世界的标注猿   本篇文章我们继续学习自动驾驶采标系列的算法基础理论,关于复杂场景语义理解中的可行驶区域检测部分. 车辆可行驶区域包括结 ...

  3. 自动驾驶采标系列三:基于图像的目标检测技术

        标注猿的第54篇原创        一个用数据视角看AI世界的标注猿    上一篇文章我们从"环境感知"数据的采集设备上进行了详细说明,已经了解了相应设备采集的数据及采集前 ...

  4. 自动驾驶采标系列二:车载感知与车载传感器标定

    上一篇文章对自动驾驶采标问题中的一系列法律问题进行了浅析,接下来自动驾驶采标系列里面会对自动驾驶相关技术和知识点进行进一步梳理,来帮助小伙伴深入的了解自动驾驶的架构逻辑与数据采标工作的关系. 上文中提 ...

  5. 自动驾驶采标系列一:自动驾驶数据采集资质及采集数据出境的调研分析

        注猿的第52篇原创           一个用数据视角看AI世界的标注猿     各位小伙伴小猿又回来啦,最近由于工作的原因拖更了两个月的时间,很多小伙伴后台留言没有及时回复还请海涵,为了表达 ...

  6. 基于形心的目标检测方法

    基于形心的目标检测方法 用VisualStudio和OpenCV实现,包括BMP文件读取.固定阈值分割.大津阈值分割.迭代法分割.目标形心的确定.目标框的确定等. Object_Detection.h ...

  7. 【目标检测_keypoint based 方法系列】基于关键点的目标检测

    文章目录 一.CornerNet 二.ExtremeNet 三.CenterNet 3.1 关键步骤: 3.2 关键点检测网络: 3.3 目标大小的回归 3.4 从点到b-box: 3.5 Cente ...

  8. 自动驾驶(三十四)---------可行驶区域检测

    可行驶区域的检测主要是为自动驾驶提供路径规划辅助,可以实现整个的路面检测,也可以只提取出部分的道路信息,比如前方一定区域内的道路走向或者道路中点等,只要能结合高精度地图实现道路路径规划和障碍物躲避,不 ...

  9. A Survey of Robust LiDAR-based 3D Object Detection Methods for Autonomous Driving(激光雷达3D目标检测方法)论文笔记

    原文链接:https://arxiv.org/pdf/2204.00106.pdf III. SotA 将基于点云的3D目标检测分为4类,即基于点的.基于体素的.基于前视图的和基于多视图的方法. A. ...

最新文章

  1. redhat linux新建用户,linux redhat 添加用户
  2. 【Indiegogo众筹】$99高性价比RK3399超小型mini主机
  3. 回滚到公共回购中的旧Git提交
  4. 0R电阻的12种妙用---摘自:俸禄的小三
  5. 20220215-CTF-MISC-BUUCTF-镜子里面的世界-stegsolve工具的使用- Data Extract
  6. java实现c#的datetime.ticks_java的Date.getTime()转换成C#的Datetime.ticks | 学步园
  7. Qt工作笔记-QMenu::exec中使用QWidget::mapToGlobal()与QCursor::pos()之间的些许差异
  8. 腾讯开源最大规模多标签图像数据集,刷新行业数据集基准
  9. Vim - 奇技淫巧
  10. JS 用JS实现跟随光标的提示
  11. Vista部署的一些收集
  12. linux根目录被mv,【Linux】mv根目录的恢复(转)
  13. Redis Command
  14. iapp导入源码使用教程,iapp保存图像代码教程
  15. man手册,安装中文手册
  16. 微服务出现Shutting down DiscoveryClient问题
  17. 「Cold Chain 2015国际冷链物流展」
  18. 怎么能跳过苹果服务器降级系统,苹果ios11手机怎样将系统降级?简单三步即可完成降级!...
  19. 人工智能如何入门学习?前景如何
  20. 1213:八皇后问题

热门文章

  1. SQL Server AlwaysON从入门到进阶(2)——存储
  2. 【Python】Python图形化界面库PySimpleGUI的简单使用
  3. java开发的岗位职责,写给正在求职的Java开发
  4. Eclipse的基本操作及相关命令
  5. 十进制转二进制(C语言)
  6. 解决Prettier HTML闭合标签总是另起一行的问题
  7. Python输出斐波那契数列【递归、迭代】
  8. Elasticsearch 权威教程 - 入门
  9. 移动端事件及事件应用
  10. pc端ui图片尺寸_PC端UI界面设计规范分享 共同来学习_ui设计