点云的无序性_基于深度学习的激光雷达点云物体识别方法总结
0. 前言:
激光雷达作为自动驾驶不可或缺的传感器,随着价格不断下降,各种基于深度学习的模型也层出不穷(坐等马斯克打脸);
激光雷达物体识别的任务:
- 输入: 激光点云(x, y, z, intensity)
- 输出: 3D Boundingbox(BB) 信息: 中心点左边(x, y, z); 3D BB尺寸 length width height, 三个方向的朝向角 yaw pitch roll, 但是考虑到自动驾驶车辆实际是行驶在二维世界,所以真正的输出常是(x, y, l, w, h, yaw)
激光雷达点云的特点:
- 点云无序性
- 相邻点相关性
- 旋转平移不变行
1. 正文
基于深度学习方法的物体识别路线,根据模型输入形式可以大体分为以下三类:
- 纯点云输入
- 将点云转化为体素格子
- 将点云投影到二维栅格图中,这又分为将投影到鸟瞰图(BEV)和前视图
下面基于上面的分类对当前的模型做一个总结:
- 基于纯点的输入:
这个最出名的就是 PointNet 系列了,具体可以参考我专栏对这几篇文章的解读: PointNet系列(1)-PointNet论文解读; PointNet系列(2)-PointNet++论文解读; PointNet系列(3)-Frustum-PointNet论文解读; PointNet 提出了将纯点作为网络输入的模型,解决了点云无序性和变换不变性; PointNet++ 增加了网络提取点与点之间局部特征的能力; F-Pointnet 其实是将图像识别的结果作为PointNet的输入,所以不算严格意义上的纯lidar做物体识别,以及商汤和香港中文大学的 PV-RCNN: Point-Voxel Feature Set Abstraction for 3D Object Detection, 基于纯点的网络有以下几个特点:
- 适合做室内小范围的
- 可以做Semantic Segmentation
2. 将点云转换为体素格子(Voxel):
VoxelNet 最先提出Voxel 这个概念, SECOND: Sparsely Embedded Convolutional Detection 将VoxelNet中的3d卷积替换为稀疏卷积从而大幅度曾快了识别速度; MVX-Net: Multimodal VoxelNet for 3D Object Detection 将VoxelNet 和RGB图像融合在了一起;
- 3d卷积花费的时间太多,很难达到实时性的要求
3. 将点云投影到二维栅格图上:
这个方法是应用最广的,FVNet: 3D Front-View Proposal Generation for Real-Time Object Detection from Point Cloud 是基于前视图(Front View)的, 更多的是基于鸟瞰图的模型:
Panzerfahrer:RT3D:自动驾驶中利用3D点云实时车辆识别
PIXOR: Real-time 3D Object Detection from Point Clouds
Panzerfahrer:PointPillars:点云物体识别的快速编码 (2020.04.18更新)
PointPillars: Fast Encoders for Object Detection from Point Clouds
TANet: Robust 3D Object Detection from Point Clouds with Triple Attention
阿里的一篇新文章:PI-RCNN: An Efficient Multi-sensor 3D Object Detector with Point-based Attentive Cont-conv Fusion Module
2. 展望:
- 激光雷达未来每个点可能不止只有四个维度(x, y, z, intensity), 还可能拥有速度信息, 这为神经网络高维卷积提出了挑战;
- 对于模型的选择是速度和准确率的trade-off的过程,不过目前自动驾驶对实时性要求的优先级更高,所以投影到2d栅格图成为各大公司的主流方案;
- 基于时序的RNN网络也将是未来的发展方向;
- 激光雷达目前不能大规模应用到自动驾驶汽车的原因主要有两点:成本较高&车规要求较高,当这两个问题都解决的时候,特斯拉也逃不过真香定律叭
最后欢迎关注我的激光雷达专栏啊,也欢迎和我交流~
激光雷达乱炖zhuanlan.zhihu.com
推荐几篇另外总结的很好的文章:
美团无人配送:万字长文教你读懂自动驾驶中的激光雷达目标检测(上)
美团无人配送:万字长文教你读懂自动驾驶中的激光雷达目标检测(下)
黄浴:基于激光雷达数据深度学习做目标检测(上)
黄浴:基于激光雷达数据深度学习做目标检测(下)
点云的无序性_基于深度学习的激光雷达点云物体识别方法总结相关推荐
- 一种基于深度学习的遥感图像分类及农田识别方法
文章针对现有的神经网络收敛速度慢.识别准确率不高的缺点,提出了一种基于卷积神经网络的遥感图像农田分类及识别方法.该算法使用较大的卷积核,有效地提取梯度信息:设计深度为6层的卷积神经网络,提高了网络的分 ...
- 基于深度学习的三维点云识别
基于深度学习的三维点云识别 一.什么是三维物体识别 随着三维成像技术的发展,结构光测量.激光扫描.ToF等技术趋于成熟,物体表面的三维坐标能够精准而快速的获取,从而生成场景的三维数据,能够更好地感 ...
- 基于深度学习的番茄叶部病害识别模型
基于深度学习的番茄叶部病害识别模型 1.研究思路 为实现番茄叶病特征的自动 提取,并提高识别准确率,提出一种基于深度学习的番茄叶病识别模型.该模型基于卷积神经网络对番茄叶部病害特征进行自动提取,获得高 ...
- 基于深度残差网络的番茄叶片病害识别方法
基于深度残差网络的番茄叶片病害识别方法 1.研究思路 该方法首先利用贝叶斯优化算法自主学习网络中难以确定的超参数,降低了深度学习网络的训练难度.在此基础上,通过在传统深度神经网络中添加残差单元,解决了 ...
- DeepRMethylSite:一种基于深度学习的蛋白质精氨酸甲基化位点预测方法
DeepRMethylSite:一种基于深度学习的蛋白质精氨酸甲基化位点预测方法 https://www.researchgate.net/publication/341890599_DeepRMet ...
- 基于深度学习的近红外掌纹识别原型系统设计与实现
基于深度学习的近红外掌纹识别原型系统设计与实现 一.绪论 二.深度学习知识 三.Tensorflow 四.卷积神经网络 五.掌纹识别理论 掌纹图像采集 掌纹图像预处理 掌纹特征提取 掌纹特征匹配 掌纹 ...
- 基于深度学习的高精度家禽猪检测识别系统(PyTorch+Pyside6+YOLOv5模型)
摘要:基于深度学习的高精度家禽猪检测识别系统可用于日常生活中或野外来检测与定位家禽猪目标,利用深度学习算法可实现图片.视频.摄像头等方式的家禽猪目标检测识别,另外支持结果可视化与图片或视频检测结果的导 ...
- 基于深度学习模型的电力变压器故障声音诊断方法研究-论文阅读笔记
基于深度学习模型的电力变压器故障声音诊断方法研究 论文来源 DOI:10.16311/j.audioe.2020.01.020 论文目的 在变压器不停止工作的情况下,基于变压器的三种状态:正常.老化和 ...
- “交通·未来”第10期:基于深度学习的动态系统复杂数据建模方法:以铁路列车晚点预测为例...
前一阵公众号正式推出了"交通·未来"系列线上公益学术活动等你来~, 9月21日晚19:00,我们将迎来活动的第10期. 1.讲座主题 基于深度学习的动态系统复杂数据建模方法:以铁路 ...
最新文章
- Go语言中的struct的初始化。
- 关于eclipse里启动Tomcat访问不到8080页面的问题
- matlab边算边出图命令,Matlab:不包含边境和工具栏的figure(移除保存图片的白边)...
- getminimum_Java Calendar getMinimum()方法与示例
- STM32F103单片机PWM单脉冲输出模式
- python作品_专业解读 | 制作游戏、开发APP、 爬虫采集数据等背后,Python全栈专业背后还有更大的世界...
- Arcade扩展音色库:Output Arcade Brain Waves Library Content
- php ckeditor 使用教程,织梦实现使用默认编辑器ckeditor上传视频功能( 详细)
- php web开发实用教程答案,PHP Web开发实用教程
- 单片机蜂鸣器源代码+仿真
- MapReduce论文中文翻译
- 沈阳移动打造“爱贝通”、“校讯通”业务助少年儿童健康成长
- Zema自学--3(实际操作)
- 这样的萌妹,谁不爱呢?
- 学习前端的第三十二天——ES6
- 安装phpnow服务[Apache_pn]提示失败的解决方法
- 带着问题重学 Java 并发编程
- 什么是计算机?计算机硬件详细介绍和参数解读[2]
- 中国婴儿紧身衣(婴儿连体衣)市场趋势报告、技术动态创新及市场预测
- 知乎回答一键导出为PDF——Python实现
热门文章
- 企业税银数据深度分析(上)
- 《如何搭建小微企业风控模型》第五节 特征工程(上)
- 互联网金融监管平台、舆情监测、数据统计、预警、违规、企业中心、舆情概况、舆情报告、新增企业、栏目管理、年审企业、企业走势、推价位管理、新闻管理、账户管理、监管平台、金融监管、Axure原型、rp原型
- 微信小程序 ----- this.getOpenerEventChannel is not a function
- 一道信号量的问题---卖火车票
- java中的dao模式
- welcome-file-list标签的控制作用以及在springmvc中此标签的的配置方式
- Android之打开闪光灯关键代码
- haproxy + keepalived + mycat 高可用与负载均衡集群配置 centos7
- Jzoj3898 树的连通性