报告题目 浅析CV下的无人驾驶技术

1.概述:
2006年,Geoffrey Hinton老爷子针对传统的神经网络算法训练速度慢,面对多层Hidden Layer严重出现过拟合的现状,提出了无监督预训练对权值进行初始化+有监督训练微调的解决方案。从此,基于神经网络的Deep Learning开始活跃在世界科研前沿[1]。
而目前Deep Learning在工业上应用最广的前沿领域分别是:
1.CV:计算机视觉领域
2.NLP:自然语言处理领域
3.ASR:语音识别领域
4.Autopilot:自动驾驶其实也是CV的衍生领域
5.推荐:传统的推荐都是用GBDT+LR模型来做的,目前深度学习在推荐领域也得到了广泛的应用。
在深度学习算法的不断更新和计算机硬件的不断升级下,我们以前电影中所谓的无人驾驶汽车在计算机视觉技术下已经开始出现了眉目[2][3]。

2.无人驾驶技术相关技术介绍:
1.传感器
在无人驾驶中,车辆在行驶时需要实时地去感知周围的环境,包括行驶在哪里、周围有什么障碍物、当前交通信号怎样等等。就像我们人类通过眼睛去观察世界,无人车也需要这样一种 “眼睛”,这就是传感器。传感器有很多种,例如激光雷达、摄像头、超声波等等。
由于不同的传感器的数据格式有很大差别,所以也会有专门针对某种传感器数据设计的算法。例如有专门针对激光点云设计的障碍物检测模型VoxelNet[4]。
VoxelNet:将3D点云数据看做一个个的Voxel(立体块)进行处理。VoxelNet的网络结构分为三部分,分别为(1)特征学习网络(2)中部卷积层(3)RPN层,如下图所示。

图1.VoxelNet的网络结构模型
2.目标检测
由于摄像头数据包含丰富的颜色信息,所以对于精细的障碍物类别识别、信号灯检测、车道线检测、交通标志检测等问题就需要依赖计算机视觉技术。无人驾驶中的目标检测与学术界中标准的目标检测问题有一个很大的区别,就是距离。无人车在行驶时只知道前面有一个障碍物是没有意义的,还需要知道这个障碍物的距离,或者说需要知道这个障碍物的 3D 坐标,这样在做决策规划时,才可以知道要用怎样的行驶路线来避开这些障碍物。这个问题对于激光的障碍物检测来说很容易,因为激光本身就包含距离信息,但是想只凭借图片信息去计算距离难度比较高。
自2014年以后,目标检测的发展脉络如下图所示:

图2.目标检测的发展脉络
Focal loss[5]的公式:

其中:

其中γ为常数,且当其为0时,FL和普通的交叉熵损失函数一致。 γ不同取值,FL曲线如下:

图3 Focal loss不同γ曲线图

3.分割
分割技术在无人驾驶中比较主要的应用是可行驶区域识别。可行驶区域可以定义成机动车行驶区域,或者当前车道区域等。由于这种区域通常是不规则多边形,所以分割是一种较好的解决办法。
在无人驾驶中应用比较多的是语义分割。例如路面分割、人行横道分割等等。语义分割比较早期和经典的模型是 FCN[6]。FCN 有几个比较经典的改进,首先是用全卷积层替换了全连接层,其次是卷积之后的小分辨率 Feature Map 经过上层采样,再得到原分辨率大小的结果,最后 FCN 使用了跨层连接的方式。跨层连接可以将高层的语义特征和底层的位置特征较好地结合在一起,使得分割的结果更为准确。FCN 结构图如下所示:

图4.FCN 结构图
目前很多主流的分割模型准确率都比较高,但是帧率会比较低。而无人驾驶的应用场景中模型必须实时,尤其是高速场景下,对模型的速度要求更高。目前美团使用的是改进版的 ICNet[7],既保证了模型的运行速度,又保证了模型的准确率。

图5.ICNet模型结构
4.距离估计
对于距离信息的计算有多种计算方式:
激光测距,原理是根据激光反射回的时间计算距离。这种方式计算出的距离是最准的,但是计算的输出频率依赖于激光本身的频率,一般激光是 10Hz。
单目深度估计,原理是输入是单目相机的图片,然后用深度估计的 CNN 模型进行预测,输出每个像素点的深度。这种方式优点是频率可以较高,缺点是估出的深度误差比较大。
结构光测距,原理是相机发出一种独特结构的结构光,根据返回的光的偏振等特点,计算每个像素点的距离。这种方式主要缺点是结构光受自然光影响较大,所以在室外难以使用。
双目测距,原理是根据两个镜头看到的微小差别,根据两个镜头之间的距离,计算物体的距离。这种方式缺点是计算远处物体的距离误差较大。
3.业界相关进展及应用
目前业界开源的解决方案中比较成熟的是百度的 Apollo[8],包含了改进的 ROS 底层系统,以及无人驾驶中各个模块的实现。
除了 Apollo 之外,业界开源解决方案还有 Autoware[9]以及美团自研算法。
美团的自研算法参考了 Autoware 的这种解决思路,并做了很多改进。同样先将激光点转换到图片当中,这样我们就知道每个激光点打到了哪里。在得到每个 2D 框中的激光点之后,我们需要做一步聚类操作,这样可以过滤掉打到背景上的点,于是我们就得到了打到这个物体上的激光点。然后在三维空间中,我们可以拟合这些激光点,得到一个三维框,包含了物体准确的位置信息。
这种方法计算出的三维框相对比较准确,但缺点是对于远处较小的物体,由于打到的激光点太少了,难以拟合出合适的结果。具体效果如下图:

4.无人驾驶技术的未来前景和挑战
汽车的出现本身对人类社会来说有着非凡的意义,而无人驾驶车在普通汽车上融合了自动化技术、智能化技术以及互联网化技术等多种新型技术,对汽车产业来说更是一个重大的飞跃。无人驾驶技术的实现,可以解决很多交通问题,减少交通事故,为人们的生活带来便捷,是人类社会的一个重要发展方向。
同时,无人驾驶技术也有着很多技术和社会性方面的难题与挑战。包括汽车硬件的升级换代,深度学习算法的改进,社会交通规则的变更,目前特斯拉,华为,小米,苹果,美团等世界企业都将目光投入到了无人驾驶技术中。我们相信,未来的数年内,无人驾驶技术必将真正登上历史的舞台,并推动整个人类社会迈入新的科技纪元。
5.参考文献:
[1]http://gitbook.cn/gitchat/activity/5b91078c41c7575ca0d6441a
[2]张月月. 浅析无人驾驶中的计算机视觉[J]. 卫星电视与宽带多媒体,2019,(20):43-44.
[3]范志远,崔田田,王青松. 计算机视觉在无人驾驶领域的应用[J]. 数码世界,2020,(05):2.
[4]Harish S Gujjar. A Comparative Study of VoxelNet and PointNet for 3D Object Detection in Car by Using KITTI Benchmark[J]. International Journal of Information Communication Technologies and Human Development (IJICTHD),2018,10(3).
[5]Lin Tsung-Yi,Goyal Priya,Girshick Ross,He Kaiming,Dollar Piotr. Focal Loss for Dense Object Detection.[J]. IEEE transactions on pattern analysis and machine intelligence,2020,42(2).
[6]Long, Jonathan, Evan Shelhamer, and Trevor Darrell. “Fully convolutional networks for semantic segmentation.” Proceedings of the IEEE conference on computer vision and pattern recognition. 2015.
[7]Zhao, Hengshuang, et al. “Icnet for real-time semantic segmentation on high-resolution images.” arXiv preprint arXiv:1704.08545 (2017).
[8]https://github.com/ApolloAuto/apollo
[9]https://github.com/CPFL/Autoware

浅析CV下的无人驾驶技术相关推荐

  1. 无人驾驶系列】光学雷达(LiDAR)在无人驾驶技术中的应用

    无人驾驶汽车的成功涉及高精地图.实时定位以及障碍物检测等多项技术,而这些技术都离不开光学雷达(LiDAR).本文将深入解析光学雷达是如何被广泛应用到无人车的各项技术中.文章首先介绍光学雷达的工作原理, ...

  2. 对于无人驾驶技术(驾驶自动化)L0-L5分级的说明

    通过此文的阅读您将了解: 无人驾驶的基本概念: 无人驾驶的分级标准: 无人驾驶的不同级别定义. 一.什么是无人驾驶 首先说一下无人驾驶的概念,无人驾驶技术就是车辆以自动的方式持续地执行部分或全部动态驾 ...

  3. 无人驾驶技术——无损卡尔曼滤波(UKF)

    文章目录 无损卡尔曼滤波(UKF) UKF Predict 1.选择预测点sigma点 sigma点计算代码实现 添加过程噪声处理 构建噪声扩充矩阵 c++ 2.预测sigma点 预测sigma点方法 ...

  4. 【智能驾驶】最全、最强的无人驾驶技术学习路线

    作者:许小岩   来源:AI脑力波 授权 产业智能官 转载. 近两年,国内外掀起了一场空前的无人驾驶热潮.特斯拉.谷歌.福特.奔驰.丰田.百度.滴滴等众多企业开始研发无人驾驶汽车,甚至不少企业已经计划 ...

  5. 无人驾驶技术架构、方向及技能要求

    目录 一 前言 二 无人驾驶技术架构 2.1 车辆认证平台 2.2 开源硬件平台 2.3 开源软件平台 2.4 云端服务平台 三 无人驾驶软件技术方向 四 无人驾驶软件技能要求 一 前言   之前研究 ...

  6. 无人驾驶技术的7大典型应用场景

    来源 | 数据观综合 无人驾驶风口来临,引得各方资本竞相追逐.据业内预测,2019年到2020年无人驾驶L3(条件自动)级别的汽车将实现量产化,2022年后部分企业将实现L4(高度自动)量产,若要实现 ...

  7. 【每日新闻】三星电子市值跌至全球第18位,落后中国阿里腾讯 | 中国AI领袖人物吴甘沙:无人驾驶技术距离我们已经不再遥远

    每一个企业级的人  都置顶了 中国软件网 中国软件网  为你带来最新鲜的行业干货 小编点评 无人驾驶离我们 已经不再遥远 所以我推荐大家 多了解了解 人工智能 趋势洞察 中国AI领袖人物吴甘沙:无人驾 ...

  8. 计算机控制在无人车中的应用,汽车无人驾驶技术的探讨

    李磊 ◆摘  要:随着科学技术的不断发展和人们消费水平的不断提高,汽车已成为生产生活中不可缺少的交通工具.根据市场供求关系的变化,汽车行业也在不断改进和发展各种技术.其中无人驾驶技术是重要的研究领域. ...

  9. 无人驾驶技术——Radar雷达

    文章目录 Radar传感器 雷达工作原理 雷达的结构 Radar vs Lidar 不同级别自动驾驶中radar的使用数量 L0 无自动化 L1 驾驶支援 L2 部分自动化 L3 有条件自动化 L4 ...

最新文章

  1. 第八章《对象引用、可变性和垃圾回收》(下)
  2. PS学习笔记2-画笔的应用
  3. 为Ubuntu Linux安装Docker CE Edge
  4. MySQL如何删除有外键约束的数据
  5. 闲鱼如何建设技术舆情治理体系 (多图多代码)
  6. amd显卡风扇调节_中端游戏显卡新晋黑马,华硕ROG STRIX RX5600XT O6G GAMING拆解评测...
  7. useradd: cannot open /etc/passwd解决办法记录
  8. 用Free Pascal IDE编写第一个程序Pascal版的hello world
  9. 超感光徕卡电影四摄:华为Mate30系列国内开售
  10. python逻辑回归aic_机器学习算法介绍(附上R和python程序)-第二期
  11. 《学会提问》——批判性思维的思考
  12. Murex 快速风险分析引擎
  13. 锦鲤阅读自动阅读问题解答,小白必看!
  14. windows下gfortran编译error:Note: The following floating-point exceptions are signalling: IEEE_UNDERFLOW
  15. PHP+TP框架实现微信公众号开发之发送模板消息
  16. HTML5-VScode-常用标签的样式以及复合写法
  17. 深入理解时区概念:GMT,UTC,UTS和AOE
  18. 【JavaWeb开发】Referer防盗链的详解
  19. 通过一个Kafka故障解决过程阐述架构师必须具备的架构思维
  20. Tableau 圆柱条形图的两种实现方法

热门文章

  1. 线性代数重要知识点和理论
  2. html冻结页面,按下按钮后HTML页面会冻结
  3. uni-app - 禁用 APP 横屏旋转(用户操作行为)
  4. Alpha、Beta、RC、GA、RTW版本
  5. JS中的DOM与BOM
  6. 【物联网】微信小程序接入阿里云物联网平台
  7. CDA Level1知识点总结之总论
  8. 姜思达和机器人_姜思达爱上人工智能是怎么回事?
  9. 关于整除符号 / 的运用
  10. NumPy 笔记(超级全!收藏√)