上一部分说完了常见的传感器硬件,接下来说传感器的软件方面方面。

本部分主要分为两部分:1.计算机视觉与神经网络;2.感知应用(纯视觉部分)

目录

1.计算机视觉与神经网络

2.感知应用(纯视觉部分)

2.1纯视觉方案(YOLO,SSD等)


1.计算机视觉与神经网络

计算机视觉(CV)大家都不陌生,是近来发展迅速的科学之一。其内容包含了对于视觉信息的获取、传输、处理、存储及处理与理解。

边缘常常发生于图像的一阶微分最大值、二阶微分为零,但往往由于噪声影响,我们一般显示去掉高频的噪声,再进行处理。我们常用的离散信号差分滤波卷积核常用到Robert算子、Prewitt算子、Sobel算子、拉普拉斯算子等等。

对于分割任务,有基于阈值的分割、基于区域的分割、基于边缘检测的分割、基于深度模型的分割等等。这里就不再展开。

计算机视觉在自动驾驶领域中有着多种多样的应用,例如双目多目相机的深度获取及驾驶员状态监测、点云的处理、对交通参与者的识别、跟踪与运动估计、信号灯检测、可行驶区域检测、高清地图绘制等等。

本部分主要介绍深度学习中的神经网络方法,自从2012年AlexNet在图像领域的成功,卷积神经网络得到我们的重视。(卷积与互相关区别仅为卷积核是否翻转,所以卷积也有反映相关性的作用,从而提取特征)

本部分涉及

激活函数:常用激活函数(激励函数)理解与总结_tyhj_sf的博客-CSDN博客_激活函数

网络结构:11种主要神经网络结构图解_喜欢打酱油的老鸟的博客-CSDN博客_神经网络结构图

正向逆向传播:神经网络正向与反向传播_小小小~的博客-CSDN博客_神经网络正向传播和反向传播

损失函数:神经网络损失函数汇总_猿代码_xiao的博客-CSDN博客_神经网络常用的损失函数

最经典的几个卷积神经网络:

Vgg16(2014年):创新点在于深度更深,使用3*3卷积核代替5*5甚至7*7卷积核,引入了更强的非线性;

GoogleNet:最出名的就是其中的Inception结构(inception也是盗梦空间电影名字),首次说明了1*1卷积核的作用, 特征抽取,降维(filter对应的channel)还用于修正线性激活(ReLU),使用了特征拼接,并加入了两个辅助分类器帮助克服梯度消失问题,使得网络更深。

ResNet(2015):意义重大的网络,加入了残差结构的bottleneck,缓解了梯度消失的问题,使得网络可以更深(1000层以上)、不像之前网络中使用DropOut而使用BN来正则化。

DenseNet(2017):不再是加深网络和加宽网络结构(Inception),而是通过特征密集单元混,每一层输入都是上一层的输出的拼接,效果好但是对于内存要求高很多。

SENet:Squeeze操作压缩为实数(宽度为channel)再通过excitation生成不同的权重,再经过Scale缩放,完成在通道上原始特征的重标定,建立了特征通道之间的联系。

2.感知应用(纯视觉部分)

我们之前提到过,感知应用在目标检测、可行驶区域、车道线、红绿灯检测等等。本部分我们主要使用深度学习工具。

2.1纯视觉方案(YOLO,SSD等)

由于RCNN的提出Region Proposal,提取候选区,再对候选区进行特征提取,使用简单的AlexNet进行fine-tuning特征学习,最后通过SVM输出结果(SVM效果更好,比softmax更好),这是经典的2stage方法。缺点就是速度慢,不能做到实时处理。因为部署原因一般要求我们要能够实时处理,所以这里只分享两种经典的1stage网络。

先来说YOLOv1,发布于2016年,是典型的1stage算法,它分为检测和训练两个部分,其中将目标的detection问题转化为回归问题解决。

将输入的图像先进行resize,划分成s*s的grid cell经过神经网络,得到物体种类的bbox的排列,通过NMS,只显示全概率最大的检测结果。(对于每一个grid cell 只有n个bbox是确定的)

对于结果的预测一般评价指标是依赖于Pascal VOC(20类)和COCO(80类)的。

其网络设计如下:

首先就是把图像resize成448*488,包含了24层卷积特征提取层和2层FC层,最终回归得到7*7*30的tensor。

其中7*7就是grid cell对应的大小,30包含的信息为:对于VOC20种分别有confidence、x、y、w、h即bbox的位置和大小共五个。还有二十种目标对应的条件概率。因为这里一个grid cell只产生两个bbox,所以一共是5*2+20=30维度。

所以若如论文中分割为7*7 grid cell的话,会产生7*7*30的输出。而对于每一个7*7中我们采用NMS(从输出的左侧看)提取出每个grid中最可能的结果。

其损失函数定义为:

第一项是负检测bbox中心点(x,y)误差,第二项是检测宽高(w,h)定位误差,其中加根号的原因是为了使得小框也敏感,第三四项代表了回归置信度误差,分为正样本和负样本两项,负责检测物体的bbox和不负责检测物体的bbox;第五项则代表检测物体的grid cell分类误差。

YOLO相比RCNN,最明显的是速度较快,而对比RCNN它遍历了所有图像区域而非提取某感性兴趣区域,所以其迁移能力很好,但由于每个框只能检测一种物体,对于小而密集的物体效果会很差,从上图中也能看出,YOLO对于背景的错误率要比RCNN要好很多,得益于它遍历图像的全部。

YOLO加上Fast —RCNN取得了很好的效果。

YOLO在原作者下又迭代了两个版本,由于不愿意被用于军事监控等用途,不再更新,目前YOLO已迭代到第七个版本(声称),目前公认较为完善的是v5版本,

v6版本是由美团最近发布的,感兴趣可以看看我的这篇文章:

【全网最详细yolov6】yoloV6调试记录(含训练自己的数据集及常见报错及解决方法)--持续更新ing_MendozaG的博客-CSDN博客_yolov6本文手把手教你如何调试最新的yolov6,复现运行COCO2017及训练自己的数据集,目前该项目刚发布,BUG会比较多,调起来一般不会那么顺利,本文含windows+ubuntu,并给出了一些常见问题和解决方法:目录1.项目简介2.注意和推荐3.项目配置(含COCO数据集配置)4.训练自己的数据:5.踩坑小记与解决方法:6.自己训练的尝试和tips(供大家参考)最近由美团发布了yoloV6,声称达到了如下的效果: 其中YOLOv6-nano在COCO val2017数据集上达到了35.0 mAP......https://blog.csdn.net/m0_46611008/article/details/125491850?spm=1001.2014.3001.5501

接下来介绍SSD算法(Single SHOT Multibox Detection)

不同于YOLO,SSD将每次卷积得到的特征图都进行检测,最终采用卷积层做检测并且采用了不同尺度比例的候选框。下图是不同尺度的feature maps。猫猫小使用更精细的grid cell,狗狗大采用大的grid cell,有scale关系。(值得注意的是对于VOC一共有21类置信度,是因为加入了背景)

输入需要缩放至300*300,采用修剪的vgg16 backbone。1*1卷积层和3*3卷积层的使用。

下面这种流程会更清晰一些:

不同特征层default box的scale和aspect:

会生成8732个的default box。

Loss function:

第二项定位损失的loss(与Faster RCNN一样):

第一项的confidence的loss是多类别的softmax loss:

在PASCAL VOC2017测试集的结果:

为什么SSD性能更好,作者用控制变量进行测试:

可以看出数据增强是最为关键的影响指标。

速度测试:(batch size 8 using Titan X and cuDNN v4 with Intel Xeon E5-2667v3@3.20GHz.)

自动(智能)驾驶系列|(二)环境感知与识别(1)相关推荐

  1. 自动驾驶系列(二) - 路径规划五种算法简述及对比

  2. java多因子认证,Milvus 实战|生物多因子认证系列 (二):人脸识别

    视觉 AI 作为一个已经发展成熟的技术领域,具有丰富的应用场景和商业化价值,全球 40% 的 AI 企业都集中在视觉 AI 领域.近年来,视觉 AI 除了在智能手机.智能汽车.智慧安防等典型行业中发挥 ...

  3. 李德毅院士:基于驾驶脑的智能驾驶车辆硬件平台架构

    来源:中国工程院院刊 转自:智车科技 导 读:  智能驾驶车辆试验平台是人工智能科学.认知科学.控制科学等多个学科领域的最新理论与实践的成果,也是研究智能驾驶理论与技术的基础.不同智能驾驶试验平台的传 ...

  4. 前沿研究丨基于驾驶脑的智能驾驶车辆硬件平台架构

    本文选自中国工程院院刊<Engineering>2018年第4期 作者:李德毅,高洪波 来源:A Hardware Platform Framework for an Intelligen ...

  5. 前沿研究丨李德毅院士:基于驾驶脑的智能驾驶车辆硬件平台架构

    2020-09-05 20:31:00 导读 智能驾驶车辆试验平台是人工智能科学.认知科学.控制科学等多个学科领域的最新理论与实践的成果,也是研究智能驾驶理论与技术的基础.不同智能驾驶试验平台的传感器 ...

  6. 智能驾驶仿真场景构建技术

    随着汽车智能化程度的不断提高,智能汽车通过环境传感器与周边行驶环境的信息交互与互联更为密切,需应对的行驶环境状况也越来越复杂,包括行驶道路.周边交通和气象条件等诸多因素,具有较强的不确定性.难以重复. ...

  7. 自动驾驶采标系列二:车载感知与车载传感器标定

    上一篇文章对自动驾驶采标问题中的一系列法律问题进行了浅析,接下来自动驾驶采标系列里面会对自动驾驶相关技术和知识点进行进一步梳理,来帮助小伙伴深入的了解自动驾驶的架构逻辑与数据采标工作的关系. 上文中提 ...

  8. 书评学习笔记《自动驾驶汽车环境感知》

    随笔 我读这本书是希望能对自动驾驶感知有一个框架式的了解. 优点: 专门介绍感知的书很少,这本书填补了这一块空白.做到了对感知有一个全方位的介绍.追求更详细的感觉可以直接看论文. 编排结构合理. 成书 ...

  9. MATLAB算法实战应用案例精讲-【自动驾驶】环境感知

    目录 前言 几个高频面试题目 L4级自动驾驶中的环境感知传感器有哪些?他们的功能有何区别呢?

最新文章

  1. 中小学计算机报名网址,小学网上报名系统_小学网上在线报名解决方案_海之睿报名系统...
  2. vim编辑器高级应用
  3. 数据结构学习-带头结点的单链表就地逆置
  4. [物理学与PDEs]第2章第2节 粘性流体力学方程组 2.6 一维粘性热传导流体动力学方程组...
  5. 张一鸣在字节跳动7周年庆典上的演讲
  6. 致远SPM之金蝶K3集成解决方案
  7. wxWidgets+wxSmith版电子词典
  8. 软媒时间---任务栏滚动工具
  9. deepnode软件下载地址_天正软件全套安装包下载地址
  10. Paragon ntfs2022轻松让mac读写NTFS格式磁盘移动硬盘U盘
  11. 2016年软件评测师真题精选
  12. Excel表格数据如何批量乘以一个数字
  13. 《计算机工程》投稿过程
  14. Python实现分布式服务器部署维护
  15. 图像相似度匹配——距离大全
  16. Power BI----认识Power BI
  17. 更多有效反链推广 增加反向链接十个方法
  18. 数据结构课设之校园导航系统(迪杰斯特拉算法)
  19. 敢达java_Java-Junit 的Hello world
  20. 单相PWM逆变器的建模-非常基础的建模文章 讲的也很细致

热门文章

  1. 抵制知网、爱思唯尔,学界苦出版商久矣?
  2. Noah Mt4跟单系统制作第六篇 Mt4TradeApi交易事件篇
  3. java2019常见面试题集总结
  4. SpringCloud SpringBoot b2b2c 微服务 多商家入驻直播商城之Docker 架构
  5. Android自由式模式,自由式跑酷运动
  6. Python 爬虫实战 汽车某家(四) 车型配置
  7. 计算机应用网上购物摘要,计算机应用软件毕业设计 --网上购物商城.doc
  8. java工作流 表设计_Java工作流系统jflow从表功能介绍一
  9. 装备制造业精益化管理的应用
  10. 编程求a+aa+aaa+aa…a(n个a)之和