标注猿的第57篇原创    

   一个用数据视角看AI世界的标注猿  

前几篇文章从两种数据的角度去学习了基于图片和激光雷达数据的算法,较为通俗的说明了其算法的逻辑,从而为理解其标注数据在使用算法应用时的理论基础。

其实大家会发现一个问题,作为标注员其实在一点都不理解算法的情况,我们依然可以做好数据标注工作,原因很简单,目前人工智能是从结果推方法。我们人本身就是智能体,现在想用另一种方法模拟人这个智能体。

那我们如何更好的做好标注这个事情呢?我认为的问题所在就是应该刚好的理解这个方法的底层逻辑,更好的做拟合。所以如果未来个人想在这个行业上有所发展就一定好了解这些底层逻辑。

言归正传,从本文开始会用几篇文章从场景的角度学习检测识别技术的底层逻

交通识别检测技术

交通标识检测是智能汽车辅助驾驶必须的环节,包括标牌、红绿灯、车道线等。

1.车道线是用来管制和引导交通的一种标线,包括路面上的线条、箭头、文字、标记和轮廓标识

传统基于计算机视觉的车道线检测方法依赖于高度定义话的手工特征提取和启发式的方法,目前主要分为以下两种方法:

  • 基于道路特征的检测方法

    通常依据道路与车道线不同的物理特征的区别来设计特征计算方式,突出道路特征来实现车道线检测。

  • 基于道路模型的检测方法

    即根据不同的道路几何模型(直线模型或曲线模型)实现道路的检测

当前基于深度学习的车道线检测方法,通常将车道线检测视为分割分类问题,利用神经网络代替人工设计的特征。

  1. 基于图像的检测方法

    基于图像的检测方法有LanNet和H-NET,它们将车道线检测问题转换为实例分割问题,即每个车道线均形成一个属于车道线类别的实例。

    对于一张输入的图片,LaneNet负责输出实例分割的结果,每条车道线一个标识ID,H-NET输出一个转换矩阵对车道线像素点进行修正,对于修正后的结果拟合出一个三阶多项式作为预测的车道线。

    尽管CNN具有强大的特征提取能力,但没有充分地探索图像行、列间关系的能力,而这些关系对于学习强先验形状的对象尤为重要。针对这一问题,Spatial CNN(SCNN)将传统卷积的逐层(Layer-by-Layer)连接形式转换为特征图中的逐片(Slice-by-Slice)卷积形式,使图像中像素行列之间可以传递信息,这使得它对于长距离连续形状的目标有很好的检测效果。

  2. 基于激光雷达的检测方法

    基于图像的检测方法存在对光照敏感、依赖完整且较为统一的车道线标识、有效采样点不足以及车道线被水覆盖检测失效问题,因此越来越多的研究者开始思考如何使用激光雷达传感器做车道线检测。

    相对于传统的视觉传感器,激光利达有效距离更远,且可以穿透水面,有效采样点多,基本解决了传统视觉中的大部分问题。

    基于激光雷达进行车道线检测的方法,通过提取激光雷达的集合或物理特征,利用离散数据拟合形成车道线。

    其中,Ibeo激光雷达具有三次回波技术,每个激光返回三个回波,返回的信息可以可靠地还原被检测的物体,同时能够精准分析相关物体的数据,由于路面和车道线材质不同,因此通过分析激光雷达数据能够将路面和车道线区分开来;

    其次还可以通过激光雷达反射强度值来做车道线的检测,从而分离出路面区域与车道线。

    最后,通过最小内方差算法找到路面区域与车道线的分割阈值,利用误差分析原理剔除车道线集合范围内的离群值,提取车道线特征种子点,在通过最小二乘法等拟合算法,拟合车道线。

2.红绿灯控制交通路口的通信效率和安全,是一种机器特殊且重要的交通标识。红绿灯检测即获取红绿灯在图像中的坐标以及类别,这是自动驾驶中的一个关键问题,关系到自动驾驶汽车当前的决策。

由于红绿灯这种小目标在图像中占有少量像素,对于标准神经网络来说,小物体经过多层特征提取层可能仅表现为一个点,细节丢失严重;

因此,针对红绿灯的检测,通常分为两个阶段,首先定位出红绿灯的大概位置,然后采用一定技术对相关区域进行二次的识别。

使特征提取网络更适合小目标检测,大致有如下几种方法:

  1. 图像金字塔

    针对训练图片进行上采样得到多尺度特征,从而增强小目标的细粒度特征,在理论上能够优化小目标检测的定位和识别效果。但是基于图像金字塔的方法对于计算机计算能力和内存都有很高的要求。

  2. 逐层检测

    对于卷积神经网络的每一层输出进行一次预测,最后综合考虑得到结果。但是该方法在浅层神经网络的效果并不好,因为浅层特征并没有充分的语义信息。

  3. 特征金字塔

    参考多尺度特征图的特征信息,同时兼顾了较强的语义特征和位置特征。较大的特征图负责较小物体的检测,而较小的特征图负责较大物体的检测。

  4. 空洞卷积

    利用空洞卷积代替传统卷积,不增加参数数量且不减小特征图大小,保留了更多的细节信息。

上述方法只是通过图像获取红绿灯在图像中的位置,而获取红绿灯坐标,并将红绿灯信号与车道对应起来则需要结合高精度地图。

以上就是本文对复杂场景语义理解-交通识别检测技术的介绍。有感兴趣的小伙伴也可以看《基于5G的智能驾驶技术与应用》一书,是北邮的网络与交换国家重点实验室组编,非常适合小伙伴做基础理解和行业了解为主的学习。

相关文章阅读:

  1. 自动驾驶采标系列一:自动驾驶数据采集资质及采集数据出境的调研分析

  2. 自动驾驶采标系列二:车载感知与车载传感器标定(内附标注猿专属定制新年礼品)

  3. 自动驾驶采标系列三:基于图像的目标检测技术(内附标注猿专属定制新年礼品)

  4. 自动驾驶采标系列四:基于激光雷达的目标检测方法

  5. 自动驾驶采标系列五:图像与激光雷达联合目标检测方法

下一篇文章预告:

《自动驾驶采标系列七:复杂场景语义理解-可行驶区域检测》

-----------------------完---------------------

公众号:AI数据标注猿

知乎:AI数据标注猿

CSDN:AI数据标注猿

微信号:

-----------------------完---------------------

自动驾驶采标系列六:复杂场景语义理解-交通识别检测技术相关推荐

  1. 自动驾驶采标系列七:复杂场景语义理解-可行驶区域检测

        标注猿的第58篇原创        一个用数据视角看AI世界的标注猿   本篇文章我们继续学习自动驾驶采标系列的算法基础理论,关于复杂场景语义理解中的可行驶区域检测部分. 车辆可行驶区域包括结 ...

  2. 自动驾驶采标系列四:基于激光雷达的目标检测方法

        标注猿的第55篇原创        一个用数据视角看AI世界的标注猿   上一篇文章我们讲了基于图像的目标检测技术,但对于标注人员来说这部分内容就相对比较难一些,只是作为一个了解就可以,但是如 ...

  3. 自动驾驶采标系列二:车载感知与车载传感器标定

    上一篇文章对自动驾驶采标问题中的一系列法律问题进行了浅析,接下来自动驾驶采标系列里面会对自动驾驶相关技术和知识点进行进一步梳理,来帮助小伙伴深入的了解自动驾驶的架构逻辑与数据采标工作的关系. 上文中提 ...

  4. 自动驾驶采标系列三:基于图像的目标检测技术

        标注猿的第54篇原创        一个用数据视角看AI世界的标注猿    上一篇文章我们从"环境感知"数据的采集设备上进行了详细说明,已经了解了相应设备采集的数据及采集前 ...

  5. 自动驾驶采标系列一:自动驾驶数据采集资质及采集数据出境的调研分析

        注猿的第52篇原创           一个用数据视角看AI世界的标注猿     各位小伙伴小猿又回来啦,最近由于工作的原因拖更了两个月的时间,很多小伙伴后台留言没有及时回复还请海涵,为了表达 ...

  6. 自动驾驶数据闭环系列之一:理想丰满,现实骨感

    交流群 | 进"传感器群/滑板底盘群/汽车基础软件群/域控制器群"请扫描文末二维码,添加九章小助手,务必备注交流群名称 + 真实姓名 + 公司 + 职位(不备注无法通过好友验证) ...

  7. 【自动驾驶传感器融合系列】02自动驾驶中的多传感器同步理论

    [自动驾驶传感器融合系列]02自动驾驶中的多传感器同步理论 文前白话 1.传感器时空同步概念 2.传感器时间同步 · 时间硬同步 · 时间软同步 3.传感器时空同步 文前白话 同步理论整体架构: 1. ...

  8. 自动驾驶平台,阵营, 主要传感器与场景联系

    自动驾驶平台,阵营, 主要传感器与场景联系 自动驾驶平台和阵营 表1. 自动驾驶平台 表2. 自动驾驶阵营 自动驾驶常用架构 图1. 三层架构 主要传感器与场景联系 超声波+侧向毫米波----泊车 长 ...

  9. 城市场景中自动驾驶车辆基于高精度地图的视觉语义定位

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 来源丨自动驾驶专栏 论文链接:https://ieeexplore.ieee.org/document ...

最新文章

  1. 《实现模式(修订版)》—第1章1.2节那么,现在……
  2. MySQL数据库应用第3章操作数据库
  3. 【GIT 基础篇二】创建版本库与提交
  4. RocketMQ带你快速入门
  5. c语言实现socket转json,C++解析JSON进行网络传输--一个通过JSON方式的socket传输
  6. python调试_Python 调试
  7. HTML5新标签 w3c
  8. 计算与推断思维 六、可视化
  9. SQL Server 轻松解决令你头疼的sa登录
  10. java过滤器应用实例_Servlet过滤器Filter的简单介绍(附示例)
  11. 机器视觉:系统中影响图像质量的因素有哪些?
  12. 在c语言中realloc_C和C ++编程中的realloc()
  13. Java 加密解密之对称加密算法PBE
  14. (三)mybatisPlus自定义Sql语句
  15. MultiDesk 是一个选项卡(TAB标签)方式的远程桌面连接 (Terminal Services Client)。
  16. 银行管理系统(一看就懂)
  17. 联想服务器重装系统后usb无法启动,联想启天装win7系统的详细教程完美解决USB不能用的问题...
  18. 11个LOGO设计灵感网站推荐,帮你提高LOGO设计工作效率
  19. Windows环境下安装Ruby教程
  20. 企业内部即时通讯系统项目总结

热门文章

  1. CocosCreator 发布为网页全屏
  2. 网页全屏显示以及退出全屏,包括单个元素全屏显示
  3. wampserver黄色:80端口被占用
  4. guava 缓存过期策略
  5. 转载--X7R,X5R等电容区别
  6. 【压缩感知】基于matlab压缩感知理论的窄带信号DOA估计【含Matlab源码 2616期】
  7. PHP 时间操作(获取一周前、明天的日期)
  8. 关于“我们无法创建新的分区,也找不到现有分区”的解决方法
  9. 机器学习2.12——过度拟合
  10. UC浏览器打开百度显示 丰臣吉秀.网址