导读:自然场景中交通标志牌图像识别的关键技术主要分为检测和识别两大类。其中,为了对目标图像进行准确识别,标志牌感兴趣区域的检测是首先要解决的问题。近年来,交通标志牌检测技术已经成为智能驾驶公交车辆视觉导航系统和计算机视觉领域的热点之一[1-2]。

本文将探讨基于视觉协同显著性的交通标志牌检测框架设计。

作者:余伶俐 周开军 陈白帆

来源:大数据DT(ID:hzdashuju)

大多数传统的交通标志牌检测算法常常是基于任务驱动的,如依赖颜色、形状以及机器学习。目前,这些算法针对的应用场景往往局限于结构化或半结构的环境,如高速公路等。

如今,随着生物神经元的发展以及大脑视觉皮层中信息处理机制的揭示,基于选择性注意机制的视觉显著性目标检测逐渐引起人们的关注[3-5]。

正如我们所知道的,人类在对一幅场景图像进行观察时,会毫不费力地将注意力聚焦在特定的目标或区域上。而这些目标或区域经常具有显著的视觉特征,如边缘轮廓、细节纹理、梯度方向、颜色强度以及空间位置等。

受此启发,本文提出一种基于视觉协同显著性的交通标志牌检测算法,这是目前较有前景的解决办法。

协同显著性的目标是从多幅输入图像中提取共同的显著性前景目标[6-7]。在本章主要面向复杂场景中的多幅交通标志牌图像进行检测。其中,为满足协同显著性检测,输入图像需要满足以下两个要求:

  1. 遵循人类视觉感知机制,单幅图像中可视化的目标区域能够明显与背景区分开来;

  2. 多幅图像中的协同显著性目标彼此具有相似性。

研究一种复杂场景中基于视觉协同显著性的交通标志牌检测算法,总体框架如图2-1所示。其检测过程涉及两个阶段:

在第一阶段,构建一个基于聚类的协同显著性模型,旨在检测多图像中重复出现的同一或近似的视觉显著性物体,其结果由协同显著图获得。其中,协同显著图由图间显著图和图内显著图融合而成。本阶段是一种bottom-up(自底向上)的视觉处理过程,根据图像底层特征分割出区别度最大的显著性目标。

在第二阶段,一个top-down(自顶向下)的几何结构约束模型被提出。目的是对检测出的显著性目标做自顶向下的几何结构约束分析,从而准确定位交通标志牌的ROI区域。

▲图2-1 基于视觉协同显著性的交通标志牌检测总体框架

01 基于聚类的图间/图内显著性检测模型子框架

构建基于聚类的协同显著性模型以得到协同显著图。其中关键是通过聚类进行图间关联性约束分析和图内关联性约束分析,使之分别生成图间协同显著图和图内显著图,其框架设计如图2-2所示。

▲图2-2 基于聚类的无监督约束子框架

依据bottom-up视觉注意力线索—分别为对比度线索、中心偏移度线索和对称性线索,对输入图像集进行聚类级别的显著性度量。将3个视觉注意力线索权值进行高斯归一化处理后,利用乘积融合为整体显著性图。最后采用概率框架软分配的方式平滑每个像素的显著性测度值,得到聚类级的图间/图内显著图。

采用的聚类算法为Kmeans++,这是一种无监督聚类算法,可以直观地划分出图像内与图像间的关联性区域。需要注意,聚类个数的选取是人为设定的。本文凭借实验对象和实验效果对聚类数目设置经验值,其中单幅图像内的聚类个数为6,多幅图像间的聚类个数为,其中,M表示输入图像的数目。

图2-3分别提供了单幅图像内的聚类和多幅图像间的聚类效果,可以看出Kmeans++实现了图像内的局部不变性约束和图像间的全局一致性约束。

▲图2-3 单幅图像内与多幅图像间的聚类效果图

02 几何结构约束模型子框架

总体上说,单纯依靠自底向上的显著性线索虽然能够将显著目标突显出来,但却很难移除一些干扰物的影响。这是由于在第一阶段寻找区别度最大的显著性区域或目标进行简单融合计算时,这些干扰物往往也会被赋予较高的显著度,从而对后续分析造成极大干扰。

人类的视觉系统对事物的感知是一个和外界环境交互的过程,既和自底向上数据驱动有关,也和自顶向下任务驱动有关。

因此,构建了一种几何结构约束模型,对检测出的交通标志牌协同显著图作自顶向下的几何约束。本文主要对日常生活中应用最广泛的圆形和三角形交通标志牌进行研究。即通过圆度和三角形检测模型判别每个场景目标所属类别,最后定位含有标志牌的ROI区域,如图2-4所示。

▲图2-4 几何结构约束模型子框架

关于作者:余伶俐,中南大学人工智能系副教授,主持多项国家重点研发计划子任务、湖南省科技重大专项子课题、国家自然科学基金等项目。承担了两期的中车时代电动汽车“智能驾驶决策与控制系统”开发,在湖南湘江新区与智慧公交示范运营线路上完成了3500 km测试,获得了湖南省颁发的第一辆智能驾驶公交车牌照。

周开军,湖南工商大学教授、硕士生导师,美国布兰戴斯大学国家复杂系统研究中心访问学者,湖南省青年骨干教师,湖南工商大学151人才。

陈白帆,中南大学副教授,硕士生导师,湖南省人工智能学会副秘书长,湖南省自兴人工智能研究院副院长,长期从事智能驾驶、移动机器人等应用理论研究。先后主持国家自然科学基金项目、湖南省自然科学基金项目,参与国家自然科学基金重大计划、国家重点研发计划、湖南省科技重大专项子课题。

本文摘编自《智能驾驶技术:路径规划与导航控制》,经出版方授权发布。

延伸阅读《智能驾驶技术:路径规划与导航控制》

点击上图了解及购买

转载请联系微信:DoctorData

推荐语:高等院校智能科学与技术、自动化、人工智能等专业研究生或高年级本科生的专业基础课程教材,亦可供广大从事人工智能、智能驾驶、决策规划、导航控制领域的科技工作者阅读和思考。

划重点????

干货直达????

  • 吐血整理:机器学习的30个基本概念,都在这里了(手绘图解)

  • 离婚冷静期能拯救婚姻吗?37秒视频看2001-2019各地离婚排行

  • 什么是脏数据?怎样用箱形图分析异常值?终于有人讲明白了

  • 月薪15k起,想进入这个行业有哪些书值得读?

更多精彩????

在公众号对话框输入以下关键词

查看更多优质内容!

PPT | 读书 | 书单 | 硬核 | 干货 

大数据 | 揭秘 | Python | 可视化

AI | 人工智能 | 5G | 中台

机器学习 | 深度学习 | 神经网络

合伙人 1024 | 大神 | 数学

据统计,99%的大咖都完成了这个神操作

????

智能驾驶系统是怎样看懂交通标志的?3张流程图给你讲明白相关推荐

  1. 地平线:面向规模化量产的智能驾驶系统和软件开发

    导读 7月27日,地平线在智东西公开课开设的「地平线自动驾驶技术专场」第3讲顺利完结,地平线智能驾驶应用软件部负责人宋巍围绕 <面向规模化量产的智能驾驶系统和软件开发>这一主题进行了直播讲 ...

  2. 摄像头图像分析目标物体大小位置_对智能驾驶系统三种环境传感器布局的冗余关系分析...

    " 目前的自动驾驶汽车需要三类传感器,第一类是IMU传感器.第二类是摄像头.毫米波雷达.激光雷达这类感知传感器.第三类是V2X这类超视距的特殊传感器.惯性测量单元的功能毫无疑问,是测量物体三 ...

  3. 智能驾驶系统简介和测试要点分析

    智能驾驶系统是一种能够自主感知.决策和执行行驶任务的车辆控制系统.常见的智能驾驶系统包括: 自动泊车系统:能够自动控制车辆完成泊车过程,包括寻找车位.转向.加速.制动等操作. 自适应巡航系统:能够根据 ...

  4. 封闭已久的智能驾驶系统,在云栖大会上,被敲开一个裂缝

    贾浩楠 发自 凹非寺 量子位 报道 | 公众号 QbitAI 智能驾驶操作系统,最底层但又最重要. 它是一个完整车载系统最关键的核心,也是下一代智能车心脏,芯片和智能驾驶算法应用,全靠它连接. 全球的 ...

  5. 小白也能看懂的网络基础 | 44 张图搞定什么是连接设备?

    公众号关注"程序IT圈", 选择"星标",重磅干货,第一时间送达! 引言 欢迎来到网络世界,<小白也能看懂的网络基础>系列文章会从零开始帮助你构建网 ...

  6. 看懂需要勇气,33张人性图!

    1.按别人的指引,盲目的前进,可能会一步踏空,摔得惨痛. 2.每一张笑容背后,隐藏的是什么?难道真的是没有永恒的朋友,只有永恒的利益? 3.老师说,每个人的起跑线都是一样的,看了这幅图之后,我终于明白 ...

  7. 认知智能中国原生智能科技体系 一文看懂认知智能 道翰天琼认知智能奠基者领导者

  8. 【无标题】认知智能中国原生智能科技体系 一文看懂认知智能 道翰天琼认知智能奠基者领导者

  9. 程序员才能看懂,看到第18张终于忍不住笑喷了。

    1 在生产环境发布hotfix 2 新手码工 第一次做项目的过程 3 0错误代码编译通过 4 当程序员以为这是最后一个Bug,改完就可以去吃饭时- 5 精简代码 vs 冗余代码 6 管理员给了程序员r ...

最新文章

  1. 鸿蒙系统能内测吗,鸿蒙系统内测用户:使用体验已经超越ios
  2. Kubernetes 最佳安全实践指南
  3. python中并发编程基础1
  4. context:component-scan/和mvc:annotation-driven/的区别
  5. 三个变量互换值_Python3 教程 变量类型
  6. 吸气剂/设定者。 邪恶。 期。
  7. 【ZOJ - 2972】Hurdles of 110m (dp)
  8. spring boot 分布式锁组件 spring-boot-klock-starter
  9. 【Pytorch神经网络理论篇】 09 神经网络模块中的损失函数
  10. MYSQL的replace into
  11. 用Appscan 作代理,录制APP页面的限制条件
  12. python中的类装饰器应用场景_python中的装饰器常用于哪些应用场景
  13. [翻译]MVP(SC),MVP(PV),PM,MVVM 和 MVC 表现模式架构对比
  14. SENDMAIL引发的血案
  15. python 高斯过程_【Scikit-Learn 中文文档】高斯过程 - 监督学习 - 用户指南 | ApacheCN...
  16. 【Android 】零基础到飞升 | Service初涉
  17. Go 限流器 limter
  18. ssl证书是什么,ssl证书有什么作用
  19. VSCode 如何设置启动时打开上次关闭时在编辑的文件
  20. 【二维码】二维码生成

热门文章

  1. Spring Boot笔记-echarts的使用及数据的修改
  2. 初中数学抽象教学的案例_初中八年级数学上册教学视频汇总
  3. css按钮居中_你不一定知道的CSS最小和最大(宽度/高度)知识点及优缺点
  4. Python打包 pyinstaller
  5. 分拣外观残缺的机器人_一款分拣搬运机器人的设计
  6. python中小数_比较python中的小数
  7. Ubuntu关于apt-get remove与apt-get purge
  8. Python爬虫之pyppeteer的使用(爬虫、获取cookie、截屏插件、防爬绕过)
  9. python3单例模式
  10. 35. 脱壳篇-UPX和WinUpack压缩壳的使用和脱法