多层前馈结构从大规模数据集学习层次特征,在图像分类识别任务中取得了出色的性能。目前基于 CNN 的车辆识别研究中,在采用端到端模式的识别方法在性能上达到一个瓶颈时,通常会采用 2 种方案提升性能:一种是结合浅层学习知识和深度特征完成分类识别;另一种是将相关的领域知识和浅层学习技术融入到深度网络中,构建一个新的端到端网络结构,从而提升图像分类的精度。

数据集

车辆识别常用公共数据集


Stanford-Cars [51]、CompCar [66]、Vehicle Color [18]

Stanford-Cars 数据集 [51]

是覆盖了多种规格 (轿车、轿跑车、敞篷车、两厢车和货车等)、不同拍摄角度、不同分辨率等变化的细粒度车辆数据集,具体包含了 2 个评测集:一个是超细粒度车辆识别数据集,称为 BMW-10,包含 10 款宝马轿车,共 512 幅图像。另一个是细粒度车辆识别数据集,称为 Car-196,共包含 196 类的车辆,总共有 16185 幅图像。由于涵盖了车辆的不同角度,尺度变化极大,同时还包括了多种规格车型。

浅层学习方法主要以基于局部特征结合不同的特征表达方法为主。随着识别方法的不断改进,提升幅度较小,这说明对于车型的精细识别而言,基于浅层学习的车辆识别方法难以达到理想识别效果。随着端到端模式深度网络的应用,车辆识别算法的精度提升幅度明显升高 (13% 以上)。

传统的浅层学习技术仍具有一定的研究价值,不能因为深度学习的成功而忽视传统领域知识对车辆识别性能的影响。

CompCar [66] 数据集

是目前规模最大、类别最丰富、用于评测车辆精细识别的公开数据集。数据集通过网络和监控设备采集得到车辆图像,其中网络图像共 136726 幅,涵盖了 163 个汽车厂家的 1 716 类车型,监控图像共 44481 幅车辆正面图像,包含 281 类车型。

CompCar 数据集的另一个部分是局部图像子集,包括 123 个厂家的 956 类车型的 27 618 幅局部图像,每类车辆分别包含大灯、尾灯、雾灯、进气口、控制台、方向盘、仪表板、变速杆等 8 个部分的局部图像。

车色的精确识别同样也是车辆识别领域一个重要研究方向,相关的数据集有 NTOU Car Color [65]、Vehicle Color [18]、Sv_Dataset [66] 等。

NTOU Car Color 数据集

包括 7 类颜色,共有 16648 幅不同拍摄角度的车辆图像。

Vehicle Color 数据集包含 15601 幅、8 种颜色的车辆图像。Vehicle Color 数据集中所有图像均来自道路监控拍摄得到的正面图像,同时图像采集环境变化较大 (光照、天气等),数据集中同时存在多种车型,例如卡车、轿车、公交车等。

Com Car 数据集的监控子集 Sv_Dataset 同样可以用来评测车辆颜色识别算法。 Sv_Dataset 数据集包含 44 481 幅车辆图像,包括黑、白、红、黄、蓝、绿、紫、棕、香槟、银共 10 种颜色,其中黑色车辆图像最多,为 14 911 幅,紫色车辆图像最少,为 221 幅。此外,由于监控数据采集的时间跨度较大,导致数据集中图像光照变化明显,因此存在无法进行人工标注颜色的 40 幅车辆图像。

几种方法

基于局部特征

提取底层局部特征 (包括兴趣点检测和密集提取 2 种方式) 进行描述;然后,使用一种特征变换算法对底层特征进行编码 (向量量化、稀疏编码等),经过特征汇聚等操作,从而获得更具区分性、更加鲁棒的特征表达,得到一个紧致的特征向量;最后,选择适当的浅层学习结构学习得到一个分类器 (SVM 等) 完成对车辆的分类识别。

核心是如何有效地对局部特征进行紧凑表达,提升识别性能。

Csurka 等[21] 应用词袋模型 (bag of word, BoW) 解决对局部特征进行紧凑表达的问题。BoW 方法,首先从关键点特征的描述出发,通过学习构建视觉词典;然后,用一个或多个单词来表示局部特征,实现了图像细节信息的良好表达。在 BoW 模型的基础上,Behley 等 [22] 引入不同尺度的图像信息,构建混合 BoW 模型,实现了对车辆细节信息的多尺度表达。与单一的 BoW 模型相比,混合模型识别精度有明显的提升。

BoW 模型将图像表示成无序的局部特征集,这一做法忽略了特征的空间位置信息,降低了特征的区分能力。针对这一问题,Li 等 [23] 提出一种目标银行 (object bank) 的方法,用图像中的目标作为特征,采用空间金字塔 (spatial pyramid matching,SPM) [24] 技术引入空间信息实现对特征的表达。

Felzenszwalb 等 [25] 提出的可变部件模型 (deformable parts model,DPM) 则应用基于目标局部信息进行识别,实现了特征区分能力的提升。Li 等 [26] 延续 DPM 的思想,应用层次性与或图模型自适应地从训练数据中挖掘出具有判别性的上下文模式和遮挡模式,较好地解决了遮挡问题对车辆识别的影响。

三维信息

对二维图像中的车辆进行三维 (three dimensions,3D) 建模获得三维信息,然后通过训练固定的 3D 模型进行车辆识别 [28-31]。

Buch 等 [32] 使用 3D 模型提取运动轮廓并与投影的模型轮廓进行比较以识别车辆的地平面位置和类别,很好地解决了车辆阴影对车辆识别的影响问题。

Leotta 等 [33] 提出的可变形 3D 模型构建方法则有效解决了预先构建的 3D 车辆形状模型与图像的约束对准问题。

3D 建模的方法可以在一定程度上解决视点变化的问题,但是固定不变的 3D 车辆模型往往无法区分其他不同形状的对象。同时,由于特征提取、图像表示和模型匹配等环节会随着模型数量的增加而变得更为复杂,这无疑增加了计算和时间上的开销,对于类别较多的车辆精细识别任务来说实现相对困难。

充分表达车辆类别之间细微的外观变化,使得没有领域知识的人不能容易地识别细粒度模型。

深度特征

与在浅层学习方法中使用手工制作特征相比,CNN 能够使用其多层前馈结构从大规模数据集学习层次特征,在图像分类识别任务中取得了出色的性能。

目前基于 CNN 的车辆识别研究中,在采用端到端模式的识别方法在性能上达到一个瓶颈时,通常会采用 2 种方案提升性能:一种是结合浅层学习知识和深度特征完成分类识别;另一种是将相关的领域知识和浅层学习技术融入到深度网络中,构建一个新的端到端网络结构,从而提升图像分类的精度。

利用 DBM 可以有效地融合特征的优点,不使用原始图像作为模型的输入,而是采用方向梯度直方图 (histogram of oriented gradient, HOG) 等 3 种手工设计特征分别作为深度网络源数据,并使用融合的特征作为深层网络的输入单元。所有 3 个特征向量的融合向量经过多层非线性隐层进行学习,应用线性分类器得到预测的车辆类别结果。

Vehicle Re-Identification 调研 and数据集(未)相关推荐

  1. 动手学深度学习Kaggle:图像分类 (CIFAR-10和Dog Breed Identification), StratifiedShuffleSplit,数据集划分

    目录 CIFAR-10 获取并组织数据集 下载数据集 整理数据集 组织数据集更一般的方式 图像增广 读取数据集 torchvision.datasets.ImageFolder()的特点 定义模型 定 ...

  2. 农业动物相关数据集与算法——调研整理

    家禽疾病诊断 Machine Learning Dataset for Poultry Diseases Diagnostics 中小型家禽养殖者的家禽疾病诊断注释数据集由家禽粪便图像组成.这些家禽粪 ...

  3. Python和VizViewer进行自动驾驶数据集可视化

    探索Lyft预测数据集与一个新的可视化工具包 (本篇文章动图超过了CSDN上传限制无法上传,所以请访问原文地址或关注我们的同名公众号deephub-imba查看) 介绍 作为最近发表的论文和Kaggl ...

  4. DENSE 数据集 - STF 数据集(CVPR 2020)

    DENSE 数据集 - STF 数据集 - Seeing Through Fog Without Seeing Fog: Deep Multimodal Sensor Fusion in Unseen ...

  5. csp2020 j2民间数据下载_摊开母婴市场数据集看一看

    本文从数据分析的角度看一下母婴市场的一些数据.在手的数据集从天池上下载,关于国内淘宝母婴产品的销售情况,下载链接:https://tianchi.aliyun.com/dataset/dataDeta ...

  6. 基于Jupyter Notebook---卷积神经网络的图像分类(keras对猫狗图像数据集进行分类)

    keras对猫狗图像数据集进行分类 一.安装Keras 二.keras对猫狗图像数据集进行分类 三.全部代码 四.结果显示 一.安装Keras 在windows下,首先添加中科大源 命令行中直接使用以 ...

  7. 将数据集转换为Excel格式的一个实现

    { 将数据集转换为Excel格式的一个实现 在做项目时,很多情况下,客户需要对我们保存在数据库中的数据再加工再利用, 如财务需要一份今年财务情况的电子报表,总经理需要今年销售情况的一个电子报表. 我们 ...

  8. [调研] 人脸/车牌脱敏 调研

    人脸/车牌脱敏 调研 人脸/车牌脱敏 调研 动机 数据集 方案 人脸检测 车牌检测 相关论文 问题 人脸/车牌脱敏 调研 动机 脱敏的概念:将图片中的敏感信息(车牌.人脸)进行遮挡 流程: 数据集 专 ...

  9. 个人整理的数据集(手写中文数据、发票数据、快递单数据、车牌数据)

    本人在工作生活中收集了各个方面比较多的真实的数据集如下: 一.手写中文数据集 1.档案类数据: 此数据集为手写档案数据,数量较大,大约128G,图像均未标注.ex: 2.手写作文数据: 此数据集为手写 ...

最新文章

  1. 第4章 DHCP服务
  2. 智能小车设计指导 第二版
  3. CSP认证201604-3 路径解析[C++题解]:字符串处理、模拟、vector切分字符串
  4. python oa系统_用python把C#操作OA的例子重写了一下
  5. FPGA实现低高速接口更新说明
  6. Android自定义控件之虚线的用法
  7. axios token失效刷新token怎么重新请求_Token 刷新并发处理解决方案
  8. zufeoj_1257: 神风堂人数 VIJOS-P1041
  9. 网易126免费邮箱更改手机号(亲测有效)
  10. 贪心科技机器学习训练营(九)
  11. 主打产品“火力不足”致使发行人持续盈利能力下降,这公司创业板IPO被终止
  12. 黑色的计算机英语造句,黑色英语怎么写
  13. 常见TCP/IP、HTTP协议以及三次握手和四次挥手
  14. 【python安装】错误——“User installations are disabled via policy on the machine”
  15. linux主机挂软件,推荐Linux服务器面板宝塔软件
  16. 华为OD机试真题 Python 实现【检测热点字符】【2023 Q1 | 100分】
  17. 汽车在十字路口左转时,转大弯和转小弯是什么意思?
  18. centos不能复制文件到usr/local/src下的问题,权限不够;以及找不到usr/local/src的问题
  19. css总结 -使用display:inline-block,出现元素高度错位
  20. 美国大厂新员工薪资曝光! 微软最高近30万美元,TikTok低至时薪30美元

热门文章

  1. Virtual Serial Port Driver PRO使用
  2. PHP“动能”运动膳食微信小程序的开发 计算机毕业设计源码504978
  3. 双冒号(::)和单冒号(:)在 C++ 中的含义和作用
  4. linux linux硬盘对拷,,分区对拷
  5. springboot实现批量删除
  6. 人工智能、机器学习和深度学习的区别
  7. 计算正方形长方形圆形的周长面积
  8. PySpark | SparkSQL函数 | SparkSQL运行流程
  9. 凡人善举引领文明之风 山西介休举行“好人”颁奖典礼
  10. 修复“勒索漏洞”,“想哭漏洞”,“445端口漏洞”,修复微软“KB4012212”补丁的一些办法