Spatial-Temporal Map Vehicle Trajectory Detection Using Dynamic Mode Decomposition and Res-UNet+ Neural Networks.

0 摘要

本文提出的方法，用于从高角度交通摄像机中提取车辆轨迹。

动态模式分解 (DMD) 方法通过将空间时间图 (STMap) 分解为稀疏前景和低秩背景来提取车辆线。通过采用两种流行的深度学习架构，为语义分割任务设计了一个名为 Res-UNet+ 的深度神经网络。 Res-UNet+ 神经网络显着提高了基于 STMap 的车辆检测性能，DMD 模型为理解 STMap 保存的底层时空结构的演变提供了许多有趣的见解。

模型输出与之前的图像处理模型和主流语义分割深度神经网络进行了比较。经过全面评估，该模型被证明是准确和稳健的，可应对许多具有挑战性的因素。最后但同样重要的是，本文从根本上解决了 NGSIM 轨迹数据中发现的许多质量问题。发布清理后的高质量轨迹数据，以支持未来关于交通流和微观车辆控制的理论和建模研究。该方法是基于视频的轨迹提取的可靠解决方案，具有广泛的适用性。

1 introduction

视频传感器已广泛用于提取车辆轨迹数据，以支持学术研究、交通运营、管理和设计。最具影响力的基于视频的轨迹数据集之一是下一代模拟 (NGSIM) 轨迹数据集 [1]，它通过揭示微观交通特征显着推动了交通流和建模研究。正如[2]所强调的，尽管基于视频的轨迹数据极大地改进了模型的类型和模型的校准/训练，但对高质量、高分辨率的轨迹数据仍然存在大量需求。从交通摄像机中以令人满意的精度收集有用的轨迹数据是一项非常具有挑战性的任务。传统的轨迹提取范式包含多阶段算法，容易受到天气、光照、视频质量和其他因素的影响。车辆轨迹数据集通常需要大量的后处理工作，例如清理和验证。

为了解决NGSIM数据集中的数据质量问题，满足交通流和建模研究的需要，本文提出了一种机器学习增强扫描线方法从时空地图（STMap）中检测轨迹。 动态模式分解 (DMD) 用于通过将 STMap 分解为不同的底层结构来分析它。 DMD 结果用于为新的深度神经网络预处理和准备训练数据。 利用两种现有的卷积神经网络架构来构建用于 STMap 分割任务的 Res-UNet+ 模型。该方法在很大程度上改进了车辆检测的扫描线算法，简化了高保真轨迹数据采集。

此外，本文还提供了一种通过在静态 STMap 上显示车辆运动来验证提取的车辆轨迹的有效方法。先前的轨迹验证过程依赖于通过将原始视频上的检测和跟踪结果可视化的直接方法，或通过针对原始轨迹和重建轨迹校准微观模型并比较两个校准模型中哪个更好的间接方法。然而，时空图允许以最小的努力直接识别单个车辆的错误。

2 相关工作

2.1 高分辨率的车辆轨迹数据集

本节回顾了三个重要的高分辨率车辆轨迹数据集及其处理方法。

2.1.1 NGSIM

NGSIM 轨迹数据集是交通研究界的一项重要资产，由从高层建筑拍摄的交通视频生成。 NGSIM 应用基于外观的车辆检测算法从图像中提取线段并将其与 3D 车辆模型进行匹配。检测到的车辆根据它们在摄像头图像中的外观进行跟踪。

NGSIM 数据集已被用于校准和评估交通流模型中的真实数据，展示驾驶行为或交通现象，以及进行交通状态估计和预测 [3][4]。

然而，越来越多的文献揭示了 NGSIM 数据集中潜在的系统错误。一些研究 [5][6][7][8][9] 研究了性能问题并提出了基于统计分布、过滤和平滑、交通通知约束和信息论的去噪方法 [10]。

2.1.2 HighD & inD 数据

Krajewski 等人 [11] 发布了一个 HighD 数据集，该数据集由无人机在德国高速公路上收集的 110,500 辆车辆组成。

同一组发布了包含行人、骑自行车的人、货车等的交叉路口道路使用者的 inD 轨迹数据集。

用于生成 HighD 数据集的对象检测算法是 U-Net 语义分割算法。

2.1.3 pNEUMA

与高速公路车辆轨迹数据集相比，Barmpounakis 和 Geroliminis [12] 提出了一个完整的城市数据集，该数据集是从名为 pNEUMA（使用航拍镜头的城市交通监测新时代）的大量无人机中收集的。他们的项目是使用商业流量平台进行的[13]。

该数据集在使用 10 架无人机的多模式交通环境下覆盖了 100 多公里车道和约 100 个十字路口的拥堵区域。原始 pNEUMA 数据集不包含车道信息，这需要用户应用额外的车道识别方法。

2.2 交通录像分析中的CV算法

交通检测是计算机视觉中目标检测问题的一部分。近年来，随着深度学习的兴起，取得了长足的进步。对象检测不仅涉及识别目标类中的对象，还涉及精确定位每个对象。

表 1 是与交通检测相关的计算机视觉技术的总结，可分为五个主要类别，包括基于形状的方法[14][15][16]、背景/前景建模[17][18][19] 、深度学习模型[20][21][22][23]、基于特征的模型[24][25]和扫描线方法[26][27]。

语义分割是与交通视频分析相关的另一项计算机视觉任务，它预测每个图像的像素级别的类别标签。挑战在于类标签的像素级精度和多尺度上下文信息的要求[28]。

语义分割已用于许多应用：自动驾驶汽车、虚拟和增强现实、生物医学图像分割等。

许多分割模型建立在流行的神经网络之上，例如 AlexNet [29]、VGG-16 [30]、GoogLeNet [31] 和 ResNet [32]。

U-Net 于 2015 年首次被提出作为一种语义分割方法来处理生物医学图像 [33]。原始的 vanilla U-Net 具有许多相似 U 形架构的变体，从而产生了一系列模型，如 U-Net 模型家族。

多目标跟踪 (MOT) 对于计算机视觉中的许多应用至关重要，并且已被广泛研究。

目标跟踪方法可以分为两种类型：在线跟踪和离线跟踪。在线跟踪仅使用当前和以前的帧。长期运动被嵌入到状态空间中以供记忆[34-36]。离线跟踪基于使用所需对象的时间序列信息集合的全局优化算法[37-39]。

最近的深度学习方法获得了巨大的动力并成功地提高了 MOT 的性能，包括 Siamese Networks、Attention and Transformer 和 Recurrent Neural Networks [40-43]。其他一些实践考虑了基于数据关联或机器学习模型的数学公式中的跟踪问题，以提取用于聚类的轨迹特征[44-46]。

2.3 扫描线方法 scanline

扫描线方法源于计算机视觉文献中使用的时空切片（STS）。STS 方法被用于物体和行人检测[49][50]。在交通研究中，该技术被称为扫描线法（scanline），它是一组像素，可以从视频图像中捕捉用户选择的道路上的物体运动。 在连续帧上将扫描线像素堆叠在一起后，就获得了时空图（STMap）。在 STMap 上，横轴表示时间进程，纵轴包含距离信息。

在交通检测中使用两种类型的扫描线，横向和纵向扫描线。横向扫描线是横穿车道的横截面扫描线，而纵向扫描线是沿着交通方向的。 横向扫描线法主要用于交通计数 [51] 和速度测量 [52]。纵向扫描线法用于车辆跟踪[53][54]和检测[55]。然而，大多数以前的扫描线方法仅用于估计宏观参数，例如交通量、车头时距和点速度。

2.4 动态模式分解 DMD dynamic mode decomposition

动态模式分解是一种数据驱动的分析方法，它集成了傅里叶变换和奇异值分解 (SVD)。

DMD 方法对时空相干结构进行特征分解 [59]，因此可以有效地降低复杂系统的维数而不会失去准确性 [60]。 DMD 方法在流体动力学、视频处理、控制、流行病学和金融模型等许多应用领域获得了广泛关注。 DMD 算法试图找到以下两个矩阵之间的最佳拟合。

其中

论文笔记：Spatial-Temporal Map Vehicle Trajectory Detection Using Dynamic Mode Decomposition and Res-UNe相关推荐

行为识别论文笔记|TSN|Temporal Segment Networks: Towards Good Practices for Deep Action Recognition
行为识别论文笔记|TSN|Temporal Segment Networks: Towards Good Practices for Deep Action Recognition Temporal ...

【论文笔记】LiDAR Iris for Loop-Closure Detection
[论文笔记]LiDAR Iris for Loop-Closure Detection ~~~~ ~~~ 在本文中,提出了一种称为 LiDAR Iris 的 LiDAR 点云全局描述符,用于 ...

【论文笔记】Remote Sensing Image Change Detection with Transformers
论文论文题目:Remote Sensing Image Change Detection with Transformers 收录于:IEEE TGRS2021 论文地址:Remote Sensin ...

小目标检测论文笔记：Learning Calibrated-Guidance for Object Detection in Aerial Images
论文 Learning Calibrated-Guidance for Object Detection in Aerial Images paper:https://arxiv.org/abs/21 ...

【计算机视觉】论文笔记：Ten years of pedestrian detection, what have we learned?
最近正在研究行人检测,学习了一篇2014年发表在ECCV上的一篇综述性的文章,是对行人检测过去十年的一个回顾,从dataset,main approaches的角度分析了近10年的40多篇论文提出的方 ...

IEEE TGRS2019|【论文笔记】R2-CNN: Fast Tiny Object Detection in Large-Scale Remote Sensing Images
R²-CNN: Fast Tiny Object Detection in Large-Scale Remote Sensing Images 快速轻量的大尺度遥感图像目标检测框架论文地址:http ...

论文笔记 NAACL findings 2022|Zero-Shot Event Detection Based on Ordered Contrastive Learning and Prompt-
文章目录 1 简介 1.1 动机 1.2 创新 2 方法 2.1 Contrastive sample generator 2.2 Event encoder 2.3 Ordered contrast ...

论文笔记Multi-Scale Temporal Cues Learning for Video Person Re-Identification
Multi-Scale Temporal Cues Learning for Video Person Re-Identification 用于视频行人重识别的多尺度时间线索学习 1.摘要摘要中提到 ...

《论文笔记》ROBUST MAP ALIGNMENT FOR COOPERATIVE VISUAL SLAM
时间:2018 作者: 创新点: 本文重点在C-VSLAM的map alignment环节.比较了三种算法进行transformation estimation的优劣,新提出一种scale est ...

最新文章

值得FS去的英雄副本

firefox显示nagios

告诉你你也学不会！中台灵感 SuperCell 的管理之道！

数据中心机房的一些空调制冷办法详解！

Java集合Stack源码深入解析

干货 | 数据挖掘过关40题

自然语言生成任务，如文本摘要和图像标题的生成。seq2seq的模型原理

error: ‘XXX‘ is defined but never used (no-unused-vars）报错的解决方案

Redis的发布订阅（消息队列，比如ActiveMQ，一方得到数据后，多方得到信息）

php 测试数据整数,PHP中将字符串转化为整数(int) intval() printf() 性能测试

UltraISO 制作U盘启动盘（Ubuntu、CentOS）

2021年基于B/S的高校学生选课管理系统

win10：如何书写.reg文件修改注册表

个保法(PIPL)颁布实施一周年，给行业带来了哪些变化？

浅谈知识表示之语义网络、RDF和OWL

Shell编程扩展正则表达式（egrep、awk）

H5+jQuery H5+JavaScript 体质指数BMI计算

rTotalCMD | TC替换资源管理器 For Win7

微型计算机的硬件结构采用,微型计算机硬件结构内部结构

成都工业职业技术学校计算机,成都市计算机工业职业技术学校2020年招生简介...

热门文章

Performing User-Managed Database-18.7、Performing Complete User-Managed Media Recovery

数据恢复专业基础之python解释NTFS runlist的代码

Windows环境下搭建React Native

码农如何快速打造一个有设计感的网站

Android中再按一次退出实现

在Oracle中如何让SELECT查询绕过UNDO

我国中等收入群体为应付生活压力透支半生财富

PAT甲级1093 Count PAT‘s ：[C++题解]DP、状态机模型dp

IDEA运行第一个Spring Boot应用程序

学生信息管理C语言密码,求学生信息管理系统C语言版