个人知乎:知乎主页https://www.zhihu.com/people/shuang-shou-cha-dai-53https://www.zhihu.com/people/shuang-shou-cha-dai-53

论文:《Temporal Multi-Graph Convolutional Network for Traffic Flow Prediction》

下载链接:链接:https://pan.baidu.com/s/1fiSaVRkdJ2ywB_8nufgMjw      提取码:y3hr

2020年发表在IEEE Transaction on Intelligent Transpotation System上的一篇文,文中的一些多图构造逻辑及思路可以借鉴。


目录

1:摘要

2:引言总结

3:方法

3.1:问题定义

3.2:输入层

3.3:卷积层

3.4:循环层

3.5:输出层

4:总结

5:读后自己的一些思考


1:摘要

交通流预测在智能交通系统中扮演者重要角色。由于复杂的空间和时间相关性,如路网受限及时间上动态变化缺陷,交通流预测一直是一项具有挑战性的任务。当前的研究工主要是通过开发各种时空模型来解决这一问题。然而,我们观察到遥远道路之间的语义关联性(semantic pair-wise correlations)对于交通流预测也是至关重要的。为了将路网中的空间、时间、语义关联与各种全局特征融合,本文提出了T-MGCN (Temporal Multi-Graph Convolutional network)深度学习框架用于交通流预测。第一,识别了几种不同类型的语义关联,并将道路间的非欧氏空间关联和异构语义关联编码到多个图中,通过多图卷积网络对关联性进行建模。第二,利用循环神经网络学习交通流的动态模式以捕获时间上相关性。最后利用全连接神经网络融合时空相关性和全局特征。与Baseline相比,模型大约有3%-6%的提升。

2:引言总结

引言部分主要就是讲解交通流预测问题存在的难点,以及过去方法总结和缺陷梳理。

预测交通流的难点主要体现在

1:空间相关性。城市交通流受路网拓扑结构的影响,直观地,道路的交通流会对其邻近道路的交通流产生较大影响。此外空间上的关联具有方向性,比如下游流量比上游流量对未来的交通状况影响更大。

2:时间相关性。交通状况随时间动态变化,时间相关性表现为邻近性和周期性,邻近性是指最近时段的交通状况比旧时段的交通状况更相关;周期性是指交通状况在一定的时间间隔内呈现出周期性的变化模式,(如早晚高峰)。

3:语义相关性。由于一些潜在的语义关联,遥远的道路之间也可能存在一定的相关性。例如,具有相似功能的城市道路(如住宅区和商业区)通常具有相似的交通模式。

过去方法中,通过考虑时间相关性的数据驱动建模的方法进行预测,包括卡尔曼滤波,时间序列方法ARIMA,以及SVR等模型,然后这些方法都忽略了空间相关性,导致模型不能在整个路网中具有较好的性能。许多研究应用CNN对空间进行建模以此捕获空间相关性。然而,CNN最初是为欧几里得空间结构设计的,所以它不能完全适应路网复杂的拓扑结构(如交通路网中的非欧式结构)。针对这一问题,用于路网(非欧式)空间建模的图卷积网络 GCN。方法在构建图时只考虑了道路之间的拓扑依赖关系,而忽略了所有其他可以衡量道路之间相关性的语义因素(如交通行为和局部功能)。基于以上局限,本文提出了一个深度学习框架:T-MGCN,它将空间、时间、语义关联及各种全局特征融合,用于路网中的交通流预测。文章主要贡献如下:

1:识别了道路之间的两种语义相关性(历史交通模式相关性和局部区域功能相似性),并使用多个图对空间和语义关联性进行编码。然后提出了一个多图卷积网络来建模和融合这些图。

2:识别了各种全局特征(即时间特征、周期性特征和事件特征),并设计了一个深度神经网络来联合建模空间、语义、时间相关性和全局特征。具体来说,堆叠了基于多图卷积网络的卷积层、基于GRU 的循环层和基于全连接神经网络的输出层。

3:在两个真实的交通数据集上进行了的实验。结果表明,与最佳基准模型相比,T-MGCN降低了约3% - 6%的预测误差。


3:方法

3.1:问题定义

路网图:将路网表示为一个加权图G = (V,E,W),其中每个节点v表示一条道路,边e表示节点间的相关性,边缘权值表示相关性强度,权重越大,两条路的相关性越高。本文从道路网络拓扑结构(Gr、Gw)、交通模式相关性(Gp)、局部区域功能相似性(Gf)三个方面构建图。

交通状况:用一个N维向量表示 t 时刻路网上的交通信息 (如速度、流量等),其中N为道路数量。交通状况样本数据表示为:,其中输入部分,表示 t 时间窗口内的交通状况数据, 来预测未来 h 时间窗口内的交通状况数据。

问题定义:交通流预测问题定义为:在Gr、Gw、Gp、Gf 信息基础上基础上,通过学习过去大量的历史交通信息样本来获得反映未来交通信息的函数:

TMGCN网络结构:

包括:输入层,卷积层,循环层,输出层。

首先,给定一个交通状况样本数据,输入层通过滑动窗口来处理 获得分段切片,然后,对每个分段切片,卷积层使用4个独立的GCN()对四个图(上述Gr、Gw、Gp、Gf)信息进行卷积操作,然后融合以上计算结果得到特征矩阵。接着,循环神经网络GRU来处理时序特征矩阵,最后输出层融合特征矩阵和全局特征,通过全连接神经网络得到预测结果。

3.2:输入层

给定一个交通样本,输入部分可看做是一个一个N*W的矩阵,N为道路数,W为历史交通状况属性数量。使用窗口大小为 w,步长为 d 的滑动窗口来处理输入,得到一个由K个片段组成的序列。

使用这种处理策略的原因:第一,每个路段应包含多个交通条件信号(W>1),这是由于时间序列数据具有邻近性特征(邻近时段内的数据具有较强的局部交互),通过卷积层分别来捕获这些相邻时段内的局部交互。如果w = 1,局部相互作用将被忽略。第二,将交通状况样本的输入部分划分为多个段,便于循环层捕捉时间动态。如果w = W,则时间动态被忽略。

3.3:卷积层

卷积操作可以较好的捕获邻域之间的依赖关系并且可以避免方差偏移,然而CNN仅适用于欧式空间(图像,标准网格等),因此不能够适应复杂的路网拓扑网络。基于上述定义的各类路网图之间的关系,我们适用GCN对路网进行卷积操作。

(1)图的构建: 图的构建是GCNs的关键步骤。如果生成的图不能很好地编码节点之间的相关性,可能并不能帮助模型学习甚至降低模型预测性能。通常,我们对道路相关性较强的边缘赋予较大的权重。这里构建了四种道路图(上述Gr、Gw、Gp、Gf),具体如下:

(a)拓扑图Gr:路网的拓扑结构可以用有向图表示Gr =(V, E, Wr ), 边的权重 wr (i, j ) 是从路vi到路vj之间链路数量的倒数(如图2所示。,在路网中越近的道路,其权重就越高。邻接矩阵Xr表示为:

(b)加权拓扑图Gw:上述拓扑图Gr仅仅考虑了从  到  的间接相连边的数量,然而连接边的长度也会影响相关性。因此,我们定义加权拓扑图,边的权重 如式3所示,其中计算路径的长度,邻接矩阵表示为式4:

(c)交通模式图Gp

交通模式相似的道路在空间上不一定很近。利用每条道路的历史交通状况数据,通过直接度量每条道路对历史交通状况模式的相似性来挖掘道路间的相关性。具体来说,流量模式图表示为Gp = (V, E, Wp)。边的权重为两条道路历史模式的相似度,计算如下:

首先,给定一条路 ,我们使用历史平均每周交通状况 来表示它的交通模式,其中 是一个序列, 表示在过去一周道路状态数据  的第 j 个时间的平均值。其次,给定两条道路,使用DTW (Dynamic Time Warping)计算两条路的距离,记为dtw(i , j ),公式5将距离度量转换为相似度量。式中,用α控制距离的衰减率,衰减率应根据所涉及的交通状况的范围来设定。邻接矩阵Xp表示为式6:

v

(d)区域功能图

城市道路中,功能相似的道路通常有相似的交通模式。比如,工业区可能在工作日的高峰时间有拥堵的交通流,市中心地区可能在周末有拥堵的交通流。区域功能图用来表示,权重表示道路和道路 之间边的权重。计算逻辑如下:

研究表明POI (Point Of Interest) 分布可以衡量城市区域的功能性。我们根据以下八类计算POIs的密度:住宅、工作(公司、办公大楼等)、商业(如商场、商店等)、餐馆、学校、交通(例如,火车站、地铁站等)、娱乐(如剧院、酒吧等)和风景(如公园、湖泊等)形成特征向量,pvi [ j ] 表示 道路周边的 j 类POI密度,计算方法如式7所示。该方程参考自然语言处理领域的TF-IDF设计,对总体数量较少的POI类别赋予更高的权重。其次,使用余弦相似度来计算两条道路pvi 和pvj 之间的相似度,将其作为权重。则邻接矩阵可表示为式公式8。

(2)多图卷积网络

利用GCN进行卷积操作,捕捉节点之间的关联。每个道路图都被输入到一个单独的GCN。GCN的传播规律如式9所示(即经典谱域卷积):

然后基于参数矩阵融合方法合并四个特征矩阵,其中是可学习参数,来调节特征矩阵的权重。采用softmax运算对参数矩阵进行归一化处理:

3.4:循环层

循环层用来捕获时间相关性,文章选择了两层堆叠的GRU结构,这是提高模型容量的有效途径。在GRU层之间应用dropout进行正则化。如图3,将上一步处理后的特征矩阵按时间顺序输入到循环层中,取最后一个隐藏状态的输出特征矩阵作为循环层的输出。

3.5:输出层

循环层对路网拓扑结构的空间关联、道路间语义关联以及时间关联的邻近性性进行了编码,然而,还有其他全局特征可以影响交通状况(比如时间和交通事件)。因此,在输出最终的特征矩阵之前,我们还提取了以下全局特征:

(1)时间特征:给定一个交通状态样本,我们考虑一天中的时间,周几,和节假日事件作为时间特征。我们提取未来时间t+h的时间特征,以此来预测交通状况。我们将 的路网时间特征矩阵表示为

(2)周期特征:城市交通流具有很强的周期性(如高峰期),然而,由于W(即交通状况样本输入部分的长度)不能太长,因此循环层只能捕捉短期的周期性。因为太长的RNN难以训练,并且存在梯度消失性的可能,会削弱周期性的作用。因此,给定一个交通状态样本,我们将最后一天同一时间和最后一周同一时间的交通状况作为长期周期性特征。我们考虑一个时间窗口的交通状态属性,而不是使用单一的属性。原因是交通状态通常不是严格的周期,虽然几乎所有工作日都有早高峰时间,但交通高峰可能在每天早上的不同时段出现。我们将的路网周期性特征矩阵表示为

(3)事件特征:在某些情况下,一个事件(例如交通事故和节日)会导致目标区域周围的交通情况在很短时间内发生急剧变化。然而,这种情况的存在是非常罕见的,仅考虑交通状况数据几乎不可能捕捉规律性。为解决该问题,这里利用一些事件发布网站(如基于位置的社交网络和公共设施的官方网站)共享的带有位置和时间属性的文本信息,基于深度神经网络识别事件,并捕捉其对未来交通模式的影响。具体地,给定一个交通状况样本,我们将每条道路附近在输入 期间发布的文本片段进行聚合,形成文件D(t, i),然后利用TextCNN,通过预先训练的词嵌入层、卷积层、最大超时池化层和全连通层,从D(t, i)中提取特征向量。然后将提取的所有特征向量进行组合,形成St的路网事件特征矩阵,记为

第二,融合RZt, TZt, PZt和EZt为一个长特征矩阵:

然后叠加两层完全连接层,第一层可以被视为一个嵌入层,第二层是用来确保输出矩阵Z具有相同的形式。请注意,全局特性是可选的,我们可以根据数据可用性选择其中任何一个来形成最终的。最后,我们用sigmoid作为激活函数,输出t+h时刻的预测路况信号,记为 。训练模型到预测交通状况信号和真实的交通状况信号之间的RMSE最小化。


4:总结

通过数据案例研究直观地展示了T-MGCN的性能。T-MGCN能够更好地捕捉道路网络的空间相关性和语义相关性,从而做出更准确的预测。


5:读后自己的一些思考

该篇论文的亮点在于多图的构造,融合后的图可以更加全面的表征交通流信息,也存在一些优化空间:

(1): 多图的构造,降低了训练速度,是否可以在预处理阶段,将多图进行融合,然后将融合后的图进行训练?

(2): 在捕获交通流周期性规律时,可以参与Attention机制,可以同时捕获交通流的每日周期性,还可以捕获交通流的每周周期性规律

(3): 如果不考虑运行效率的话,融合后的图,是否可以加入自适应调整机制,即:构造自适应邻接矩阵

(4):该篇论文分别先进行图卷积再拼接到一起,然后通过全连接层输出,在图融合阶段,是否可以对各个图进行加权融合?如何可以的话,哪个方法得到的结果更好?

T-MGCN时间多图卷积网络用于交通流预测相关推荐

  1. (24) T-GCN-时间图卷积网络用于交通预测

    交通预见未来(24): T-GCN-时间图卷积网络用于交通预测 1.文章信息 <T-GCN: A Temporal Graph Convolutional Network for Traffic ...

  2. STGCN时空图卷积网络:用于交通预测的深度学习框架

    时空图卷积网络:用于交通预测的深度学习框架 及时准确的交通预测对城市交通控制和引导至关重要.由于交通流的高度非线性和复杂性,传统的方法不能满足中长期预测任务的要求,往往忽略了空间和时间的相关性.本文提 ...

  3. 【论文阅读】Spatio-Temporal Graph Convolutional Networks:...Traffic Forecasting[时空图卷积网络:用于交通预测的深度学习框架](1)

    [论文阅读]Spatio-Temporal Graph Convolutional Networks: A Deep Learning Framework for Traffic Forecastin ...

  4. 基于交通图卷积长短时记忆网络的网络级交通流预测

    文章信息 本周阅读的论文是题目为<Traffic Graph Convolutional Recurrent Neural Network: A Deep Learning Framework ...

  5. 论文浅尝 | 采用成对编码的图卷积网络用于知识图谱补全

    笔记整理:姚祯,浙江大学在读硕士,研究方向为知识图谱表示学习,图神经网络. 论文引用:Liu S, Grau B, Horrocks I, et al. INDIGO: GNN-based induc ...

  6. ⑭【动态时空图卷积网络 · 注意力 · 交通速度预测】时空依赖关系挖掘 | 动态时空建模 | 智能交通系统 |

    所谓成功,就是用自己的方式度过人生. ----<明朝那些事儿>作者,当年明月

  7. AAAI 2022 | 条件局部图卷积网络用以气象预测

    ©PaperWeekly 原创 · 作者 | 西南交一枝花 单位 | 西南交通大学CCIT实验室 研究方向 | NLP.时空数据挖掘 本次分享的是 AAAI 2022 一篇来自西湖大学的气象预报工作& ...

  8. AVGCN:利用人类注意力引导的图卷积网络进行轨迹预测

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 小白导读 论文是学术研究的精华和未来发展的明灯.小白决心每天为大家 ...

  9. LightGCN:用于推荐任务的简化并增强的图卷积网络 SIGIR 2020

    论文链接:https://arxiv.org/abs/2002.02126 代码链接:https://github.com/gusye1234/LightGCN-PyTorch 论文来源:SIGIR ...

  10. 论文翻译 SGCN:Sparse Graph Convolution Network for Pedestrian Trajectory Prediction 用于行人轨迹预测的稀疏图卷积网络

    SGCN:Sparse Graph Convolution Network for Pedestrian Trajectory Prediction 用于行人轨迹预测的稀疏图卷积网络 行人轨迹预测是自 ...

最新文章

  1. Redis做消息队列,香吗?
  2. [ADB]ADB(Android Debug Bridge)简介及基础(不包含命令)
  3. 【S4 导数据】S/4HANA导数,只会LSMW远远不够(转)
  4. Android开发环境搭建全程演示(jdk+eclipse+android sdk)
  5. 第十六周项目3-有相同数字?
  6. Spring MVC和Thymeleaf:如何从模板访问数据
  7. Codeforces Round #696 (Div. 2)
  8. caffe源代码分析--math_functions.cu代码研究
  9. 51单片机实现简单计算器
  10. 【疲劳检测】基于形态学实现疲劳检测matlab源码
  11. 【人工智能】动物、植物、车型、菜品、LOGO识别示例代码
  12. 不再害怕打字慢(python信息轰炸)
  13. 利用广播星历解算北斗卫星位置及精度分析
  14. 3461. 在哈尔滨的寒风中(找规律)
  15. LSD_SLAM框架总结[最终版本]
  16. Django 链接数据库错误 Strick Mode 解决
  17. 摇床摇篮是哄睡很好用的工具
  18. 一个实用的实时毛发渲染及着色方法
  19. 微信小程序的复制功能怎么实现的?
  20. 周志明jvm第三版笔记-第一部分:第一章 走进java

热门文章

  1. 计算机基础视频教程B站版
  2. eclipse安装及配置android基础教程
  3. Simphony学习2 安全相关(密码和角色)
  4. 第一章 空间解析几何与向量代数(1)
  5. 【2020年最新】【绿色工具】使用软件轻松入侵同学电脑(极域电子教室)
  6. php多语言商城,Ecshop商城多国语言修改方法
  7. Rational Rose安装教程
  8. windows杀进程
  9. 详细介绍SWFUpload
  10. 计算机软件429修复工具,运行时错误 429,ActiveX部件不能创建对象的解决方法小结...