Time-Evolving Graph Convolutional Recurrent Network for Traffic Prediction

总结

 本文提出了一种基于时间演化图卷积递归网络的流量预测模型。该方法采用张量分解方法生成自适应时间演化图(随时间变化的动态邻接矩阵),然后将这些时间演化图的图卷积模块集成到RNN结构中。在两个真实的交通数据集上的实验表明,TEGCRN比多个竞争基线模型更有优势,尤其是在短期预测方面。

挑战

1、交通状态的不确定性,在时域中存在复杂的非线性模式。一个节点(路段)的交通状况在不同的时间可能有相似的周期趋势,但在短时间内可能出现异常波动。如下图。交通速度表现出周期性,但在红色虚线框所示的短时间内可能会出现异常波动。

2、复杂的空间相关性。一个节点不仅与邻近的节点之间具有相似性,距离较远的两个节点也可能呈现出相似性的特点。如下图一天中三个相邻交通节点的交通速度,这三个节点的值表现出很强的相关性。

创新

&emsp之前研究在捕获空间相关性时,大多使用的是静态的邻接矩阵,但是节点之间的空间相关性动态变化的。本文提出了一种通用的流量预测框架——时间进化图卷积递归网络(TEGCRN),该框架利用时间进化图卷积,在不同时隙自适应捕捉节点间动态依赖关系。贡献可以总结如下:

 1、基于张量分解的方法,利用自适应时间嵌入和节点嵌入构造了不同时间步的时间演进邻接图(邻接矩阵)。该方法充分利用了在时域中共享的信息,与每次慢速定义自适应图相比,参数效率更高(基于张量分解的方法可以减少参数量,消除冗余的参数)。
 2、为了对交通网络中的节点间模式进行建模,我们采用了一种混合跳图卷积,它利用了自适应时间演化图和预定义的基于距离的图。与静态图卷积模块相比,这种图卷积模块可以有效地捕获更全面的节点间依赖。
 3、将前述的图卷积模块与RNN编码器-解码器结构相结合,形成一个通用的交通预测框架,使其在建模交通序列特征时能够学习节点间依赖的动态。在两个真实的交通数据集上的实验表明,该模型优于多个竞争基线,特别是在短期预测方面。

Method

Method Overview

 下图说明了时间演进图卷积递归网络(TEGCRN)的概述。该模型主要由三部分组成。首先,利用自适应嵌入交通节点和时隙的张量组合方法生成时间演进的邻接图(图中红框部分)。然后,将得到的自适应图与预定义的静态基于距离的图ASA^{S}AS相结合,在图卷积模块中获取节点间信息。最后利用带时间演化图的图卷积模块取代GRU中的全连通层(就是将GRU单元中的线性层替换为图卷积),最后整个预测框架是编码器-解码器模型。在编码器-解码器的每个时间步中,根据一天中的时间选择不同的自适应图。该方法的核心思想是学习空间邻接的隐式动态和交通序列特征,从而获取更详细的时空信息。

Generation of Time-Evolving Adaptive Graphs

 假定空间邻接的动态性遵循一天内的周期性,也就是不同天的相同时间段可以共享一个邻接图。将一天中每个时间步都对应单独的邻接矩阵(假设每隔5mins取一次数据,一天中的有288个时间步,这种方法可能会导致可训练参数数量较多,难以收敛,尤其是当交通节点N数量较大时。为了减少模型参数的数量,采用类似的张量分解的方法生成邻接图。本文使用的是基于 Tucker分解的张量分解方法。
 具体的构造方法为:
 将一天划分为NtN_{t}Nt​个时间步,道路网络中包含NNN个节点。首先构造三个嵌入矩阵Et∈RNt×d\mathbf{E}^{\mathrm{t}} \in \mathbb{R}^{N_{t} \times d}Et∈RNt​×d, Es∈RN×d\mathbf{E}^{\mathbf{s}} \in \mathbb{R}^{N \times d}Es∈RN×d,Ee∈RN×d\mathbf{E}^{\mathbf{e}} \in \mathbb{R}^{N \times d}Ee∈RN×d和一个核心张量C∈Rd×d×dC \in \mathbb{R}^{d \times d \times d}C∈Rd×d×d,其中ddd为嵌入维数,d≪Nd \ll Nd≪N,三个嵌入矩阵分别表示时间节点嵌入、源节点嵌入、目标节点嵌入。核心张量CCC在这些嵌入之间建立联系,并对跨时间和空间共享的隐式因素建模。所有这些嵌入和核心张量都是可训练和随机初始化的。计算时空张量A′∈RNt×N×N\mathbf{A}^{\prime} \in \mathbb{R}^{N_{t} \times N \times N}A′∈RNt​×N×N的公式如下:A′=C×1Et×2Es×3Ee\mathbf{A}^{\prime}=\mathbf{C} \times{ }_{1} \mathrm{E}^{\mathrm{t}} \times{ }_{2} \mathrm{E}^{\mathrm{s}} \times{ }_{3} \mathrm{E}^{\mathrm{e}}A′=C×1​Et×2​Es×3​Ee
A′\mathrm{A}^{\prime}A′中的每个元素为:Ai,j,k′=∑w=1d∑v=1d∑u=1dCu,v,wEi,utEj,vsEk,we\mathbf{A}_{i, j, k}^{\prime}=\sum_{w=1}^{d} \sum_{v=1}^{d} \sum_{u=1}^{d} \mathbf{C}_{u, v, w} \mathbf{E}_{i, u}^{\mathbf{t}} \mathbf{E}_{j, v}^{\mathbf{s}} \mathbf{E}_{k, w}^{\mathbf{e}}Ai,j,k′​=w=1∑d​v=1∑d​u=1∑d​Cu,v,w​Ei,ut​Ej,vs​Ek,we​
然后对A′\mathrm{A}^{\prime}A′进行归一化得到随时间变化的动态邻接图Ate ∈RNt×N×N\mathbf{A}^{\text {te }} \in \mathbb{R}^{N_{t} \times N \times N}Ate ∈RNt​×N×N:
Ate =softmax⁡(LeakyReLU⁡(A′))\mathbf{A}^{\text {te }}=\operatorname{softmax}\left(\operatorname{LeakyReLU}\left(\mathbf{A}^{\prime}\right)\right)Ate =softmax(LeakyReLU(A′))

 通过张量分解的方法生成动态邻接图(时间演化图),表示一天中不同时间步节点之间不同的相关性。之后,之后将用于图卷积模块中提取详细的空间信息。

Graph Convolution Module

 在使用图卷积捕获空间相关性时,同时使用的张量计算生成的动态邻接图和静态的邻接图。作者认为静态图捕获了局部模式,而从动态邻接图全局角度提供了动态节点间依赖关系。静态邻接图AsA_sAs​的生成公式如下:
Ai,js={exp⁡(−dvi,vj2σ2),dvi,vj≤κ0,others \mathbf{A}_{i, j}^{\mathbf{s}}=\left\{\begin{array}{ll} \exp \left(-\frac{d_{v_{i}, v_{j}}^{2}}{\sigma^{2}}\right), & d_{v_{i}, v_{j}} \leq \kappa \\ 0, & \text { others } \end{array}\right. Ai,js​=⎩⎨⎧​exp(−σ2dvi​,vj​2​​),0,​dvi​,vj​​≤κ others ​
 考虑到深层网络的图卷积过平滑问题,作者将图卷积运算分为两个步骤:
 1、信息传播和加权mix-hop运算,类似于[21]中的方法。首先,对于某种类型的邻接图,根据图拓扑传播节点信息,生成KKK跳的节点表示。原点节点特征表示为Hin∈RN×din\mathbf{H}_{\mathrm{in}} \in \mathbb{R}^{N \times d_{i n}}Hin​∈RN×din​,经过k−thk-thk−th计算H(k)\mathbf{H}^{(k)}H(k)表示为:H(k)=(1−α)A~H(k−1)+αHin\mathbf{H}^{(k)}=(1-\alpha) \widetilde{\mathbf{A}} \mathbf{H}^{(k-1)}+\alpha \mathbf{H}_{\mathbf{i n}}H(k)=(1−α)AH(k−1)+αHin​

 本文也采用和了扩散卷积的思想:

Temporal Recurrent Module

 在每个时间步中,根据一天中的时间步选择不同的自适应图。然后将GRU中的线性层替换为图卷积模块。

Experiments

使用的数据集是METR-LA PEMS-BAY,数据集描述如下:

预测结果:
METR-LA

PEMS-BAY

消融实验

 作者对METR-LA数据集进行消融实验研究,以验证具有自适应时间演化图的图卷积模块的有效性。
 首先将TEGCRN中的时间演进图替换为中的静态自适应图。然后,进一步删除了时间演进的图生成模块,只使用静态预定义的基于距离的图。计算所有输出时间步的平均度量。结果如下表。可以看到,通过学习全局依赖,与自适应图的卷积比仅预定义的基于距离的图的卷积性能更高。


 此外,在TEGCRN中提出的时间进化图卷积通过捕捉更多隐式的节点间动态,进一步提高了预测性能。下图显示了归一化的基于距离的静态邻接图和学习的时间演进邻接图在某些选定的时隙中的热力图。颜色越深,对应节点之间的权重值越高。

&emsp论文的主要思想就是为每个时间步分配单独的邻接矩阵来捕获的动态的时间相关性,考虑到参数量过大的问题结合张量分解的方法以减少冗余的参数。和《Dynamic and Multi-faceted Spatio-temporal Deep Learning for Traffic Speed Forecasting》中的构造动态图的方法很相近。

Time-Evolving Graph Convolutional Recurrent Network for Traffic Prediction论文笔记相关推荐

  1. Dynamic Graph Convolutional Recurrent Network for Traffic Prediction Benchmark and Solution

    Dynamic Graph Convolutional Recurrent Network for Traffic Prediction: Benchmark and Solution 1. 文章概述 ...

  2. 2020 AAAI-GMAN: A Graph Multi‐Attention Network for Traffic Prediction阅读笔记(翻译)

    注明:本文仅是翻译了论文,主要目的方便日后温故

  3. Structured Sequence Modeling With Graph Convolutional Recurrent Networks

    https://davidham3.github.io/blog/2018/07/23/structured-sequence-modeling-with-graph-convolutional-re ...

  4. 【论文导读】- EvolveGCN: Evolving Graph Convolutional Networks for Dynamic Graphs(EvolveGCN:用于动态图的演化图卷积网络)

    文章目录 论文信息 摘要 evolving graph convolutional network 图卷积网络 (GCN) 权重更新 Evolving Graph Convolution Unit ( ...

  5. 论文笔记 Inter-sentence Relation Extraction with Document-level Graph Convolutional Neural Network

    一.动机 为了抽取文档级别的关系,许多方法使用远程监督(distant supervision )自动地生成文档级别的语料,从而用来训练关系抽取模型.最近也有很多多实例学习(multi-instanc ...

  6. (论文笔记)An Attention Enhanced Graph Convolutional LSTM Network for Skeleton-Based Action Recognition

    An Attention Enhanced Graph Convolutional LSTM Network for Skeleton-Based Action Recognition 文章目录 An ...

  7. Spectral-based graph convolutional neural network

    这里写自定义目录标题 Spectral-based graph convolutional neural network 1. 来自对<[A Comprehensive Survey on Gr ...

  8. 【论文翻译】An Attention Enhanced Graph Convolutional LSTM Network for Skeleton-Based Action Recognition

    An Attention Enhanced Graph Convolutional LSTM Network for Skeleton-Based Action Recognition 基于骨架的注意 ...

  9. Switching Convolutional Neural Network for Crowd Counting-论文笔记

    Switching Convolutional Neural Network for Crowd Counting:用于人群计数的转换卷积神经网络 Switching Convolutional Ne ...

  10. Graph Convolutional Neural Network - Spatial Convolution 图卷积神经网络 — 空域卷积详解

    文章目录 往期文章链接目录 Note Convolutional graph neural networks (ConvGNNs) GCN Framework GCN v.s. RecGNN What ...

最新文章

  1. ylbtech-Unitity-CS:Hello world
  2. abaqus的python安装文件在哪_python、abaqus执行脚本路径
  3. IDC:第一季度全球服务器市场收入下滑4.6% 市场为重大升级做准备
  4. eval()函数和zip()函数用法、enumerate()
  5. java request含嵌套_使用 RxJava 进行嵌套串行网络请求的一种方法
  6. 有哪些知名的短信接口提供商
  7. 算法导论第三版 第4章习题答案
  8. 数领科技|Solidworks软件这些年来的变化你都知道吗?
  9. 云服务器运维管理面板有哪些?
  10. 日常英语---九、冒险岛link技能导读
  11. 机器学习相关职位走向
  12. 如何建立NVivo的人际关系?
  13. 纯CSS实现立体感圆盘(立体化按钮),点击有图
  14. 浅谈对程序员的认识_8年编程生涯回顾:谈谈我对程序员的理解
  15. 用Java实现目录复制(包含此目录下的所有文件与目录)
  16. 腾讯微搭低代码(预约)总体介绍——工作室专用(客户端)
  17. Day02—homework
  18. 突然发现得考个研究生了
  19. Deepin20固定无线网卡多个IP地址
  20. AC695x学习笔记(1): 简介

热门文章

  1. NYOJ 33 蛇形填数
  2. 配置Snappy压缩
  3. 游戏开发需要具备哪些技术?
  4. 利用python解决简单数独
  5. Grid 不能动态添加数据这是为什么呢!
  6. 贝叶斯分类器(贝叶斯决策论,极大似然估计,朴素贝叶斯分类器,半朴素贝叶斯分类器,贝叶斯网)学习笔记
  7. 债券数据集:绿色债券数据集、历时新发、发行债券、DCM定价估值四大指标数据
  8. phalcon mysql_Phalcon 数据库操作总结
  9. 如何学习Photoshop
  10. 2020 中南大学研究生招生夏令营机试题(1252~1256)