1、文章信息

《Dynamic Graph Convolutional Recurrent Network for Traffic Prediction: Benchmark and Solution》。这是清华大学发表在arxiv上的一篇文章,目前已经向计算机顶级期刊TKDE投稿。深度学习模型在交通预测领域的首个benchmark终于来了,重磅推荐,重磅推荐,重磅推荐!重要的话说三遍!

2、摘要

准确的交通预测是智慧城市建设的基础。虽然目前已有的工作已经提出了多种时空建模方法,但它们都忽略了路网中位置间相关性的动态特性。同时,大多数基于循环神经网络(RNN)的工作由于其循环操作而效率低下。此外,过往的工作缺乏不同方法之间在同一数据集上的公平比较。为了解决上述问题,本文提出了一种新的流量预测框架——动态图卷积循环网络(DGCRN)。在DGCRN中,超网络被设计为利用和提取节点属性的动态特征,而动态滤波器的参数在每个时间步生成。通过对节点嵌入进行过滤生成动态图,并与预定义的静态图集成。据我们所知,我们首先在每个时间步采用生成方法对动态图的精细拓扑进行建模。此外,为了提高效率和性能,我们采用了一种训练策略,通过限制前向和后向传播过程中译码器的迭代次数。最后,为公平比较和进一步研究提供可重现的标准化基准和全新的代表性流量的北京数据集。在三个数据集上的大量实验表明,我们的模型始终优于15个基线模型。这篇论文提出的模型和其他baseline方法的pytorch实现也已经全部开源,代码地址:https://github.com/tsinghua-fib-lab/Traffic-Benchmark(目前正在完善更新中,完整版很快上线)

3、动机

由于交通数据在时空维度上具有很强的动态相关性,因此建立动态的、非线性的时空相关性模型对准确的交通预测至关重要。不同位置之间的空间相关性是高度动态的,由实时交通状况和交通网络的拓扑结构决定。同时由于非线性变化和周期性的混合,时间依赖性也很复杂。由于时空关联的复杂性,我们需要应对以下挑战:

1.交通图拓扑的动态特性需要进一步建模。预先定义的邻接矩阵和自适应学习的邻接矩阵都是本质上是随时间变化的静态邻接矩阵,不足以反映现实路网拓扑的动态特性。

2.基于静态距离的图和基于动态属性的图分别从不同的角度描述了交通网络的拓扑结构,从而为模型获取空间依赖性提供了更广阔的视域。但是大多数过去的工作在保持效率和避免过度平滑的同时,并没有将它们融合在一起。

3.RNN及其变体虽然广泛应用于时间序列预测,但其训练速度受到内部递归运算的限制,阻碍了序列到序列等结构在交通预测任务中的应用。

4.随着交通预测领域的快速发展,提出的模型和交通数据集的数量也在不断增加,其中模型是在不同的数据集上进行评价,并进行相应的实验设置。这使得在模型之间进行公平比较变得困难,阻碍了该领域的发展。

4、模型

RNN的循环操作带来了动态知识,然而这些动态知识并没有被充分利用来捕获动态的时空关联。基于此思想,我们设计了基于序列到序列结构的DGCRN,包括编码器和解码器,如论文中的图1所示。通过DGCRN的递归运算同步生成每个时间步的动态邻接矩阵,其中两个图生成器分别用于编码器和解码器。然后,使用生成的动态图和预定义的静态图进行图卷积。接下来我们使用加权和融合每层有跳跃连接的不同图卷积的结果,如论文中的图2所示。最后,我们将传统的门控循环单元(GRU)中的所有全连接层替换为动态图卷积模块,从而得到动态图卷积循环模块(DGCRM)。

具体来说,DGCRN由图生成模块和动态循环图卷积模块两个主要部分组成。

(1)图生成模块

城市交通状况是复杂的,受不同时空关联的影响。从动态的角度来描述交通网络是很自然的。设计了一种用于动态图生成的超网络。DGCRN的核心是基于当前和历史信息在时间步长t时更新动态邻接矩阵DAt。在每个时间步长,速度Vt、时间t和隐态Ht−1串联为超网络的输入:

其中,It为动态节点特征,将其送入图卷积模块:

这个图卷积操作中采用的是预定义的邻接矩阵A,该邻接矩阵包含了节点之间静态的基于距离的关系,可用于对动态节点状态进行消息传递过程。我们称之为超网络,该图卷积的输出是一个动态滤波器张量DFt。我们在DFt和可学习的静态随机初始化节点的嵌入E之间采用逐位相乘运算。

在实际应用中,我们使用两个超网络分别生成源节点嵌入和目标节点嵌入的两个动态滤波器,分别表示为:

我们接下来利用节点之间的相似性来计算每一个时间步t的动态邻接矩阵:

综上所述,我们将RNN的隐藏状态加入到图生成器的输入中,将RNN的迭代与动态图的生成同时无缝地结合起来。同时,超网络内部的图卷积应用了节点间的消息传递,使图的生成更加有效,从而充分利用了动态信息。动态邻接矩阵生成模块作为图卷积的重要组成部分,可以隐式学习路网的动态表示,为静态的基于距离的邻接矩阵提供了有效的补充。

(2)      动态图卷积循环模块

基于距离的静态图和基于节点属性的动态图从不同的角度反映了节点间的相关性。为了使模型对交通网络有更大的视界,在部署图卷积时将动态图与预定义图相结合,从而提高了交通预测的性能。具体地说,我们在每个图卷积层上采用输入图信号、预定义静态图和动态图的图卷积结果的加权求和。k-hop动态图卷积模块可表示为:

特别地,我们还采用双向图卷积来很好地利用有向图,记为:

RNN具有强大的序列相关性建模能力,GRU进一步提高了RNN在长期时间建模和避免梯度消失方面的能力。我将GRU中的矩阵乘法替换为动态图卷积模块,得到DGCRM,表示为:

传统RNN的循环操作带来了随序列长度增加而增加的时间和内存消耗。因此,有必要使RNN执行尽可能少的重复操作。同时,如果先对基于RNN的解码器进行短期预测训练,并对早期时间步长有较强的记忆,那么经过较长的序列连续训练后,解码器可以在较长的范围内获得更好的性能。基于这些思想,我们对RNN相关模型采用了一种通用有效的训练策略,即课程学习。在反向传播之前的训练过程的前向传播中,我们不计算解码器的所有步骤,只计算第i步。随着训练过程的进行,i不断增大,直到达到最大,即预测序列的长度。这样,在训练过程中,模型无需对所有的时间步长都采用前向和后向传播,可以显著减少时间消耗,并在早期节省GPU内存。更重要的是,由于早期时间步骤的良好基础,性能也可以从该策略中受益。我们还发现RNN的调度采样可以很好地配合课程学习,进一步提高了性能。我们认为,这种训练方法可以很容易地应用于其他基于循环的解码器,从而提高时间序列预测任务的效率和性能。

5、实验结果

论文中使用METR-LA, PEMS-BAY和NE-BJ数据集将DGCRN与15种baseline方法进行了比较。论文中使用包括绝对绝对百分比误差(MAPE),平均平均误差(MAE)和均方根误差(RMSE)的三个指标来评估所有方法。其中, 以往提出的交通数据集例如METR-LA, PEMS-BAY,要么是在交通速度相对较高且较为简单的高速公路上根据车速建立的,要么不能充分反映复杂的城市交通状况。为了克服这些不足,使交通预测任务更具挑战性,我们在2020年7月的工作日发布了从腾讯地图导航数据中收集和提取的NE-BJ数据集。速度的单位是km/h。该数据集选取了北京东北角地区交通拥堵发生率较高的500条主干道路段。该数据集能够充分反映北京市中心城区的交通状况,具有进一步的研究价值。在三个数据集上的对比实验结果如下:

6、创新点

本文提出了一种自适应逐级生成动态邻接矩阵的超网络,其中动态节点特征的消息传递提高了图的生成效率。然后将静态图和动态图集成到图卷积模块中,显著提高了性能。对于更具挑战性的预测任务,本文中还发布了一个具有代表性的与拥堵相关的流量数据集。最后提出了一个基于三个公共数据集和15个基线的开源基准,以进行公平的比较和进一步的研究。这是一篇介于研究论文和综述之间的文章,即提出了更优的模型也对在交通流量预测领域过往的工作做了一个很好的总结,例如文中的表格对各种知名的模型做了详细的分类:

应该说这篇论文承接了过往的工作,也开拓了未来工作的思路,还为后人的研究提供了便利,是交通预测领域的一篇良心之作。原文链接为:https://arxiv.org/abs/2104.14917

希望觉得有帮助的同学能够引用我们的这项工作。

Attention

如果你和我一样是轨道交通、道路交通、城市规划相关领域的,可以加微信:Dr_JinleiZhang,备注“进群”,加入交通大数据交流群!希望我们共同进步!

面向交通预测的动态图卷积循环神经网络:基准和方法(重磅推荐)相关推荐

  1. 轮播图高度自适应_【2020顶会NIPS】用于交通预测的自适应图卷积循环网络

    就idea来说,这篇文章整体感觉亮点只有参数分解一处,其他的自适应网络结构,之前已经有文章研究,如果在计算方面有需求,或者是网络节点较多的应用可以参考这篇文章. Adaptive Graph Conv ...

  2. 【第51篇】用于交通预测的时空交互动态图卷积网络

    摘要 https://arxiv.org/abs/2205.08689 精确的交通预测对于城市交通控制.路线规划和流量检测都是至关重要的.虽然目前提出了许多时空分析方法,但在同步捕捉交通数据的时空依赖 ...

  3. 论文翻译 SGCN:Sparse Graph Convolution Network for Pedestrian Trajectory Prediction 用于行人轨迹预测的稀疏图卷积网络

    SGCN:Sparse Graph Convolution Network for Pedestrian Trajectory Prediction 用于行人轨迹预测的稀疏图卷积网络 行人轨迹预测是自 ...

  4. 【论文翻译】HCGN:面向集体分类的异构图卷积网络深度学习模型

    HCGN:面向集体分类的异构图卷积网络深度学习模型 摘要 集合分类是研究网络数据的一项重要技术,旨在利用一组具有复杂依赖关系的互联实体的标签自相关性.随着各种异构信息网络的出现,集合分类目前正面临着来 ...

  5. 多尺度动态图卷积神经网络----Multi-scale Dynamic Graph Convolutional Network for Hyperspectral Image Classificati

    一.摘要 卷积神经网络(CNN)在表示高光谱图像和实现高光谱图像分类方面表现出令人印象深刻的能力.然而,传统的CNN模型只能对固定大小和权重的规则正方形图像区域进行卷积,因此不能普遍适用于具有不同对象 ...

  6. Pytorch复现STGCN:基于图卷积时空神经网络在交通速度中的预测

    知乎主页 1:论文信息 来自IJCAI 2018的一篇论文:<Spatio-Temporal Graph Convolutional Networks: A Deep Learning Fram ...

  7. 论文笔记——扩散卷积循环神经网络进行交通预测

    这是在ICLR 2018学术会议上发表的文章,其研究课题为交通网络的时空预测. 1.交通网络预测的具体问题描述如下: 在给定交通路网中有N个传感器实时监控该点的交通状况:根据其拓扑关系交通网络可表为一 ...

  8. 论文阅读 点云动态图卷积(DGCNN)

    DGCNN 1. 背景介绍 1.1 点云 点云(Point Cloud),顾名思义是很多2维或3维点的集合. 因为传感器获取的数据往往是点云形式,而将点云还原成图形再进行处理的方法消耗过大,所以直接利 ...

  9. Survey | 基于图卷积网络的药物发现方法

    本期介绍2019年6月发表在Briefings in Bioinformatics的综述,该综述由康奈尔大学等机构的研究人员撰写,系统总结了GCN及其在药物发现方面的最新进展,重点是与药物相关的应用: ...

最新文章

  1. Java 遍历map
  2. zabbix使用zabbix 数据库做数据分表
  3. java批量生成订单号_【笔记6-支付及订单模块】从0开始 独立完成企业级Java电商网站开发(服务端)...
  4. h3c服务器安装linux,H3C服务器安装Ubuntu操作系统
  5. 【计算机组成原理】逻辑运算
  6. HDU 1978 How many ways DP问题
  7. 字符串函数参数传入传出(去空格)
  8. UMEditor上传图片配置
  9. pymssql 安装后只有 .disk-info_龙虎榜之防盗扣安装榜主—王兰香
  10. 无人车企哪家强?通用第一Waymo第二,苹果特斯拉进黑榜
  11. matlab电力系统建模与仿真实验,基于MATLAB的小型电力系统的建模与仿真.doc
  12. ubuntu上打开md文件_Ubuntu 使用教程.md
  13. 打印机服务器虚拟端口,Win7打印机服务器端口添加方法
  14. 学习AngularJS有这一篇就好了
  15. Autodesk 3ds Max 2014选择集闪退问题
  16. git pull git_Git Pull解释
  17. Nyoj 71 独木舟上的旅行
  18. 微信公众号支付开发步骤Java(超详细)
  19. 涂鸦智能赴美上市:2年亏损1.4亿美元,腾讯、高瓴等参与认购
  20. 过滤非手机浏览器 request 请求

热门文章

  1. 海思系统开发——linux下挂载SD卡
  2. Android-PickerView系列之介绍与使用篇(一)
  3. MyEclipse优化、常用设置、快捷键
  4. 说一说递归里的return返回!!!
  5. JAVA代码混淆器大全
  6. 服务器ie安全增强关闭后还是显示,怎么关掉ie浏览器的增强安全配置
  7. 解决mac idea2020打开闪退问题
  8. Linux Panic 机制解析
  9. windows 10桌面快捷方式小箭头
  10. python中 math模块下 atan 和 atan2的区别