1.文章信息

《Metro Passenger Flow Prediction via Dynamic Hypergraph Convolution Networks》,这是今年4月发表在 IEEE Transactions on Intelligent Transportation Systems 上的一篇文章。

2.摘要

地铁客流预测是智能交通系统中缓解交通压力、协调运营时间、规划未来建设的战略性需求。基于图的神经网络在交通流预测问题中得到了广泛的应用。图卷积神经网络(GCN)根据已建立的连接捕获空间特征,但忽略了车站与乘客出行模式之间的高阶关系。文章利用一种新的表示方法来处理这个问题-超图,提出了一种用于客流预测的动态时空超图神经网络。在预测框架中,利用地铁系统拓扑结构构造初级超图,然后利用从多时段行人出行模式中发现的高级超边对初级超图进行扩展。在此基础上,提出了基于超图卷积和时空块的时空特征提取算法,实现了节点级预测。在北京和杭州的历史数据集上进行的实验验证了该方法的有效性,并取得了比现有方法更高的预测精度。

3.介绍

文章提出了一种新的数据表示结构——超图,代替了现有流量预测算法中的数据建模方法。超图是传统图的一般化,表示具有超边的顶点之间的非配对关系。因此,超图可以模拟高阶数据之间的内在关系。对于道路交通流预测的基于图的神经网络模型,明确了每个边连接两个节点。然而,地铁车站之间的连接比点对点的连接带有更多的信息,因为所有的连接都属于相应的地铁线路。这些线路在时间间隔、运行时间和车辆数量方面彼此不同。举例来说,北京机场特快两班车之间的时间大约是30分钟。而10号线的时间间隔是5分钟左右。传统图的边仅限于成对关系,不能携带高阶信息。然而,超图可以用超边来模拟它,如下图所示。此外,文章还设计了一个动态机制,利用超图的可扩展性来描述旅客的不同出行模式。利用地铁的拓扑结构构造主超图,并从乘客的出行路径中提取高级超图。为了动态地处理地铁流量预测问题,将这两种超边结合起来。这种机制可以动态地结合空间和时间特征,以实现更准确的流量预测。

文章的贡献有以下三点:

(1)提出了一种新的轨道交通数据超图表示方法。该方法充分考虑了地铁的特殊结构和乘客出行方式,建立了初始超图和高级超边。文章提出的超图表示不仅描述了高阶拓扑关系,而且模拟了旅客的动态出行模式。

(2)提出了一种用于轨道交通流量预测的多层时空超图神经网络。通过图的卷积运算和超图学习,得到了超图的谱卷积。然后将具有超图卷积层和时间卷积层的时空块进行叠加,建立流量预测框架。

(3)在北京和杭州历史全尺度地铁流量数据集上进行了大量的实验研究。对比实验包括全时、高峰期和异常情况。完成了消融实验和时间消耗实验。通过与现有基线的比较,验证了该模型的实用性和有效性。

4.方法

该方法的基本思想是首先通过超图表示对地铁客流预测问题进行建模。超图谱卷积是从超图学习理论中推导出来的。利用动态机制设计了超图神经网络框架,实现了节点级客流预测。

(1)总体框架

客流预测的目标是是根据以往从某些观测地点收集到的数据,估计未来某个时间的流量。该论文的客流预测问题描述如下:

通常,超图表示用基于特征的方法或基于结构的方法对问题进行建模。基于特征的方法通过聚类特征挖掘顶点之间的相关性来构造超边。基于结构的方法利用数据集本身固有的拓扑结构。只使用其中一种方法可以简化原有的结构信息,但是文章将这两种方法结合起来,丰富了超图表示的内涵。

此外,动态机制的灵感来自乘客的出行模式。通勤者在工作日往返于工作场所和他们的住所。当旅客数量达到一定规模时,相应的站点之间将存在强烈的动态相关性。

文章设计了动态时空超图卷积网络(DSTHGCN)。下图演示了所提出模型的结构。如框架所示,原始输入数据包括地铁流量数据和轨道网络结构。首先根据原始输入数据建立动态超图。然后,将超图的拉普拉斯矩阵和地铁流量数据输入到STHGCN中,其中包含超图的卷积层和时间卷积层,以获取超图中每个顶点的光谱和时间特征。最后,融合三个时间跨度的预测,输出预测结果。

(2)超图构造

超图的定义:对图进行推广,其中超边可以表示为某些顶点的集合。超图具有顶点集合,超边集合以及权重,超图表示如下:

关联矩阵为:

对于超图中的顶点 υ ∈ v,度被定义为所有连接到顶点 υ 的超边权 ω (e)的总和:

超边的度数定义为由它连接的顶点数:

本文将超图的构造分为主超图的构造和高级超图的构造两个步骤。

主超图用来表示城市轨道交通网络的基本拓扑结构,超图中的顶点为地铁站,超图中的超边根据地铁线路建立,同一轨道线路上的车站具有相同的特点,因此得到主超图:

高级超图旨在获取乘客 OD 模式背后的更多空间信息。OD 是origin-destination 的缩写,通常在过境中用于确定一段时间内的出行模式。由于乘客的出行方式随时间不断动态变化,因此他们的 OD 也随之变化。因此文章提出了一种具有不同超图的动态机制来捕获更多的时间特征,如图 3 所示。

首先分析整个地铁网络的客流信息,生成不同时间跨度的OD矩阵,并使用热力图来可视化 OD 矩阵并挖掘内部模式。地图上热值高的区域说明相关车站客流量大。低热值说明车站的客流量较小。通过对热力图的分析,不同时间跨度的出行OD揭示了同期大部分人的出行轨迹,即大部分乘客进入哪些站点,然后从哪些站点出站。根据这些信息,通过聚类算法 DBSCAN 构造高级超边 Eh。使用 DBSCAN 的主要原因是可以有效处理噪声点并找到任意形状的空间簇。与其他一些聚类方法(如 K-Means)相比,无需预设聚类数。

(3)超图卷积

介绍了利用基于图形的神经网络来预测地铁流量。然而,图卷积不能直接应用于超图。超图谱卷积是由超图学习理论和传统的图卷积推导而来的。归一化超图割的谱超图分割问题是超图理论中的一个基本问题。在超图划分问题的研究中,提出了超图拉普拉斯算子,为超图学习提供了一个桥梁。文章该部分为超图卷积理论的介绍,公式居多,不再进行详细描述。

(4)动态时空超图神经网络

在推导出谱超图卷积之后,构造时间卷积层以捕获时间维度的客流特征并组成时空卷积块,这是整个模型的主体部分。模型框架下图所示。网络的输入是三个不同时间跨度的重归一化超图拉普拉斯算子和地铁客流的训练数据集。模型主要是由超图卷积层和时间卷积层组成的时空块。时空块的输出是节点级别的预测,最后将其融合,输出每个站点的预测结果。

时空块由两个时间卷积层和一个光谱超图卷积层组成。光谱超图卷积层提取空间特征,能够很好的描述地铁拓扑结构。时间卷积层旨在提取特征用来描述客流沿时间轴的变化。时间卷积层在每个顶点上采用并行的自适应剩余门控线性单元(GLU)。对于输入y = [y1, y2,…,yt],算法首先对输入同时进行两个一维卷积运算。这两个卷积操作在格式上是相同的,但是权值是不同的。在卷积之后,一个结果将被sigmoid函数激活,而另一个结果不被激活。这个方程可以表示为:

用扩展卷积代替普通的一维卷积,使模型能够捕捉到长距离的特征。由于第一个卷积不被激活,因此门控结构可以处理梯度消失的问题。由于输入和输出的维度相同,残差结构可以集成到单元中,如下图所示,然后信息可以通过多个通道传输。

时间卷积表示为:

时空卷积块由空间层和时间层组成,可以描述为状态更新公式:

节点级预测结果将通过一个全连接层输出,将多通道映射为单个通道。然后将三个不同时间跨度的结果与权重融合。训练超图神经网络的过程也是训练融合权重的过程:

因此,模型的最终损失函数可以表示为:

5.实验

对北京和杭州的历史全尺度地铁流量数据集进行了实验研究。首先介绍数据集的细节。首先进行了全天候实验,并与现有基线进行了比较,对模型进行了整体评价,验证了模型的实用性和有效性。然后重点介绍了对当前智能交通系统最具有指导意义和实际应用价值的峰值和平峰期的实验。通过消融实验来评价所提出的骨架的各个组成部分。异常情况下的实验和时间消耗实验表明了该方法的可行性。

Attention

如果你和我一样是轨道交通、道路交通、城市规划相关领域的,可以加微信:Dr_JinleiZhang,备注“进群”,加入交通大数据交流群!希望我们共同进步!

基于动态超图卷积网络的地铁客流预测相关推荐

  1. 基于智能卡数据的特殊事件地铁客流预测

    文章信息 <Subway Passenger Flow Prediction for Special Events Using Smart Card Data>是2020年发表在期刊IEE ...

  2. ⑭【动态时空图卷积网络 · 注意力 · 交通速度预测】时空依赖关系挖掘 | 动态时空建模 | 智能交通系统 |

    所谓成功,就是用自己的方式度过人生. ----<明朝那些事儿>作者,当年明月

  3. 【第51篇】用于交通预测的时空交互动态图卷积网络

    摘要 https://arxiv.org/abs/2205.08689 精确的交通预测对于城市交通控制.路线规划和流量检测都是至关重要的.虽然目前提出了许多时空分析方法,但在同步捕捉交通数据的时空依赖 ...

  4. 基于更深卷积网络的大规模图像识别

    本文是 "VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION" 文章的翻译,第一次读外文文献,不知 ...

  5. 多变量干扰事件发生下的地铁客流预测

    文章信息 本周阅读的论文是题目为<Forecasting the subway passenger flow under event occurrences with multivariate ...

  6. 基于深度ST-残差网络的城市人流量预测 读书笔记

    Deep Spatio-Temporal Residual Networks for Citywide Crowd Flows Prediction 中文提示:基于深度ST-残差网络的城市人流量预测 ...

  7. AAAI 2021 | 基于动态混合关系网络的对话式语义解析方法

    作者|惠彬原,耿瑞莹,黎槟华,李永彬,孙健 单位|阿里巴巴达摩院Conversational AI团队 引言 机器可以自己写 SQL 语句吗?当然可以~只需要用自然语言描述你的想法即可,甚至还能进行多 ...

  8. 基于三维时空卷积网络的自监督点云预测(CoRL2021)

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 来源丨泡泡机器人SLAM 作者丨泡泡机器人 标题:Self-supervised Point Clou ...

  9. 【工大SCIR】基于动态图交互网络的多意图口语语言理解框架

    论文名称:AGIF: An AdaptiveGraph-Interactive Framework for Joint Multiple Intent Detection and SlotFillin ...

  10. 基于一维度卷积网络的的近红外光谱建模

    系列文章目录 近红外光谱分析技术属于交叉领域,需要化学.计算机科学.生物科学等多领域的合作.为此,在(北京邮电大学杨辉华老师团队)指导下,近期准备开源传统的PLS,SVM,ANN,RF等经典算和SG, ...

最新文章

  1. python sort函数返回值_lambda函数与箭头函数在集合内置函数应用中的对照学习
  2. 团队作业1(陈爽、夏江华、李瑞超、甘彩娈、吕乐乐)
  3. 皮一皮:化学解释为什么喝醉了容易像狗一样...
  4. Java虚拟机:JVM 主要组成部分与内存区域
  5. python实现合并链表_python:16.合并两个排序的链表
  6. 【渝粤教育】国家开放大学2018年秋季 0299-21T中国古代文学(1) 参考试题
  7. Linux在U盘安装python的过程详解
  8. 不懂电脑如何买电脑_买电脑交智商税?5分钟看懂笔记本电脑配置
  9. 引用类型 —— Array类型
  10. Atitit. .net c# web 跟客户端winform 的ui控件结构比较
  11. c++播放音频( c++ play audio),为C++应用程序添加启动音效
  12. windows如何安装pycharm2022版本?pycharm如何安装汉化语言包{www.423zy.com}
  13. 通达信股票软件日线数据分析
  14. java代码实现雷达图_雷达图的一种实现! Cocos Creator !
  15. oracle常见语句(转载)
  16. 不让用计算机怎么回怼,当别人怼你时,如何优雅地怼回去
  17. Python全量字段校验
  18. JavaScript高阶
  19. 二手车数据分析-爬取人人车二十余万条线上二手车数据
  20. 热敏打印机 java实现根据打印机名字实现分别打印小票

热门文章

  1. Mac下解压bin文件
  2. 面向法律领域的罪名预测、问题分类与FAQ问答模型设计与实现【NLP】
  3. Liang-Barsky裁剪算法
  4. 出中的意思是什么_从里出来是什么意思
  5. Lisp自动画梯形_CAD lisp 求助一段代码实现自动画弧!
  6. ztree 更新配置后重新渲染树_zTree 树形控件 ajax动态加载数据
  7. uniapp ios 沙盒测试支付(苹果支付)
  8. Macbook Pro M1(macOS 12.0)读取NTFS移动硬盘方法
  9. 主动降噪python_尝试使用Pyadi主动降噪时遇到错误
  10. 关于Kris最近发布的SlidingMenu的兼容问题