详见:https://blog.csdn.net/zuiyishihefang?t=1

1、文章信息

《Spatio-Temporal Graph Convolutional Networks: A Deep Learning Framework for Traffic Forecasting》。

2017年第二十七届IJCAI国际人工智能联合会议的一篇会议论文,作者是北京大学数学科学学院的一名博士生余冰,被引53次。(可能是由于非专业计算机,里面的很多计算机的东西介绍的比较模糊,且更偏重数学推导。)

2、摘要

在本文中,我们提出了一个新的深度学习框架,时空图卷积网络(STGCN),解决交通领域的时间序列预测问题,我们没有使用常规的CNN和RNN单元,而是将问题用图表示出来,并建立具有完整卷积结构的模型,这使得模型训练速度更快,参数更少。实验表明,STGCN模型通过对多尺度交通网络的建模,有效地捕获了时空相关性。

3、简介

对于深度学习方法而言,常规CNN只能处理网格结构(如图像、视频),而不处理一般网络结构,而RNN需要迭代训练,引入了逐级累积的误差,且基于RNN的网络(包括LSTM)难以训练,计算量大。为了克服这些问题,我们引入了几种策略来有效地对交通流的时间动态和空间依赖性进行建模。为了充分利用空间信息,我们没有单独处理交通网络,而是用一般的图来对其进行建模(例如网格或路段)。为了解决递归网络的固有不足,我们在时间轴上采用了全卷积结构。总之,我们提出了一种新的深度学习结构,时空图卷积网络,用于交通预测任务。该体系结构由多个时空卷积块组成,时空卷积块由图卷积层和卷积序列学习层组合而成(参考论文Convolutional neural networks on graphs with fast localized spectral filtering),对时空依赖关系进行建模。据我们所知,这是第一次使用图卷积神经网络结构进行交通预测。

4、基础介绍

在本文中,我们在一个图上定义了交通网络,重点研究了结构化交通时间序列。Vt在图中不是相互独立的,而是通过成对连接起来的。因此,数据点Vt可以看作是一个图信号(也就是文中所说的signal),它定义在一个权值为Wij的无向图(或有向图)G上,如图1所示。

在第t时刻,在图Gt = (Vt, E, W)中,Vt是一个有限的顶点集合,对应于交通网络中n个监测站的观测值;E是一组边,表示站点之间的连通性;当W表示Gt的加权邻接矩阵。

常规网格化的标准卷积显然不适用于一般图。目前,有两种基本方法正在探索如何将CNNs推广到结构化数据表。一种是扩展卷积的空间定义(参考论文Learning convolutional neural networks for graphs),另一种是利用图的傅里叶变换在光谱域中进行操作(参考论文Spectral networks and locally connected networks on graphs)。前一种方法将顶点重新排列成特定的网格形式,这些网格形式可以通过常规的卷积操作来处理。后者引入了频谱框架,将卷积应用于频谱域,通常称为频谱图卷积。后续的几项研究通过将计算复杂度从O(n2)降低到线性,使得图卷积更有前景(参考论文1:Convolutional neural networks on graphs with fast localized spectral filtering,参考论文2:Semi-supervised classification with graph convolutional networks)。

5、模型框架

如图2所示,STGCN由多个时空卷积块组成,每个卷积块组成类似于“三明治”结构,其中包含两个门控顺序卷积层和一个空间图卷积层。每个模块的细节如下。(最右边的组成中间的,中间的组成左边的,这种表示方法也是有点奇怪)

5.1 Graph CNNs提取空间特征

交通网络一般以图形结构组织。用图来表示道路网络是自然和合理的。然而,以往的研究忽略了交通网络的空间属性,忽略了网络的连通性和全局性,因为它们被划分为多个段或网格。即使使用网格上的二维卷积,由于数据建模的折衷,它也只能粗略地捕获空间局部性。因此,在我们的模型中,将图卷积直接应用于图结构数据,在空间域中提取具有高度意义的模式和特征。式(2)中由于核函数要不断与图的傅里叶基相乘导致计算复杂度很高,本文采用两种近似策略来克服这一问题:切比雪夫多项式近似和1阶近似(推到过程其实可以不用看,直接用推倒结果即可)。近似之后图卷积操作即为:

图卷积也可扩展到多维张量。

5.2 Gated CNN 门控提取时间特征

我们利用时间轴上的整个卷积结构来捕捉交通流的时间动态行为。这种特殊的设计允许通过多层卷积结构实现并行和可控的训练过程。

如图2(右)所示,时域卷积层包含一个一维卷积,其次是门控线性单元(GLU,这个东西文章里面介绍的模模糊糊,没看懂说的是啥)。此外,在叠加的时间卷积层之间还添加了一个残差连接。

5.3 时空卷积块

为了融合时空域的特征,构造了时空卷积块(ST-Conv块)联合处理图结构时间序列。块本身可以根据特定情况的规模和复杂性进行堆叠或扩展。

如图2 (mid)所示,中间的空间层是连接两个时间层的桥梁,通过时间卷积可以实现图卷积到时间卷积的快速时空传播。“三明治”结构还帮助网络充分应用bottleneck策略(即两头大中间小,两边是64个filter,中间是16个filter),通过图卷积层对通道C(也就是filter)进行下缩放和上缩放,实现尺度压缩和特征压缩。此外,每个层都进行了归一化,防止过拟合。在叠加两个ST-Conv块后,我们在最后附加了一个额外的时域卷积层和一个全连通层作为输出层。

模型特点总结:

STGCN是处理结构化时间序列的通用框架。它不仅能够解决交通网络建模和预测问题,而且可以应用于更一般的时空序列学习任务。

时空卷积块结合了图卷积和门控时间卷积,能够提取出最有用的空间特征,并连贯地捕捉到最基本的时间特征。

该模型完全由卷积结构组成,在输入端实现并行化,参数更少,训练速度更快。更重要的是,这种经济架构允许模型以更高的效率处理大规模网络。

6、实验部分

本文的实验也是用了两个数据集来验证(现在都流行两个数据集了么……),并与几个模型进行了对比。

关注微信公众号《当交通遇上机器学习》,

后台回复“数据”即可获取高达175G的四个月的滴滴GPS数据和滴滴订单数据的获取方式,以及从数据处理(Oracle数据库)、模型构建(机器学习)、编程实现(python)到可视化(ArcGIS)等一系列视频教程。

后台回复“纽约”获取美国纽约10年的出租车轨迹数据以及7年的共享单车轨迹数据下载地址。

图卷积神经网络GCN ---如何在交通预测中考虑网络拓扑结构相关推荐

  1. (21) 出行需求预测新视角---基于图卷积神经网络GCN的出租车OD需求预测

    交通预见未来(21): 出行需求预测新视角---基于图卷积神经网络GCN的出租车OD需求预测 1.文章信息 <Origin-Destination Matrix Prediction via G ...

  2. 深入理解图卷积神经网络(GCN)原理

    深入理解图卷积神经网络(GCN)原理 文章目录 深入理解图卷积神经网络(GCN)原理 前言 一.为什么需要GCN 二.GCN的原理 1.图的定义 2.GCN来了 2.1 矩阵计算公式 2.2 以小规模 ...

  3. (15) 基于图卷积神经网络的共享单车流量预测

    交通预见未来(3) 基于图卷积神经网络的共享单车流量预测 1.文章信息 <Bike Flow Prediction with Multi-Graph Convolutional Networks ...

  4. 图卷积神经网络GCN大白话解读!

    何时能懂你的心--图卷积神经网络(GCN) https://zhuanlan.zhihu.com/p/71200936 蝈蝈 把知道的讲清楚.公众号SimpleAI,欢迎来逛逛. 已关注 天雨粟 . ...

  5. 图卷积神经网络(GCN)综述与实现(PyTorch版)

    图卷积神经网络(GCN)综述与实现(PyTorch版) 本文的实验环境为PyTorch = 1.11.0 + cu113,PyG = 2.0.4,相关依赖库和数据集的下载请见链接. 一.图卷积神经网络 ...

  6. DeepLearning | 图卷积神经网络(GCN)解析(论文、算法、代码)

    本篇博客主要讲述三种图卷积网络(Graph Convolutional Network, GCN)的算法原理及python实现,全文阅读时间约10分钟. 博主关于图神经网络的文章 DeepLearni ...

  7. tensorflow lstm 预测_图卷积神经网络GCN与递归结构RNN相结合的时间序列预测

    时间序列预测任务可以按照不同的方法执行.最经典的是基于统计和自回归的方法.更准确的是基于增强和集成的算法,我们必须使用滚动周期生成大量有用的手工特性.另一方面,我们可以使用在开发过程中提供更多自由的神 ...

  8. 图卷积神经网络(GCN)理解与tensorflow2.0代码实现

    图(Graph),一般用 G=(V,E)G=(V,E)G=(V,E) 表示,这里的VVV是图中节点的集合,EEE 为边的集合,节点的个数用NNN表示.在一个图中,有三个比较重要的矩阵: 特征矩阵XXX ...

  9. 【深度学习理论】(5) 图卷积神经网络 GCN

    尽管在过去的几年中,神经网络的兴起与成功应用使得许多目标检测.自然语言处理.语音识别等领域都有了飞跃发展,但是将 RNN 或者GCN这样的深度学习模型拓展到任意结构的图上是一个有挑战性的问题.受限于传 ...

  10. 图卷积神经网络(GCN)入门

    GCN是从CNN来的 CNN成功在欧式数据上:图像,文本,音频,视频 图像分类,对象检测,机器翻译 CNN基本能力:能学到一些局部的.稳定的结构,通过局部化的卷积核,再通过层级堆叠,将这些局部的结构变 ...

最新文章

  1. Windows Server 2008 R2 之二十九故障转移群集(一)(
  2. html手机端适配怎么调试,html5面试常见问题及答案:移动端布局与适配篇
  3. itext转html为pdf 锚点,ITEXT输出pdf..docx
  4. MySQL抓包工具:MySQL Sniffer【转】
  5. 打开My Lead detail page会发生timeout的错误的解决方案
  6. .NET Core微服务 权限系统+工作流(二)工作流系统
  7. 今天,送你一份交通行业最全数据集(共享单车、自动驾驶、网约出租车、交通信号识别)
  8. MySql(四):备份与恢复
  9. Tensorboard 安装及使用
  10. 如何修正Linux下面MySQL中文乱码问题
  11. python运维实战pdf_python运维实例.pdf
  12. 清空oracle的注册表,一键清除 Oracle注册表.bat
  13. java —— int和byte的相互转化工具方法
  14. 计算机网络概述上海电力,上海电力大学2021考研复试计算机网络考试大纲
  15. java migration_EF Add-Migration总结
  16. 网页版第三方登录操作——微信登录
  17. golang-如何用全局参数打印程序运行信息
  18. WIN7卸载IE11回复IE8的方法
  19. 数据结构 | 有关树和二叉树的详解【内附考点精析】
  20. 当罗“工匠”遇上雷“铁匠”

热门文章

  1. asp.net出现【视图状态消息身份验证错误】
  2. Atlassian Confluence安装以及如何更改数据库
  3. nginx编译和调试
  4. Oracle技术之和外键相关的阻塞和死锁问题总结(一)
  5. darknet 的python接口使用
  6. 【Unity Shader】(九) ------ 高级纹理之渲染纹理及镜子与玻璃效果的实现
  7. linux常用命令和关闭防火墙
  8. 房产纠纷官司费用是多少
  9. jdk7 HashSet和HashMap源码分析
  10. 建立类成员函数与字符串的对应关系