【论文】时空预测模型Spatio-Temporal Graph Convolutional Networks
STGCN流量预估模型论文解读
《Spatio-Temporal Graph Convolutional Networks: A Deep Learning Framework for Traffic Forecasting》,Bing Yu, Haoteng Yin, Zhanxing Zhu,Peking University, Beijing, China
背景
流量预估 traffic forecast for short-term (5∼30min), medium and long term (over 30min).
本文提出一个深度学习框架Spatio-Temporal graph convolutional network, 用图网络来建模交通网络,用卷积网络建模time axis. 这是第一次在交通研究中应用纯卷积结构从图结构时间序列中同时提取时空特征。
交通预测数据
这是经典的时间序列预测问题,用vt及其前M个时间点,预测v_t+1及其后H个时间点:
在这里,我们用graph来表示每一个v_t, 如下图
每一个v_t(即每一张图)表示一个时刻,包含n个顶点,模拟的是n个传感器的结果。每M张图构成一条数据
模型结构
模型结构:两层时空卷积块+输出层,其中,时空卷积块由 时域卷积块1 + 空域卷积块 + 时域卷积块2 组成
时域卷积块在每个时间步之间进行;空域卷积块在每个时间步内进行
时域卷积块
输入: X ∈ R M ∗ n ∗ C i X \in R^{M* n* C_i} X∈RM∗n∗Ci, 文中 C i C_i Ci设为了1
对于每一个节点来说,维度是 R M ∗ C i R^{M*C_i} RM∗Ci,
卷积的kernel维度是 K ∈ R K ∗ 2 C o K \in R^{K* 2C_o} K∈RK∗2Co,
所以,一维卷积的输出维度是 R ( M − K + 1 ) ∗ 2 C o R^{(M-K+1)*2C_o} R(M−K+1)∗2Co
P、Q is split in half with the same size of channels, 维度分别是 R ( M − K + 1 ) ∗ C o R^{(M-K+1)*C_o} R(M−K+1)∗Co, 再通过一个GLU激活层
对于一张完整的时空卷积图,输入是 X ∈ R M ∗ n ∗ C i X \in R^{M* n* C_i} X∈RM∗n∗Ci, 输出是 Y ∈ R ( M − K + 1 ) ∗ C 0 Y \in R^{(M-K+1)* C_0} Y∈R(M−K+1)∗C0
空域卷积块
切比雪夫图卷积公式:
解释:
L ~ = 2 L λ m a x − I n \tilde{L} = \frac{2L}{\lambda_{max}} - I_n L~=λmax2L−In,
L = I n − D − 1 / 2 A D − 1 / 2 L = I_n - D^{-1/2}AD^{-1/2} L=In−D−1/2AD−1/2, 是图的对称归一化laplacian矩阵
D D D为图的度矩阵, A A A为图的邻接矩阵, we can further assume that λ m a x ≈ 2 \lambda_{max} ≈ 2 λmax≈2
T k ( L ~ ) T_k(\tilde{L}) Tk(L~)是 k k k阶在scaled拉普拉斯量处求值的切比雪夫多项式, 即它取决于中心节点的最近的 k t h k^{th} kthorder 的邻居节点(邻居节点和中心节点的距离最大为K)
T i ( x ) = 2 x T i − 1 ( x ) − T i − 2 ( x ) T_i(x) = 2xT_{i-1}(x) - T_{i-2}(x) Ti(x)=2xTi−1(x)−Ti−2(x), 其中 T 0 = 1 , T 1 = x T_0=1, T_1=x T0=1,T1=x
θ \theta θ是多项式系数
假设,传播邻居层数 k = 1 , λ m a x = 2 k=1,\lambda_{max} =2 k=1,λmax=2, 可得
最终,带有C_i个channels的图卷积可以表示为:
输出 X ∈ R M ∗ n ∗ C i X \in R^{M*n*C_i} X∈RM∗n∗Ci, 输出 Y ∈ R M ∗ n ∗ C o Y \in R^{M*n*C_o} Y∈RM∗n∗Co
输出层
输出层 = 时域卷积层 + 全连接层
每经过一个时域卷积块,维度减少 K − 1 K-1 K−1, 一共会经过四个,所以,输入输出层的维度是 R M − 4 ( K − 1 ) ∗ n ∗ C o R^{M-4(K-1)*n*C_o} RM−4(K−1)∗n∗Co
我们将时域卷积层的kernel维度和input一样,这样可以将其映射到n*C_o上,就是最终的输出
全连接层 w x + b wx+b wx+b, w ∈ R C o w \in R^{C_o} w∈RCo, 最终 v t ∈ R n v_t \in R^{n} vt∈Rn
Ref
STGCN 是处理结构化时间序列的通用框架。它不仅能够解决交通网络建模和 预测问题,而且可以应用于更一般的时空序列学习任务。
时空卷积块结合了图卷积和门控时间卷积,能够提取出最有用的空间特征,并 连贯地捕捉到最基本的时间特征。
该模型完全由卷积结构组成,在输入端实现并行化,参数更少,训练速度更 快。更重要的是,这种经济架构允许模型以更高的效率处理大规模网络。
【论文】时空预测模型Spatio-Temporal Graph Convolutional Networks相关推荐
- 【论文导读】- EvolveGCN: Evolving Graph Convolutional Networks for Dynamic Graphs(EvolveGCN:用于动态图的演化图卷积网络)
文章目录 论文信息 摘要 evolving graph convolutional network 图卷积网络 (GCN) 权重更新 Evolving Graph Convolution Unit ( ...
- 基于图卷积的价格推荐论文(Price-aware Recommendation with Graph Convolutional Networks)
基于图卷积的价格推荐论文概述 ICDE2020非常好的文章 Price-aware Recommendation with Graph Convolutional Networks paper lin ...
- [LGCN论文笔记]:Large-Scale Learnable Graph Convolutional Networks
文章目录 Abstract 补充:如何理解 inductive learning 与 transductive learning? 1. Introduction 2. Related Work 图卷 ...
- 论文阅读课1-Attention Guided Graph Convolutional Networks for Relation Extraction(关系抽取,图卷积,ACL2019,n元)
文章目录 abstract 1.introduction 1.1 dense connection+GCN 1.2 效果突出 1.3 contribution 2.Attention Guided G ...
- 论文阅读_Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recognition
Abstract 人体骨架动力学为人体动作识别提供了重要信息.传统的骨架建模方法通常依赖于手工制作的部件或遍历规则,从而导致表达能力有限和泛化困难.在这项工作中,我们提出了一种新的动态骨架模型,称为时 ...
- 论文浅尝 | GEOM-GCN: Geometric Graph Convolutional Networks
论文笔记整理:毕祯,浙江大学硕士,研究方向:知识图谱.自然语言处理. 动机 消息传递神经网络(MPNN)已成功应用于现实世界中的各种应用中.但是MPNN聚合器的两个基本弱点限制了它们表示图结构数据的能 ...
- 【论文阅读】Spatio-Temporal Graph Convolutional Networks:...Traffic Forecasting[时空图卷积网络:用于交通预测的深度学习框架](1)
[论文阅读]Spatio-Temporal Graph Convolutional Networks: A Deep Learning Framework for Traffic Forecastin ...
- SGC - Simplifying Graph Convolutional Networks 简化的图卷积网络 论文详解 ICML 2019
文章目录 1 相关介绍 1.1 Simple Graph Convolution (SGC)提出的背景 1.2 SGC效果 2 Simple Graph Convolution 简化的图卷积 2.1 ...
- 【论文翻译】GCN-Semi-Supervised Classification with Graph Convolutional Networks(ICLR)
学习总结 传统深度学习模型如 LSTM 和 CNN在欧式空间中表现不俗,却无法直接应用在非欧式数据上.因此大佬们通过引入图论中抽象意义上的"图"来表示非欧式空间中的结构化数据,并通 ...
- GCN - Semi-Supervised Classification with Graph Convolutional Networks 用图卷积进行半监督节点分类 ICLR 2017
目录 文章目录 1 为什么GCN是谱图卷积的一阶局部近似?- GCN的推导 谱图卷积 Layer-wise Linear Model(逐层线性模型) 简化:K=1(2个参数的模型) 简化:1个参数的模 ...
最新文章
- 为什么分布式一定要有redis?
- VTK:直线网格之VisualizeRectilinearGrid
- Centos7.X通过rpm包安装Docker
- 女朋友当众甩了我一巴掌,我扑上去......
- 华锋e路航x10升级工具_万商云集:疫情下火爆的电子合同,背后是企业数字化升级的必然...
- 凌晨一点的粤海街道对抗来自美国的力量|湾区人工智能
- osx10.15.5降级成10.3.3
- python获取同音字
- Dirichlet Process 和 Dirichlet Process Mixture模型
- php 5.6.6.tar.gz.asc,Signature Checking Using GnuPG
- MariaDB 10.3 解决掉了UPDATE不支持同一张表的子查询更新
- 研究生开口月薪一万 企业暗示“靠边站”
- 计算机网络 故障处理,浅析计算机网络常见故障处理及维护方法
- IE Tab:让你的Chrome浏览器兼容IE
- 几个在线的web代理
- 短视频SDK测试tips
- 终于来了!腾讯数据分析证书!
- Polar码的C语言实现之比特反序重排篇
- [数据分析笔记] 网易云歌单分析系列03—pyecharts折线图
- Joystick Shield 的使用方法