1、文章信息

《Deep Spatio-Temporal Residual Networks for Citywide Crowd Flows Prediction》。

2017年AAAI大会的一篇会议论文,作者微软研究院的张俊波,会后文章发在爱斯维尔旗下期刊Artificial Intelligence(IF:3.034),目前被引257次。

2、摘要

本文提出了一种基于深度学习的方法,称为时空残差网络ST-ResNet,来同时预测城市中每个区域的流入和流出客流量。更具体地说,我们使用残差神经网络框架来对拥堵流的时间临近性、周期和趋势特性建模(closeness, period, trend,暂且这样翻译吧)。针对每个属性,我们设计了三个残差网络分支,每个残差网络分支对拥堵流的空间特性进行分别建模,ST-ResNet动态整合三个残差网络分支的输出,为不同的分支和区域分配不同的权重。然后将整合结果进一步结合外部因素(external),如天气和一周中的哪一天,来预测每个地区最终流量。北京和纽约市(NYC)的实验表明,提出的ST-ResNet优于六种著名的方法。

3、简介

简介部分用了北京和纽约的两个拥堵踩踏案例引出,第一次见。然后强调介绍了本文同时预测inflow和outflow。同时预测流入流和流出流由于以下因素的影响极具挑战性:

空间依赖性spatial dependency:邻近区域的流入流和流出流相互影响。

时间依赖性temporal dependency:临近时刻的影响,前一天,上一周,季节性等周期特性。

外部因素的影响external factors:天气和突发事件等。

本文的四点主要内容:

1、ST-ResNet采用基于卷积的残差网络对城市中任意两个区域之间的远近空间依赖关系进行建模,同时保证模型的预测精度不受神经网络深度结构的影响。

2、我们将人群流动的时间特性归纳为三类,即时间邻近性、周期性和趋势性。ST-ResNet使用三个残差网络分支分别对这些特性进行建模。

3、ST-ResNet动态地聚合上述三个网络的输出,为不同的分支和区域分配不同的权重。这种聚集进一步与外部因素(如天气)相结合。

4、我们使用北京出租车的轨迹和气象数据,以及纽约自行车的轨迹数据来评估我们的方法。

4、模型介绍

在本研究中,我们根据经纬度将一个城市划分为I×J网格地图,其中网格表示一个区域,如图2(a)所示。设P为第t个时间区间的轨迹集合。网格(i,j)位于第i行和第j列。和既有研究类似,也是将流入流和流出流叠在一起看成一个2×I×J的张量(2个channel,每个channel为I行J列)

网络结构示意图

该网络结构主要由4部分组成,分别提取时间邻近性、周期性、趋势性以及外部因素的影响。

上图右上角,首先将一个城市在每个时间间隔内的流入流和流出流分别转化为一个2通道的类图矩阵,然后我们将时间轴划分为三个片段,表示最近的时间、稍远的时间和遥远的时间(其实文章中这块就是考虑了邻近时间段,前一天相同时间段,上一周相同时间段)。每一个片段分别被输入到三个ResNet分支中用来提取提取时间邻近性、周期性、趋势性。前三个部分与卷积神经网络共享相同的网络结构,然后是残差单元序列。这种结构捕捉了附近和远处区域之间的空间依赖关系。在外部因素的处理上,我们手动从外部数据集中提取一些特征,例如天气条件和事件,并将它们输入一个两层全连接的神经网络。前三部分的输出与外部因素的输出进行融合,然后利用tanh激活函数映射到(-1,1)区间内作为输出。

前三部分的网络结构:

外部因素:

交通流量可以受到许多复杂的外部因素的影响,如天气和事件。图5(a)显示节假日(中国春节)的人流与平时的人流有很大的不同。图5(b)显示,与后一周的同一天相比,暴雨使得办公区域的人流急剧减少。

设Et为表示这些外部因素在预测时间区间t的特征向量。在本文中,我们主要考虑天气、假日事件和元数据(即工作日、工作日/周末)。为了预测t时段的流量,可以直接获取假日事件和元数据。然而,未来时间间隔t的天气是未知的,可以使用时间间隔t的天气预报或时间间隔t - 1的近似天气预报。在形式上,我们将两个全连接层叠加在Et上,第一层可以看作是每个子因子的带激活函数的嵌入层。第二层用于将上一层的输出映射成与Xt相同形状便于融合。

融合:

对于前三部分的融合,由于不同区域都受时间邻近性、周期性、趋势性的影响,但影响程度可能不同。在此基础上,提出了一种基于参数矩阵的融合方法:

对于前三部分和外部因素的融合,直接相加再激活:

损失函数:MSE。

5、模型超参数

在ST-ResNet的输出中,使用tanh作为最后的激活函数,其范围在-1到1之间。使用Min-Max归一化方法将数据缩放到[- 1;1]。在评估中,我们将预测值重新缩放到正常值,并与ground truth进行比较。对于外部因素,我们使用one hot编码来转换元数据(即, Day Of Week, Weekend/Weekday),节假日和天气条件为二元向量,利用Min-Max归一化将温度和风速等缩放为[0;1]。

使用Python中的 Theano和Keras构建模型。Conv1和所有剩余单元使用64个尺寸为3×3的滤波器,Conv2使用2个尺寸为3×3的滤波器进行卷积。批次大小为32。90%的训练集,剩下的10%作为验证集。在固定数量的epoch(例如10,100个epoch)的完整训练数据上训练模型。考虑前一天和上一周的数据。评价指标RMSE。

6、实验部分

本文采用了两个案例,北京的出租车轨迹数据和纽约的共享单车轨迹数据,数据量和数据范围都很大,实验部分比较复杂,没什么特别大的借鉴意义,不再赘述。

7、思考

该篇论文也用到了前面共享过的纽约公开的共享单车轨迹数据集。

此外,该类复杂结构模型的一个鸡肋点是如何选择基准进行比较,输入因素这么多,其他基准模型输入是什么,模型配置是什么样的,这在既有文献中大多是直接给出结果,过程基本是一个黑箱子,目前也没有统一的解决办法。

Attention

如果你和我一样是轨道交通、交通运输、城市规划相关领域的,也愿意分享自己的科研生活,请加微信:Dr_JinleiZhang,备注“进群”,我会拉你进交通大数据分享群!希望我们共同进步!

Transportation-ML

与你分享科研成长的乐趣

长按二维码关注

基于ResNet深度时空残差网络的城市交通流预测相关推荐

  1. 深度时空残差网络在城市人流量预测中的应用

    文章目录 摘要 简介 预备知识 人流量问题的制定 深度残差学习 深度时空残差网络 前三个成分的结构 外部组件的结构 融合 算法和优化 实验 设置 结果TaxiBJ 结果BikeNYC 相关工作 总结及 ...

  2. unet是残差网络吗_基于深度监督残差网络的肝脏及肝肿瘤分割

    摘要: 针对医生手动对肝脏肿瘤CT图像分割耗时,耗力,且易受主观判断影响的问题,该研究提出一种深度监督残差网络(Deeply Supervised Residual Unet,DS-ResUnet)算 ...

  3. 基于深度ST-残差网络的城市人流量预测 读书笔记

    Deep Spatio-Temporal Residual Networks for Citywide Crowd Flows Prediction 中文提示:基于深度ST-残差网络的城市人流量预测 ...

  4. 基于交通图卷积长短时记忆网络的网络级交通流预测

    文章信息 本周阅读的论文是题目为<Traffic Graph Convolutional Recurrent Neural Network: A Deep Learning Framework ...

  5. (5)基于深度学习的短时道路交通流预测

    交通预见未来 (5)基于深度学习的短时道路交通流预测 1.文章信息 <Short-Term Traffic Flow Prediction with Conv-LSTM>. 这篇文章是一篇 ...

  6. 深度学习——残差网络(ResNet)

    随着卷积神经网络的发展和普及,我们了解到增加神经网络的层数可以提高模型的训练精度和泛化能力,但简单地增加网络的深度,可能会出现"梯度弥散"和"梯度爆炸"等问题. ...

  7. 深度学习——残差网络ResNets

    残差网络 ResNets 是由残差块(Residual block)构建的,首先我解释一下什么是残差块. 这是一个两层神经网络,在

  8. 机器学习作业-FOGS: 基于学习图的一阶梯度监督交通流预测

    文章目录 FOGS: First-Order Gradient Supervision with Learning-based Graph for Traffic Flow Forecasting 摘 ...

  9. resnet结构_ResNet 残差网络论文阅读及示例代码

    论文阅读 其实论文的思想在今天看来是不难的,不过在当时 ResNet 提出的时候可是横扫了各大分类任务,这个网络解决了随着网络的加深,分类的准确率不升反降的问题.通过一个名叫"残差" ...

  10. 重读DRRN(深度递归残差网络)

    本文采取了全局残差和局部残差学习,来减轻训练深层网络的难度,递归学习来控制模型的参数且可以有效的控制模型的参数. 上图表示各个算法的性能对比图.其中x轴表示参数量,y轴表示psnr.其中三角表示不超过 ...

最新文章

  1. UnicodeDecodeError: 'utf8' codec can't decode byte 0xb1 in position 0: invalid start byte
  2. 神经网络为何非激活函数不可?
  3. aps是什么意思_全画幅大还是中画幅大? 为什么说底大一级压死人
  4. 巧妙算法:找出数组中消息的数字
  5. 小白入门深度学习 | 第四篇:配置PyTorch环境
  6. 元宇宙iwemeta: 2021年云计算行业发展研究报告
  7. 【C#】详解使用Enumerable.Distinct方法去重
  8. MySQL之父与企鹅的故事
  9. Unity 3D学习笔记之一 界面介绍
  10. java web 静态_「Java Web」主页静态化的实现
  11. 学python开发必须要会wsgi么_python Web开发你要理解的WSGI uwsgi详解
  12. c语言内存分配与释放 不同类别变量的内存分配和释放的区别
  13. SharePoint Framework 企业向导(三)
  14. 一个值得思考的赚钱模式
  15. HDU1106 排序(解法二)(废除!!!)
  16. 专家全方位剖析网页木马
  17. 菜鸟教程ajax概念原理及使用
  18. 电商挖角潮起:工作两年百万年薪
  19. UltraEdit自动化脚本
  20. MATLAB小波变换的图像融合系统[完美运行,GUI界面,详细教程,万字文稿]

热门文章

  1. 阿里云 maven 镜像地址
  2. 【渝粤题库】陕西师范大学201821 宋词研究 作业(专升本)
  3. 单片机特殊知识总结(二)
  4. Java Socket 编程学习(5) TCP UDP总结
  5. java计算机毕业设计九宫格日志网站源码+数据库+系统+lw文档+mybatis+运行部署
  6. 网吧计费管理系统(武汉理工大学大一下实验(C语言版源码))
  7. 从饭店运作看mina线程模型
  8. 百度离线地图示例之一:地图展示
  9. 超级外链工具:一款超级外链SEO工具源码
  10. 计网-基于Cisco模拟器