这是一篇发表在IEEE TRANSACTIONS ON INTELLIGENT TRANSPORTATION SYSTEMS上的论文,论文主要描述了一种刻画出行规律性的方法。

1.论文概述

论文主要描述了一种刻画出行规律性的方法。首先,论文给出了对出行活动序列(travel event)进行数学化描述的方法;在这之后,作者给出了基于出行活动序列的规律性度量方法。
对于作者所提出的这种规律性度量方法,他们认为最大的创新在于他们所提出的这种方法是calendar free的,这是什么意思呢?以前大家经常把regularity和periodicity在一定程度上画上等号,但是作者专门强调这两者是不同的。诚然,periodicity是一种regularity,但是regularity并不一定是periodicity的。举个例子,有个出行者有时候周五出城去郊游,然后周日回,有时候周六出城去郊游,然后周一回。这在日期表上不是periodicity的,但是他的行为展现出了一定的regularity。作者说他们提出的这个方法可以得到regularity,即calendar free。

2.方法论

2.1 出行活动序列的数学化表达

作者首先介绍了出行活动序列的数学化表达。首先把一个人的出行活动序列视作是一个随机过程Xu\pmb{X}_uXu​,这个随机过程生成一个活动,该活动是一个随机变量,用XuX_uXu​来表示。XuX_uXu​生成具体的活动xxx,其中x∈Eux\in{E_u}x∈Eu​,EuE_uEu​就是随机变量XuX_uXu​所有可能的集合。在这里,作者假设活动都是离散的,即使是连续的也可以通过一定的手段离散化,因此这个假设也是没问题的。这样一来,一个人的活动序列便可以表示为Xu={...,X−1,X0,X1,X2,...}\pmb{X_u}=\{...,X_{-1},X_0,X_1,X_2,...\}Xu​={...,X−1​,X0​,X1​,X2​,...}。这个活动变量序列生成具体的活动也就是个体u的活动序列了。其中每个活动变量都会以一定的概率分布生成活动,该概率分布可以写成p(x)=Pr{Xu=x},x∈Eup(x)=Pr\{X_u=x\},x\in{E_u}p(x)=Pr{Xu​=x},x∈Eu​。
文章举了一个下图的实例,对于一个从家去工作,再去饭馆吃饭,再回家的人,他可以进行如下的序列化表达。不同的研究目标和不同的数据粒度,可以进行不同的序列化表达,下图给了一些示范。

2.2 regularity度量

文章给出了两种度量方式,第一种是用Entropy,第二种是用Entropy Rate,作者分别解释了两种不同度量手段区别,并进行了一些较深入的分析。
其中Entropy来度量的话是没有考虑顺序的,也就是活动序列的顺序实际上被忽略掉了,而只是考虑了活动的重复性,也就是说对于一个人是:家庭->上班->饭店->家庭,还是:家庭->饭店->上班->家庭,是没什么区别的,因为只是计算这个序列的Entropy而已。Entropy的计算可以通过下式进行。

而Entropy Rate则不同,Entropy Rate是考虑了序列的顺序的,其计算公式如下:

可以证明上式的计算可以被转化为:

文章提到:entropy rate measures the average entropy of each new event generated
by random process X, accounting for preceding events.entropy rate计算得到的是一种考虑之前的活动的entropy的平均值。如果之前的活动可以完全确定后一个活动,那么entropy rate=0。因此也可以自然而然的想到对于同一个活动序列的entropy和entropy rate的差值就反应出了前面的活动与接下来将发生的活动的相关性。

2.3 entropy rate 的计算

作者提到 entropy rate的计算可以使用朴素暴力法,但是朴素暴力法对于较长的序列就不适用了。 entropy rate也可以用CTW、BWT、LZ等方法进行计算,作者最后使用了BWT算法来对entropy rate进行估算,文章还给了一个例子阐述BWT算法的原理。

3.实例分析

作者用长达一个月时间的公交IC卡数据分析了每个出行者的regularity,其实就是计算出每个人的entropy rate和entropy。
首先,自然是需要将出行者的出行活动序列进行序列化表达,如下图所示:图a是比较完整信息的出行序列,图b就是最终使用的出行序列,可见作者忽略掉了活动的duration。

然后作者算出了每个出行者的entropy rate和entropy。结果分别如下两图所示。图c是两者的差,其大小其实就是反应了该出行者的行为的可预测性,越大,就代表可预测性越大,越接近0,说明可预测性越小。

参考文献

Goulet-Langlois, G. , Koutsopoulos, H. N. , Zhao, Z. , & Zhao, J. . (2018). Measuring regularity of individual travel patterns. IEEE Transactions on Intelligent Transportation Systems, 1583-1592.

论文阅读Measuring Regularity of Individual Travel Patterns相关推荐

  1. 【论文阅读】7-Discovering Structural Regularity in 3D Geometry

    [论文阅读]7-Discovering Structural Regularity in 3D Geometry 1.Input: 2.Processing pipeline 2.1.Transfor ...

  2. Are VQA Systems RAD? Measuring Robustness to Augmented Data with Focused Interventions 论文阅读笔记

    Are VQA Systems RAD? Measuring Robustness to Augmented Data with Focused Interventions 论文阅读笔记 一.Abst ...

  3. 论文阅读2018-10-13

    论文阅读2018-10-13 Addressing the minimum fleet problem in on-demand urban mobility 原文及翻译 METHODS Addres ...

  4. 【论文阅读】A Gentle Introduction to Graph Neural Networks [图神经网络入门](7)

    [论文阅读]A Gentle Introduction to Graph Neural Networks [图神经网络入门](7) Into the Weeds Other types of grap ...

  5. [论文阅读] (22)图神经网络及认知推理总结和普及-清华唐杰老师

    <娜璋带你读论文>系列主要是督促自己阅读优秀论文及听取学术讲座,并分享给大家,希望您喜欢.由于作者的英文水平和学术能力不高,需要不断提升,所以还请大家批评指正,非常欢迎大家给我留言评论,学 ...

  6. [论文阅读] (12)英文论文引言introduction如何撰写及精句摘抄——以入侵检测系统(IDS)为例

    <娜璋带你读论文>系列主要是督促自己阅读优秀论文及听取学术讲座,并分享给大家,希望您喜欢.由于作者的英文水平和学术能力不高,需要不断提升,所以还请大家批评指正,非常欢迎大家给我留言评论,学 ...

  7. 【论文阅读】Attention Based Spatial-Temporal GCN...Traffic Flow Forecasting[基于注意力的时空图卷积网络交通流预测](1)

    [论文阅读]Attention Based Spatial-Temporal Graph Convolutional Networks for Traffic Flow Forecasting[基于注 ...

  8. [论文阅读] (24) 向量表征:从Word2vec和Doc2vec到Deepwalk和Graph2vec,再到Asm2vec和Log2vec(一)

    <娜璋带你读论文>系列主要是督促自己阅读优秀论文及听取学术讲座,并分享给大家,希望您喜欢.由于作者的英文水平和学术能力不高,需要不断提升,所以还请大家批评指正,非常欢迎大家给我留言评论,学 ...

  9. 论文阅读2 Dynamic Routing Between Capsules

    论文阅读<2> Dynamic Routing Between Capsules Abstract 1 Introduction 2 How the vector inputs and o ...

最新文章

  1. 看BAT技术面试官如何挑选Java程序员
  2. * ngIf和* ngFor在同一元素上导致错误
  3. 【django轻量级框架】在线视频教育系统设计与实现
  4. 制作系统盘,重装新系统。
  5. linux-ftools查看Linux 的cached里面有哪些内容
  6. Windows live writer插入代码图片Test
  7. java url utf 8_java中文乱码解决之道(八)—–解决URL中文乱码问题
  8. 网络***检查分析---破解安全隐患问题回答
  9. CURL的学习和应用
  10. mysql必须记住的单词_如何真正记住英语单词?
  11. c++编游戏-扫雷-c++游戏将彩色化-windows7自带扫雷游戏休闲娱乐
  12. 西门子S7-1200系列PLC Modbus通信的踩坑记录
  13. Rasa课程、Rasa培训、Rasa面试系列之: Rasa客户案例T-Mobile电信公司
  14. 高效能人士的七个习惯(一)由内而外全面造就自己
  15. (C语言)实验4 循环结构程序设计
  16. MySQL计算天数差
  17. 气动人工肌肉的应用概况
  18. Dell OptiPlex 7090插入耳机有声音没有麦克风的解决方案
  19. 古典问题:有一对兔子,从出生后第3个月起每个月都生一对兔子,小兔子长到第三个月后每个月又生一对兔子,假如兔子都不死,问每个月的兔子总数为多少?
  20. 智力题及答案(包含梅氏砝码问题)

热门文章

  1. 华为M3平板升级鸿蒙系统,华为m3平板 日版刷国行 没有重力感应怎么解决?(篇二)...
  2. Docker容器获取局域网ip(使用macvlan)
  3. 解读 | 计算机视觉已超越人类眼睛?
  4. 安卓巴士总结了近百个Android优秀开源项目
  5. 取消usb计算机连接网络,usb连接(如何设置usb网络连接)
  6. 如何利用python将excel表格中筛选出来的每一份数据各自另存为新的excel文件?
  7. win7下用VS2008写视频聊天程序,求VFW教程?qzvgK
  8. Python喜马拉雅有声小说音频文件爬虫
  9. 《刷新》精髓:微软第三任CEO萨提亚•纳德拉重新发现微软灵魂的传奇历程,给了我们普通人哪些启示?
  10. 【网络通信】Teardrop编程创造虚假IP包