论文阅读Measuring Regularity of Individual Travel Patterns
这是一篇发表在IEEE TRANSACTIONS ON INTELLIGENT TRANSPORTATION SYSTEMS上的论文,论文主要描述了一种刻画出行规律性的方法。
1.论文概述
论文主要描述了一种刻画出行规律性的方法。首先,论文给出了对出行活动序列(travel event)进行数学化描述的方法;在这之后,作者给出了基于出行活动序列的规律性度量方法。
对于作者所提出的这种规律性度量方法,他们认为最大的创新在于他们所提出的这种方法是calendar free的,这是什么意思呢?以前大家经常把regularity和periodicity在一定程度上画上等号,但是作者专门强调这两者是不同的。诚然,periodicity是一种regularity,但是regularity并不一定是periodicity的。举个例子,有个出行者有时候周五出城去郊游,然后周日回,有时候周六出城去郊游,然后周一回。这在日期表上不是periodicity的,但是他的行为展现出了一定的regularity。作者说他们提出的这个方法可以得到regularity,即calendar free。
2.方法论
2.1 出行活动序列的数学化表达
作者首先介绍了出行活动序列的数学化表达。首先把一个人的出行活动序列视作是一个随机过程Xu\pmb{X}_uXu,这个随机过程生成一个活动,该活动是一个随机变量,用XuX_uXu来表示。XuX_uXu生成具体的活动xxx,其中x∈Eux\in{E_u}x∈Eu,EuE_uEu就是随机变量XuX_uXu所有可能的集合。在这里,作者假设活动都是离散的,即使是连续的也可以通过一定的手段离散化,因此这个假设也是没问题的。这样一来,一个人的活动序列便可以表示为Xu={...,X−1,X0,X1,X2,...}\pmb{X_u}=\{...,X_{-1},X_0,X_1,X_2,...\}Xu={...,X−1,X0,X1,X2,...}。这个活动变量序列生成具体的活动也就是个体u的活动序列了。其中每个活动变量都会以一定的概率分布生成活动,该概率分布可以写成p(x)=Pr{Xu=x},x∈Eup(x)=Pr\{X_u=x\},x\in{E_u}p(x)=Pr{Xu=x},x∈Eu。
文章举了一个下图的实例,对于一个从家去工作,再去饭馆吃饭,再回家的人,他可以进行如下的序列化表达。不同的研究目标和不同的数据粒度,可以进行不同的序列化表达,下图给了一些示范。
2.2 regularity度量
文章给出了两种度量方式,第一种是用Entropy,第二种是用Entropy Rate,作者分别解释了两种不同度量手段区别,并进行了一些较深入的分析。
其中Entropy来度量的话是没有考虑顺序的,也就是活动序列的顺序实际上被忽略掉了,而只是考虑了活动的重复性,也就是说对于一个人是:家庭->上班->饭店->家庭,还是:家庭->饭店->上班->家庭,是没什么区别的,因为只是计算这个序列的Entropy而已。Entropy的计算可以通过下式进行。
而Entropy Rate则不同,Entropy Rate是考虑了序列的顺序的,其计算公式如下:
可以证明上式的计算可以被转化为:
文章提到:entropy rate measures the average entropy of each new event generated
by random process X, accounting for preceding events.entropy rate计算得到的是一种考虑之前的活动的entropy的平均值。如果之前的活动可以完全确定后一个活动,那么entropy rate=0。因此也可以自然而然的想到对于同一个活动序列的entropy和entropy rate的差值就反应出了前面的活动与接下来将发生的活动的相关性。
2.3 entropy rate 的计算
作者提到 entropy rate的计算可以使用朴素暴力法,但是朴素暴力法对于较长的序列就不适用了。 entropy rate也可以用CTW、BWT、LZ等方法进行计算,作者最后使用了BWT算法来对entropy rate进行估算,文章还给了一个例子阐述BWT算法的原理。
3.实例分析
作者用长达一个月时间的公交IC卡数据分析了每个出行者的regularity,其实就是计算出每个人的entropy rate和entropy。
首先,自然是需要将出行者的出行活动序列进行序列化表达,如下图所示:图a是比较完整信息的出行序列,图b就是最终使用的出行序列,可见作者忽略掉了活动的duration。
然后作者算出了每个出行者的entropy rate和entropy。结果分别如下两图所示。图c是两者的差,其大小其实就是反应了该出行者的行为的可预测性,越大,就代表可预测性越大,越接近0,说明可预测性越小。
参考文献
Goulet-Langlois, G. , Koutsopoulos, H. N. , Zhao, Z. , & Zhao, J. . (2018). Measuring regularity of individual travel patterns. IEEE Transactions on Intelligent Transportation Systems, 1583-1592.
论文阅读Measuring Regularity of Individual Travel Patterns相关推荐
- 【论文阅读】7-Discovering Structural Regularity in 3D Geometry
[论文阅读]7-Discovering Structural Regularity in 3D Geometry 1.Input: 2.Processing pipeline 2.1.Transfor ...
- Are VQA Systems RAD? Measuring Robustness to Augmented Data with Focused Interventions 论文阅读笔记
Are VQA Systems RAD? Measuring Robustness to Augmented Data with Focused Interventions 论文阅读笔记 一.Abst ...
- 论文阅读2018-10-13
论文阅读2018-10-13 Addressing the minimum fleet problem in on-demand urban mobility 原文及翻译 METHODS Addres ...
- 【论文阅读】A Gentle Introduction to Graph Neural Networks [图神经网络入门](7)
[论文阅读]A Gentle Introduction to Graph Neural Networks [图神经网络入门](7) Into the Weeds Other types of grap ...
- [论文阅读] (22)图神经网络及认知推理总结和普及-清华唐杰老师
<娜璋带你读论文>系列主要是督促自己阅读优秀论文及听取学术讲座,并分享给大家,希望您喜欢.由于作者的英文水平和学术能力不高,需要不断提升,所以还请大家批评指正,非常欢迎大家给我留言评论,学 ...
- [论文阅读] (12)英文论文引言introduction如何撰写及精句摘抄——以入侵检测系统(IDS)为例
<娜璋带你读论文>系列主要是督促自己阅读优秀论文及听取学术讲座,并分享给大家,希望您喜欢.由于作者的英文水平和学术能力不高,需要不断提升,所以还请大家批评指正,非常欢迎大家给我留言评论,学 ...
- 【论文阅读】Attention Based Spatial-Temporal GCN...Traffic Flow Forecasting[基于注意力的时空图卷积网络交通流预测](1)
[论文阅读]Attention Based Spatial-Temporal Graph Convolutional Networks for Traffic Flow Forecasting[基于注 ...
- [论文阅读] (24) 向量表征:从Word2vec和Doc2vec到Deepwalk和Graph2vec,再到Asm2vec和Log2vec(一)
<娜璋带你读论文>系列主要是督促自己阅读优秀论文及听取学术讲座,并分享给大家,希望您喜欢.由于作者的英文水平和学术能力不高,需要不断提升,所以还请大家批评指正,非常欢迎大家给我留言评论,学 ...
- 论文阅读2 Dynamic Routing Between Capsules
论文阅读<2> Dynamic Routing Between Capsules Abstract 1 Introduction 2 How the vector inputs and o ...
最新文章
- 看BAT技术面试官如何挑选Java程序员
- * ngIf和* ngFor在同一元素上导致错误
- 【django轻量级框架】在线视频教育系统设计与实现
- 制作系统盘,重装新系统。
- linux-ftools查看Linux 的cached里面有哪些内容
- Windows live writer插入代码图片Test
- java url utf 8_java中文乱码解决之道(八)—–解决URL中文乱码问题
- 网络***检查分析---破解安全隐患问题回答
- CURL的学习和应用
- mysql必须记住的单词_如何真正记住英语单词?
- c++编游戏-扫雷-c++游戏将彩色化-windows7自带扫雷游戏休闲娱乐
- 西门子S7-1200系列PLC Modbus通信的踩坑记录
- Rasa课程、Rasa培训、Rasa面试系列之: Rasa客户案例T-Mobile电信公司
- 高效能人士的七个习惯(一)由内而外全面造就自己
- (C语言)实验4 循环结构程序设计
- MySQL计算天数差
- 气动人工肌肉的应用概况
- Dell OptiPlex 7090插入耳机有声音没有麦克风的解决方案
- 古典问题:有一对兔子,从出生后第3个月起每个月都生一对兔子,小兔子长到第三个月后每个月又生一对兔子,假如兔子都不死,问每个月的兔子总数为多少?
- 智力题及答案(包含梅氏砝码问题)
热门文章
- 华为M3平板升级鸿蒙系统,华为m3平板 日版刷国行 没有重力感应怎么解决?(篇二)...
- Docker容器获取局域网ip(使用macvlan)
- 解读 | 计算机视觉已超越人类眼睛?
- 安卓巴士总结了近百个Android优秀开源项目
- 取消usb计算机连接网络,usb连接(如何设置usb网络连接)
- 如何利用python将excel表格中筛选出来的每一份数据各自另存为新的excel文件?
- win7下用VS2008写视频聊天程序,求VFW教程?qzvgK
- Python喜马拉雅有声小说音频文件爬虫
- 《刷新》精髓:微软第三任CEO萨提亚•纳德拉重新发现微软灵魂的传奇历程,给了我们普通人哪些启示?
- 【网络通信】Teardrop编程创造虚假IP包