论文解读-用于人口流动数据模拟的人口流动模型
这篇文章提出了一种3W模型来建模人类移动行为,同时还能对用户的隐私进行保护。它是在WHERE模型的基础上得到的,但是基于此,本文提出的模型还考虑了用户的活动空间和全天出行规律,另外,本文还对用户进行了聚类处理。
一、模型结构
1.1 模型输入
模型的输入包含四个部分:1)时间引用文件。事先给定,决定生成当前轨迹的时间。2)空间聚合层。即地图的空间划分,要求在实验中保持一致。3)移动轨迹。4)home和work位置。事先给定。
1.2 WHO组件
该部分是用来提取具有相似行为特征的用户。
在这部分中,根据出现规律对用户进行聚类,
向量对每个用户都计算一个。然后使用K均值算法对用户进行聚类,聚类的个数由轮廓系数判据决定:
聚类之后,可计算每个簇的home分布和work分布,计算方式为:对每个簇,计算聚合层(即空间划分)上的家庭和工作位置分布,并将其归一化,就得到了一对空间概率分布。
每个簇的通勤距离分布计算为簇中每个用户通勤距离的中值在聚合层上的分布。
对每个用户而言,它所有的活动可以约束到一个椭圆中,椭圆的半轴的比作为该用户的扩散系数(Spread),对其平均得到用户所在簇的扩散系数。
1.3 WHERE部分
该部分决定移动的空间方面。从这个组件开始,为轨迹生成的部分。
必须确定要合成的总人数,并使用该总人数将不同移动组的份额重新调整为要为每个群生成的人数。
事先,WHERE给要生成的个体分配一个home,work位置和活动空间。其中,home位置由HomedistributionHomedistributionHomedistribution进行采样得到,然后由CommutingDistanceCommutingDistanceCommutingDistance分布采样得到通勤距离d,然后根据宽度得到一个圆环,在圆环内根据WorkdistributionWorkdistributionWorkdistribution得到work位置。
使用椭圆来确定活动空间,home在椭圆中心,work在边缘,半长轴为通勤距离。
1.4 WHEN
用来确定移动行为的时间。
二、实验
2.1 评价指标
对于每个小时的生成数据集的人口分布和原始数据的人口分布,作者使用EMD方法来计算两个分布的相似性。
对于群体特征,作者采用了旅行距离和流量特征。并使用KL散度来计算生成数据集和真实数据集之间的相似性。
作者分布实施了两个实验,一个是根据公开数据生成一个移动轨迹数据集。一个是根据真实的移动轨迹,生成移动轨迹。
2.2 合成数据测试
根据人口普查数据和出粗车数据来生成轨迹数据。
2.3 真实数据测试
使用真实采集的GPS轨迹作为原始数据,每隔5s记录一次位置,记录时间跨度为一周,然后预处理数据,降采样得到以一个小时为间隔的轨迹数据。
2.4 结果
(1)合成数据测试结果
人口分布差异
群体特征差异
每个区域观测到的流和真实情况对比。
(2)真实数据测试结果
人口分布差异
距离分布差异
每个区域流数量差异
三、总结
在这篇论文中,作者提出了WHO-WHERE-WHEN方法,一个改进的隐私保护的人口流动模型。该模型可以合成人工轨迹,代表与真实社区非常相似的运动行为的群体。该算法旨在大规模采样和复制数据。
论文解读-用于人口流动数据模拟的人口流动模型相关推荐
- ACL 2018论文解读 | 基于路径的实体图关系抽取模型
在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果. 点击本文底部的「阅读原文」即刻加入社区 ...
- 论文解读 | 基于递归联合注意力的句子匹配模型
在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果. 点击本文底部的「阅读原文」即刻加入社区 ...
- ICCV2019 最佳论文解读:SinGAN从单幅图像学习生成模型
作者:肖健 哈尔滨工程大学 以色列理工学院与Google Research合著的<SinGAN:Learning a Generative Model from a Single Natura ...
- 【ICLR 2018图神经网络论文解读】Graph Attention Networks (GAT) 图注意力模型
论文题目:Graph Attention Networks 论文地址:https://arxiv.org/pdf/1710.10903.pdf 论文代码:https://github.com/Peta ...
- 「自然语言处理(NLP)论文解读」中文命名实体识别(Lattice-LSTM模型优化)
来源:AINLPer微信公众号 编辑: ShuYini 校稿: ShuYini 时间: 2019-8-27 引言 今天主要和大家分享一篇关于中文命名实体识别的文章,本文分析Lattice-LS ...
- 用于部分迁移学习的加权对抗网络 | CVPR 2018论文解读
在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果. 点击本文底部的「阅读原文」即刻加入社区 ...
- 【读论文】中国人口空间流动格局与省际流动影响因素研究(2014)
中国人口空间流动格局与省际流动影响因素研究(2014) 张耀军 岑 俏 摘要: 利用"五普"及"六普"数据,运用空间分析方法,从省内流动和省际流动两个角度,分省 ...
- 论文解读:《iRice-MS:用于检测水稻多型翻译后修饰位点的集成 XGBoost 模型》
论文解读:<iRice-MS: An integrated XGBoost model for detecting multitype post-translational modificati ...
- 微软论文解读:用于视觉对话的多步双重注意力模型
作者丨张琨 学校丨中国科学技术大学博士生 研究方向丨自然语言处理 论文动机 当前 Visual dialog 模型尽管已经取得了令人印象深刻的表现,但当问题涉及到图像的特定区域或者比较细节的对话片段时 ...
- Nature论文解读:用于改善加权生物网络信噪比的网络增强方法
在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果. 点击本文底部的「阅读原文」即刻加入社区 ...
最新文章
- [20170603]12c Top Frequency histogram.txt
- 【数据结构与算法】之深入解析“格雷编码”的求解思路与算法示例
- 前端学习(1681):前端系列实战课程之让蛇动起来
- Java8新特性总结 - 序
- centos 7 查看、更新系统版本
- Android 中自定义控件和属性(attr.xml,declare-styleable,TypedArray)的方法和使用 一
- linux怎么重载mysql配置命令_【Linux命令】数据库mysql配置命令
- css实训内容,实训五DivCSS布局基本.doc
- matlab j计算丰水期的值,科学计算与MATLAB语言超星2020期末考试查题公众号答案
- unity 中是如何实现游戏人物换装的
- 《关键对话》如何高效能沟通之何谓关键对话
- JavaScript 调用Bomb后端云
- 快手小筷子机器人_快手小快机器人设置 苹果手机小快机器人怎么弄
- 数据仓库系列(3):数据的价值如何体现
- B. Nezzar and Lucky Number
- vant 引进单个样式_记一次webpack打包样式加载问题
- vue 折叠效果动画
- 【Kafka】Kakfa KeeperErrorCode = AuthFailed for /consumers
- DVB误码率手持式场强仪科普说明
- 程序每次读入一个正三位数,然后输出逆序的数字。注意,当输入的数字含有结尾的0时,输出不应带有前导的0。比如输入700,输出应该是7。