文章目录

  • 0 概述
  • 1 手机信令数据预处理
  • 2 手机信令数据分析应用
    • 2.1 停留点识别
    • 2.2 职住地分析
    • 2.3 出行方式识别
    • 2.4 交通小区划分
    • 2.5 公交特征分析
    • 2.6 人车轨迹关联
  • 3 手机信令数据分析结果验证
  • 4 展望

0 概述

12月11日,中山大学智能工程学院副院长蔡铭教授来单位做报告,汇报基于手机信令数据的交通研究技术方法,很受启发。

我认为,蔡教授团队研究出发点是如何应用手机信令这一大数据来构建完整出行链,以解决交通出行中的诸多问题,如出行的起点、终点,出行的线路选择,出行方式,出行用户画像,人车关联。研究亮点之一是其综合使用多种数据、技术,有效提高算法精度,其二是建立开源的真值数据库,为验证算法准确性、可靠性提供有力参照。

技术方法可以参考现有的较为常规的做法,但不过过于迷信于此,需要多思考如果也照那样做会存在什么纰漏,是否能有更好的做法,在这样思考的过程中,不但能够提升结论可靠性,也是诞生新的研究idea的契机。

1 手机信令数据预处理

手机信令价值密度低,需要进行数据清洗方能减少误差,降低冗余度,这能够提升结果准确性,也能大大减轻数据处理所花费的计算资源及时间。蔡教授团队设计一种层次化数据清洗流程,可以提炼有价值数据,同时实现数据预处理工具可复用性。整个处理流程包含以下步骤:

  1. 残缺数据筛除
  2. 同时间不同位置处理
  3. 同位置点合并
  4. 乒乓切换数据处理
  5. 漂移数据处理

经过预处理后,数据量减少了92%左右。

2 手机信令数据分析应用

2.1 停留点识别

停留点是出行链节点,传统的停留点识别算法需要凭借研究者经验手动设定固定的时间阈值、空间阈值,存在较大主观性,蔡教授团队提出一种基于时空密度聚类的停留点识别算法,以地面二维平面及时间维构架出时空三维坐标系,对出行数据中的时间和空间特征进行了整合,结合个体出行轨迹特征设置初始代价,不再设施固定时空阈值。

2.2 职住地分析

传统职住地分析需要人工定义职住时间段, 比如认为凌晨00:00-6:00是居家休息时间段,这种筛选方法大多数情况下有效,对于一些特殊工作模式如昼夜颠倒、无固定职住则不够准确。

蔡教授团队提出的职住地分析方法流程如下:

  1. 定义主要活动区:对用户多日活动轨迹点聚类,识别用户主要活动区域
  2. 识别工作、休息时间段:引入活动强度信息熵指标来衡量分析用户活动强度
  3. 提取工作、休息时段的主要停留区域:在区域内进一步划分网络,结合POI数据精准识别职住地所在网格(概率分布,打分?)。

2.3 出行方式识别

如何判别用户出行选用何种交通方式,蔡教授团队提出一种基于时空关联匹配的出行方式识别方法,该方法通过关联分析手机信令轨迹数据及高德地图导航数据,量化信令轨迹与各类导航路径相关强度,判别用户出行方式。具体流程如下:

  1. 导航轨迹请求:请求同一OD同一时间步行、公交、驾车、骑行4种出行方式导航路径。
  2. 导航数据匹配:权重计算——>路径匹配——>时间匹配——>综合对比

蔡教授表示,该方法在长距离通行情况匹配结果较好,短距离通行受限于手机信令数据空间分辨率低结果不是特别准确。由于该方法需要大量导航数据,团队是通过申请多个企业号的方式解决。

在找出与用户信令轨迹最为匹配的导航路线基础上,采用中文分词算法对路线信息做切分,得出个人出行画像,主要包含了主要出行方式、活动热点区域、公交线路等。

2.4 交通小区划分

为啥要划份交通小区:

  • 降低城市交通系统复杂性,是统计人口、居住就业、交通出行等方面的基础空间单元
  • 微观层面,方便城市管理者对每个区域进行交通管理和控制。
  • 宏观层面,对城市的交通区域进行协调以及规划

蔡教授团队提出基于多源数据的交通小区划分方法

  1. 基础小区:道路、水系、行政区等GIS数据提取小区
  2. 小区再细分:道路、狭长、冗余小区等多种异常小区的识别及清洗

2.5 公交特征分析

对公交评价体系重新做了思考,将国标中的一些指标替换成新数据环境下更加准确、人性化的指标。

  • 候车时长
  • 公交出行满足率
  • 站点步行距离
  • 公交可达性
  • 拥挤程度指标

2.6 人车轨迹关联

高级!!!

一个特别酷炫的应用场景:只需要在道路卡口拍一辆车的车牌,就能分析出车上坐了哪些人,即使后排乘客没有露脸。


蔡教授团队应用道路卡口数据描绘车辆轨迹,将信令轨迹与车辆轨迹做匹配分析,分析出车辆乘坐人员情况。所应用的算法为时空滑动窗口匹配算法,算法的具体步骤为:

  1. 对每个一开口点进行搜搜,看信令数据中是否存在时空阈值范围内的数据,否则匹配失败
  2. 将满足情况情况的手机ID记录下
  3. 下一个卡口阈值范围内是否有相同手机ID,无则匹配失败
  4. 不断循环搜索卡口点,若直到最后一个轨迹点都还有对应用户的话,那此车匹配成功


匹配结果不是特别理想,但有初步结果:

3 手机信令数据分析结果验证

算法准确性验证是算法开发中非常有必要进行的步骤,它能测算算法性能和有效性。

手机信令数据最大优点是全时空跟随性,缺点在于以基站位置代替实际位置会造成较大误差,为了能够验证算法准确度,蔡教授团队开发数据采集APP,以GPS数据作为真值数据,记录用户出行方式、停留状态、职住状态等。

蔡教授表示,目前该APP主要是团队内学生使用,出行方式单一,轨迹数据较少,考虑将此APP开源,以建立信令数据验证数据库,搜集更多的真值数据。

4 展望

5G网络的频率要比4G网络快得很多,但是频率越大的基站,它的衰减就会越快,为此基站的密度就要比原来的密。目前为止三大运营商都已经做出了自己的大体部署,联通家的基站密度大概是原来的3到4倍,移动家的达到了六倍左右,电信家的也是三倍以上。

随着5G时代到来,更高覆盖密度的基站也意味着信令数据空间分辨率将大大提高,这对基于信令数据的交通研究是个极大的利好消息,这是个很有前景的研究领域。

【前沿进展】基于手机信令数据的交通出行特征研究相关推荐

  1. 基于手机信令数据的交通出行方式划分

    笑而不语是一种成长,痛而不言是一种经历~ 1.文章信息 <Transportation Mode Split With Mobile Phone Data>. 中南大学王璞老师团队2015 ...

  2. 手机信令数据怎么获得_论文推荐 | 基于手机信令数据的大规模通勤模式研究(2020-12-01)...

    交通攻城狮,2020-12-01,第 76 期 1. 推荐论文基本信息 论文信息 今天推荐的论文源自期刊<Journal of Transport Geography>2020 年 12 ...

  3. (28) 基于手机信令数据的动态出行OD以及出行需求估计

    交通预见未来(28): 基于手机信令数据的动态出行OD及出行需求估计 1.文章信息 <Estimating Dynamic Origin-Destination Data and Travel ...

  4. 基于手机信令数据的动态出行OD以及出行需求估计

    这篇文章主要是推荐给大家,有信令数据的可以仔细阅读下原文主体部分~ 1.文章信息 <Estimating Dynamic Origin-Destination Data and Travel D ...

  5. 基于手机信令数据的北京市职住空间分布格局及匹配特征

    1.文章信息 论文题目为<基于手机信令数据的北京市职住空间分布格局及匹配特征>的一篇2020年发表在<地理科学进展>的涉及到手机信令数据处理的文章. 2.摘要 职住空间作为城市 ...

  6. 手机信令数据怎么获得_基于手机信令数据的武汉市人口迁入成因研究

    作 者 信 息 詹庆明1,杨苏舒1,肖 琨2,高思航1,严淑琴1 (1. 武汉大学 城市设计学院,湖北 武汉 430072:2. 武汉市测绘研究院,湖北 武汉 430022) " [摘要]随 ...

  7. Mysql出租车轨迹的分析_一种基于出租车轨迹数据的交通出行共现现象的可视化分析方法与流程...

    本发明涉及交通数据可视化领域,尤其涉及一种基于出租车轨迹数据的交通出行共现现象的可视化分析方法. 背景技术: :城市中人类移动规律中的共现现象是指来自两个区域的人们在同一个时间段内访问同一个城市区域. ...

  8. 基于手机信令数据研究交通出行特征具体实现

    这学期期末智慧交通大作业,我选择使用手机信令数据研究人类交通出行特征,期间我也查阅了许多资料,但绝大多数帖子只有手机信令数据的应用方向,没有具体实现做法.经过一两周的探索,我大概根据数据和应用方向实现 ...

  9. 基于手机信令数据的数据清洗和出行方式识别

    数据来自2020年第十一届服务外包创新大赛A06赛题. 数据清洗 与定位误差不超过10米.时间采样均匀的GPS数据相比,手机信令数据的精确度较低且时间间隔不均匀,因此更需要对其进行数据清洗,下面对手机 ...

最新文章

  1. 判断变量是否为数组的几种方法
  2. winform 在指定目录下已经生成资源Image图片的方式
  3. 使用LeNet对于旋转数字进行识别:合并数字集合
  4. 高性能HTTP加速器varnish实践
  5. 【Unity】6.1 Unity中的C#脚本基础知识
  6. asp.net mvc 如何在View中获取Url参数的值
  7. java调用onnx模型_开源一年多的模型交换格式ONNX,已经一统框架江湖了?
  8. facet与compiler不匹配
  9. python格式化字符串4种方法
  10. 创业公司失败的20大原因 没市场需求排第一
  11. Installing VMware Tools, please wait解决办法
  12. postman常用断言
  13. 腾讯云服务器测试评测情况(后期阿里云服务器、新浪云服务器)
  14. 网站建设教程:如何自己做网站,步骤有哪些?
  15. 线程终止的 4 种方式
  16. 教育部拔尖计划计算机专业的高校,“拔尖计划”10周年!教育部公布的荣誉奖项名单都有谁?...
  17. print 设置纸张的高度_祝贺! 2020珠峰高程测量登山队成功登顶!用Python计算一张纸对折多少次会超过珠峰高度?...
  18. java项目编码问题解决
  19. 选项不属于HTML语言特点,JavaScript选择题
  20. QQ个人文件夹保存位置无效

热门文章

  1. Zemax操作26--像差理论和修正(场曲、畸变、色差)
  2. Basler 学习笔记2
  3. 抖音视频下载改md5
  4. laydate动态设定时间范围
  5. osgi框架 android,基于Android的OSGi框架智能家居系统的设计与实现
  6. FineUI Grid 缓存列显示隐藏状态
  7. 钱数转换(转换成:XX万,XX亿)
  8. android ratingbar 高度,Android RatingBar终极解决方案,大小、颜色、间距、样式随便定义...
  9. Flowable高级篇 - Flowable表结构
  10. 脚本录制软件python 按键精灵 tc_用动作脚本的方式介绍如何使用按键精灵的录制功能...