时空轨迹数据挖掘综述

得益于空间定位技术、传感器网络的飞速发展,空间定位传感器在飞机、舰船、汽车以及手持设备上得到普遍使用,产生并积累了海量的移动目标时空轨迹数据。这些时空轨迹数据内嵌于连续的空间,数据本身在时间与空间上存在很强的自相关性,其中隐含的模式往往具有局部性的特点,从而使得面向时空轨迹数据的挖掘具有较高的复杂性。过去十几年来业界提出了一些列的技术与方法来分析挖掘海量、高维的时空轨迹数据,萃取轨迹数据中隐含的价值知识,从而催生出众基于轨迹数据、多面向不同业务场景的上层应用,如智能交通系统、智慧城市/城市计算、飓风预测等。

在本文中,对时空轨迹数据的挖掘分析做了系统性的综述,提供了该领域的研究全景图以及各个子课题的研究范围。给出了从数据产生、预处理、数据管理、再到各种挖掘任务的一个技术路线图。本文的最后还介绍了将轨迹数据转化为其他格式的方法,如图、矩阵、张量等,从而使得更多的数据挖掘和机器学习方法可以应用于轨迹数据的分析处理。

概念定义

轨迹数据定义

时空轨迹数据是由地理空间中的运动物体产生的轨迹,通常由一些列具有时间顺序的空间点表示,形式化表述如下:Trajectory tk=p1->p2->……->pn,其中pi表示目标在ti时空空间位置及其他属性,通常pi的要素包括:定位点ID、轨迹ID、经度、纬度、高度、速度、时间等。轨迹数据集Trajectory Set S={t1, t2, ……, tm},其中ti表示第i条轨迹。现实世界中轨迹数据的来源主要分为如下四个类别:

人员流动:随着智能手机可穿戴定位设备的广泛使用,人们在真实地理空间的流动轨迹或被动、或主动地记录并存储,形成了丰富的时空轨迹数据。这类数据经过分析挖掘后可丰富社交网络内涵,催生众多的应用,如同伴发现、旅游推荐、路径规划等。

交通工具运行:绝大多数汽车、飞机、舰船都配备并启用了GPS定位传感器,它可以以一定的频率主动报告带有时间戳的位置信息,在这些交通工具运行过程中会产生海量的轨迹数据。通过对这些数据的存储分析处理,可实现流量分析、异常检测、路径规划等。

动物流动:通过在动物身上绑定带有定位功能的传感器设备,可以收集老虎、鸟类等动物的迁徙活动轨迹,从而研究动物的生活行为情况以及地区的生态变化情况。

自然现象流动:气象学家、海洋学家、气候学家等通过探空气球、气象卫星等设备收集了飓风、龙卷风、洋流等自然现象的移动轨迹。通过对数据的捕捉处理,可以分析环境和气候的变迁,对自然灾害进行及时的预警预测。

不同来源的轨迹数据分析挖掘关注重点、处理方法不尽相同例,如人的停留点检测与飞机的停留点检测就完全不同,人可以呆在一个地方静止不同,而飞机则需要保持一定的速度飞行才能维持稳定的空中状态。因此需要引入需要根据根据不同的业务场景、引入相应的背景知识,采用合适的算法工具,才能更好的挖掘出时空轨迹数据背后所隐含的知识规律。

轨迹数据挖掘内涵

时空轨迹数据预处理:时空轨迹数据预处理是时空轨迹数据挖掘的基础,包含噪声过滤、轨迹分段、停留点检测、轨迹压缩、地图匹配等内容。其中噪声过滤目的是剔除轨迹中因传感定位设备误差造成的显著偏离正常范围的数据点或者航迹段;轨迹分段是通过时间分段、空间形状、语义含义将轨迹分段,便于后续的聚类分类,例如人的一天出行的轨迹可分段为家到工作地、工作地到商场、商场到地铁站、地铁站到家等几段;停留点/驻留区域检测指找出轨迹段中含有特定语义的轨迹段,如逛商场或吃饭;轨迹压缩主要采用一定的算法在不丢失轨迹原有的特征情况下,压缩数据规模,降低存储处理的难度;地图匹配主要实现轨迹与路网的匹配。

时空轨迹数据管理:旨在对海量时空轨迹数据构建时空索引,满足大量应用从轨迹库中对原始轨迹数据的即席查询分析需求。典型的即席查询需要包括最近邻查询(the nearest neighbors)与范围查询(Range queries)。轨迹间距离度量是最近邻查询的基础,常见的距离度量算法将在后续进行详细讨论。此外历史轨迹数据管理和实时轨迹数据管理采用不同的方法进行处理。

时空轨迹数据分析挖掘:包括时空轨迹数据的不确定性处理轨迹模式挖掘。其中轨迹数据不确定性是指目标在采用时间区间之间的位置不确定性,处理包含两个方面的研究内容,其一,试图通过建模与引入背景知识来减少轨迹的不确定性;其二对时空轨迹数据的隐私保护研究。轨迹模式挖掘主要研究目标对象的移动模式,伴随模式、周期模式、频繁序列模式、关联模式、轨迹聚类。

时空轨迹数据分类与预测:轨迹分类采用有监督学习方法将轨迹划分为某些类别,同时构建分类模型,用于实时轨迹的分类识别。轨迹预测包含两个层次的预测,其一基于当前状态的位置与轨迹预测;其二基于当前密度、事件、历史知识相结合的时间序列预测。预测是轨迹数据挖掘分析的最终应用需求,同时也是当前研究实现难度较大的部分。

时空轨迹数据异常检测:包含两个层次的异常检测。第一层次基于当前运动状态与背景知识的异常检测,如飞机掉高等;其二、通过与样本库中的轨迹模式进行对比分析,当前轨迹的异常值在某些度量方面与其他数据有着显著的不同或者是不符合预期模式的事件或者观察值,如车祸。

时空轨迹数据转移处理:通过一定的数据,可将轨迹数据转换为其他格式数据,如图、矩阵、张量,一方面可以降低数据规模,另一方面,可以借助现有的数据挖掘技术(图挖掘、协同过滤CF、矩阵因式分解MF、张量分析TD)拓展时空轨迹挖掘的方法。

时空轨迹数据挖掘综述相关推荐

  1. 深度学习在轨迹数据挖掘中的应用研究综述

    深度学习在轨迹数据挖掘中的应用研究综述 人工智能技术与咨询 来源:< 计算机科学与应用> ,作者李旭娟等 关键词: 深度学习:数据挖掘:轨迹挖掘:长短时记忆:序列到序列 摘要: 在过去十年 ...

  2. 多旋翼集群的分散时空轨迹规划

    0 概览 分散结构的多旋翼机群具有灵活性和鲁棒性,而高效的时空轨迹规划仍然是一个挑战.该论文引入了分散式时空轨迹规划,将生成的质量良好的轨迹命名为 M I N C O MINCO MINCO应用到多智 ...

  3. Apollo项目::轨迹规划综述::导航规划、行为规划、动作规划

    轨迹规划分为不同层次:导航规划.行为规划.动作规划.这里一一展开简单来说. 1.导航规划        A*算法一直是一个经典高效的离散空间路径搜索算法,这里导航规划我们就直接等同于A*算法来讲解. ...

  4. 端午屈夫子祭-基于LeafLet的夫子一生时空轨迹纵览

    目录 前言 一.要素整理 1.屈夫子的相关资料 2.人物轨迹时间线 3.四维导图整理 二.时空轨迹界面设计 1.界面设计 2.可视化采用组件 三.时空轨迹展示实现 1.创建一个Html文件骨架文件 2 ...

  5. 数据挖掘-数据挖掘综述-基础知识和概念总结

    数据挖掘-数据挖掘综述-基础知识和概念总结                                                  目录 数据挖掘-数据挖掘综述-基础知识和概念总结 1.数据 ...

  6. 隐私保护的数据挖掘综述

    前言 对于人嘛,总是将事情想象的多么美好,这不.到自己真正的接触了学术研究,才发现那无尽的代码才能带来真正快乐源泉(虽然没有深层次的技术含量).但是,为了自己选择的路,即使作为一名科研狗也得走下去. ...

  7. 基于WEB的数据挖掘综述

    周 竞扬 MG0133041 南京大学计算机科学与技术系分布式与并行系统实验室 江苏 南京 210093 摘 要 基于WEB 的数据挖掘是当前相当热门的方向之一,本文对此作了一个比较全面的综述.概括了 ...

  8. 近五年城市轨迹数据挖掘的相关文章整理

    Xiaoyu Sun .Zhou Huang 于2018年发表的"Building a model-based personalised recommendation approach fo ...

  9. 数据挖掘综述——王光宏、蒋平

    摘要 "从模式识别的角度讨论了数据挖掘技术的主要任务,包括分类.聚类.回归 .关联 .序列和偏差 6 种模式的识别." "数据挖掘技术的常用方法,包括模糊理论.粗糙集理论 ...

  10. PostgreSQL index include - 类聚簇表与应用(append only, IoT时空轨迹, 离散多行扫描与返回)

    标签 PostgreSQL , 离散扫描 , IoT , append only , 类聚簇 , index include 背景 https://use-the-index-luke.com/blo ...

最新文章

  1. linux mysql 开启远程访问
  2. swift_004(Storyboard进行界面跳转及传值)
  3. matlab mobile中文版,MATLAB Mobile
  4. CMake常见指令总结
  5. memcache读书笔记(二)
  6. 修改freebsd的主机名
  7. excel两个表格数据对比_Excel表格技巧—如何统计数据个数
  8. phpstorm统计程序行数_Python 实现代码行数统计
  9. 杭电2094产生冠军
  10. 使用CSS在文字前面加上图标。
  11. tensorboard 使用
  12. Atitit.  单列索引与多列索引 多个条件的查询原理与设计实现
  13. 下划线_Excel添加下划线的快捷键,下划线颜色设置
  14. c语言中除号用百分号,【期末复习】人教版六年级数学(下册)知识要点
  15. Django实现web端tailf日志文件
  16. python模拟微信登录公众号_Python3微信公众平台requests模拟登陆
  17. 一维数组新老数据对比修改字段
  18. 那些让人动容的美食文案
  19. 报错:Error creating bean with name ‘serverEndpointExporter‘ defined in class path resource [group/oneo
  20. COVID-19疫苗到底是如何杀死新冠病毒的?

热门文章

  1. 如何查询linux服务器的网卡,linux怎么查看网卡硬件信息
  2. trend函数用oracle实现,Excel函数TREND函数的用法
  3. 解决ios微信小程序弹框点击穿透问题
  4. java执行bat代码
  5. 整人的bat文件代码
  6. (附源码)计算机毕业设计ssm大学生学科竞赛管理系统
  7. Android校园二手交易平台
  8. 支付系统源码商业版 完美可运营
  9. axure 原型图 基础知识介绍
  10. 通信模块整理(一)JDY-31