Evolutionary Clustering of Streaming Trajectories

智能手机和具有定位功能的联网车载设备的广泛部署，使得收集移动物体的流轨迹数据变得越来越可行。这些数据的连续聚类可以实现各种实时服务，如实时识别对象之间的代表性路径或共同移动趋势。然而，迄今为止，很少关注聚类的质量，例如，它有利于平滑聚类中的短期波动，以实现对异常数据的鲁棒性。我们提出了流轨迹的进化聚类的概念，简称ECO，该概念通过时间平滑来提高流轨迹聚类的质量，以防止连续时间戳中集群的突然变化。我们利用快照和历史轨迹代价的概念，将ECO形式化，然后将其表述为一个优化问题，证明了ECO可以在近似线性时间内执行，从而消除了以往研究中采用的迭代过程。此外，我们提出了一个最小群体结构和种子点移动策略，以促进时间平滑。最后，我们介绍了ECO下的所有算法以及一组优化技术。对两个真实数据集的广泛实验提供了对ECO的深入了解，并表明它在聚类质量和效率方面优于最先进的解决方案。

实际情况：现有的实时聚类方法主要关注最新数据，以降低聚类质量为代价实现了低计算成本。在流式中，聚类对轨迹数据的短期波动应该是稳健的，这可以通过平滑来实现。

方法：将进化聚类应用于轨迹可以减轻间歇性噪声对聚类的不利影响，并为用户呈现平滑一致的运动模式

轨迹演化存在的问题：1.已经存在的方法都是为了动态网络设计的，不适合在轨迹流上应用 2. 轨迹流上的运行通常比动态网络的速度要快很多 3. 对轨迹聚类质量的优化，导致大量的计算成本。

基础知识：

Evolutionary Clustering

进化聚类是指从流数据中产生一系列聚类的问题;也就是说，对每个快照进行集群。它考虑了流数据的平滑特性，获得高质量的聚类[2]。具体来说，要考虑两个质量方面

高质量历史：

高质量的快照：

Problem Definition

具体地说,它们调整Ck迭代以最小化(1). 我们采用Cost embedding，将代价公式从聚类结果级下推到数据级。而现有的Cost embedding技术仅针对动态网络。为了将Cost embedding应用于轨迹，我们提出了一个最小群结构以及快照和历史代价函数

Evolutionary Clustering of Streaming Trajectories相关推荐

动态聚类（ Dynamic clustering）
本节摘自2016年Santo发表在<PHYSICS REPORTS-REVIEW SECTION OF PHYSICS LETTERS>上的一篇综述文章,目前在SCI数据库中引用量接近两百 ...
【论文翻译】聚类算法研究
论文题目:聚类算法研究论文来源:聚类算法研究翻译人:BDML@CQUT实验室聚类算法研究孙吉贵 , 刘杰 , 赵连宇 Clustering Algorithms Research SUN J ...
南方科技大学 matlab,姚新 | 南方科技大学
代表文章: Y. Sun, K. Tang, L. L. Minku, S. Wang and X. Yao, ``Online Ensemble Learning of Data Streams w ...
python代码实现论文〖文献引用顺序〗修改校对
python代码实现论文[文献引用顺序]修改校对文章目录 python代码实现论文[文献引用顺序]修改校对问题描述解决思路代码实现 1.需要的库 2.读取word文档得到每个段落的内容 3.获 ...
独家 | 一文读懂社交网络分析-上（附学习资源）
本文主要阐述: 社交网络的结构特性与演化机理社交网络群体行为形成与互动规律社交网络信息传播与演化机理浏览后四章的内容请见下篇(2017年9月26日二条). 前言社交网络在维基百科的定义是&qu ...
Evolutionary Spectral Clustering by Incorporating Temporal Smoothness论文整理
之前介绍了06年KDD会议上进化聚类的开创性论文,今天要介绍的就是借鉴其思想的优秀算法中的代表之一<结合时间平滑性的进化谱聚类>.作者Yun Chi等人发布在07年的KDD会议上. 论文题 ...
一文彻底掌握Apache Hudi异步Clustering部署
1. 摘要在之前的一篇博客中,我们介绍了Clustering(聚簇)的表服务来重新组织数据来提供更好的查询性能,而不用降低摄取速度,并且我们已经知道如何部署同步Clustering,本篇博客中,我们 ...
测试hudi-0.7.0对接spark structure streaming
测试hudi-0.7.0对接spark structure streaming 测试环境 Hudi version :0.7.0 Spark version :2.4.0 Hive version : ...
【翻译】StreamDM：基于Spark Streaming的高级数据挖掘 StreamDM: Advanced Data Mining in Spark Streaming
[翻译]StreamDM:基于Spark Streaming的高级数据挖掘 StreamDM: Advanced Data Mining in Spark Streaming 摘要 Abstract ...
探索Apache Hudi核心概念 (4) - Clustering
Clustering是Hudi在0.7.0版本引入的一项特性,用于优化文件布局,提升读写性能,现在它已经成为Hudi的一项重要性能优化手段.本文我们会通过Notebook介绍并演示Clustering ...

Evolutionary Clustering of Streaming Trajectories

Evolutionary Clustering of Streaming Trajectories

Evolutionary Clustering of Streaming Trajectories相关推荐

最新文章

热门文章