Evolutionary Clustering of Streaming Trajectories

智能手机和具有定位功能的联网车载设备的广泛部署,使得收集移动物体的流轨迹数据变得越来越可行。这些数据的连续聚类可以实现各种实时服务,如实时识别对象之间的代表性路径或共同移动趋势。然而,迄今为止,很少关注聚类的质量,例如,它有利于平滑聚类中的短期波动,以实现对异常数据的鲁棒性。我们提出了流轨迹的进化聚类的概念,简称ECO,该概念通过时间平滑来提高流轨迹聚类的质量,以防止连续时间戳中集群的突然变化。我们利用快照和历史轨迹代价的概念,将ECO形式化,然后将其表述为一个优化问题,证明了ECO可以在近似线性时间内执行,从而消除了以往研究中采用的迭代过程。此外,我们提出了一个最小群体结构和种子点移动策略,以促进时间平滑。最后,我们介绍了ECO下的所有算法以及一组优化技术。对两个真实数据集的广泛实验提供了对ECO的深入了解,并表明它在聚类质量和效率方面优于最先进的解决方案。

实际情况:现有的实时聚类方法主要关注最新数据,以降低聚类质量为代价实现了低计算成本。在流式中,聚类对轨迹数据的短期波动应该是稳健的,这可以通过平滑来实现。

方法:将进化聚类应用于轨迹可以减轻间歇性噪声对聚类的不利影响,并为用户呈现平滑一致的运动模式

轨迹演化存在的问题:1.已经存在的方法都是为了动态网络设计的,不适合在轨迹流上应用 2. 轨迹流上的运行通常比动态网络的速度要快很多 3. 对轨迹聚类质量的优化,导致大量的计算成本。

基础知识:

Evolutionary Clustering

进化聚类是指从流数据中产生一系列聚类的问题;也就是说,对每个快照进行集群。它考虑了流数据的平滑特性,获得高质量的聚类[2]。具体来说,要考虑两个质量方面

高质量历史:

高质量的快照:

Problem Definition

具体地说,它们调整Ck迭代以最小化(1). 我们采用Cost embedding,将代价公式从聚类结果级下推到数据级。而现有的Cost embedding技术仅针对动态网络。为了将Cost embedding应用于轨迹,我们提出了一个最小群结构以及快照和历史代价函数

Evolutionary Clustering of Streaming Trajectories相关推荐

  1. 动态聚类( Dynamic clustering)

    本节摘自2016年Santo发表在<PHYSICS REPORTS-REVIEW SECTION OF PHYSICS LETTERS>上的一篇综述文章,目前在SCI数据库中引用量接近两百 ...

  2. 【论文翻译】聚类算法研究

    论文题目:聚类算法研究 论文来源:聚类算法研究 翻译人:BDML@CQUT实验室 聚类算法研究 孙吉贵 , 刘 杰 , 赵连宇 Clustering Algorithms Research SUN J ...

  3. 南方科技大学 matlab,姚新 | 南方科技大学

    代表文章: Y. Sun, K. Tang, L. L. Minku, S. Wang and X. Yao, ``Online Ensemble Learning of Data Streams w ...

  4. python代码实现论文〖文献引用顺序〗修改校对

    python代码实现论文[文献引用顺序]修改校对 文章目录 python代码实现论文[文献引用顺序]修改校对 问题描述 解决思路 代码实现 1.需要的库 2.读取word文档得到每个段落的内容 3.获 ...

  5. 独家 | 一文读懂社交网络分析-上(附学习资源)

    本文主要阐述: 社交网络的结构特性与演化机理 社交网络群体行为形成与互动规律 社交网络信息传播与演化机理 浏览后四章的内容请见下篇(2017年9月26日二条). 前言 社交网络在维基百科的定义是&qu ...

  6. Evolutionary Spectral Clustering by Incorporating Temporal Smoothness论文整理

    之前介绍了06年KDD会议上进化聚类的开创性论文,今天要介绍的就是借鉴其思想的优秀算法中的代表之一<结合时间平滑性的进化谱聚类>.作者Yun Chi等人发布在07年的KDD会议上. 论文题 ...

  7. 一文彻底掌握Apache Hudi异步Clustering部署

    1. 摘要 在之前的一篇博客中,我们介绍了Clustering(聚簇)的表服务来重新组织数据来提供更好的查询性能,而不用降低摄取速度,并且我们已经知道如何部署同步Clustering,本篇博客中,我们 ...

  8. 测试hudi-0.7.0对接spark structure streaming

    测试hudi-0.7.0对接spark structure streaming 测试环境 Hudi version :0.7.0 Spark version :2.4.0 Hive version : ...

  9. 【翻译】StreamDM:基于Spark Streaming的高级数据挖掘 StreamDM: Advanced Data Mining in Spark Streaming

    [翻译]StreamDM:基于Spark Streaming的高级数据挖掘 StreamDM: Advanced Data Mining in Spark Streaming 摘要 Abstract ...

  10. 探索Apache Hudi核心概念 (4) - Clustering

    Clustering是Hudi在0.7.0版本引入的一项特性,用于优化文件布局,提升读写性能,现在它已经成为Hudi的一项重要性能优化手段.本文我们会通过Notebook介绍并演示Clustering ...

最新文章

  1. ReentrantReadWriteLock
  2. Hlg 1407 【最小点权覆盖】.cpp
  3. kitten编程猫里的函数定义,函数实现和函数调用原理
  4. 计算机会计综合作业,20年7月东财《通用财务软件X》综合作业(100分)
  5. Mac 安装redis
  6. 中断linux命令快捷键_实用!快速操作Linux终端命令行的快捷键
  7. 云原生 云计算_使云原生计算具有普遍性和可持续性
  8. hr签核系统可以用python做吗_数字与签核参考流程
  9. 职场见闻录(01) - 怎样回答这两个问题?
  10. 活动目录系列之一……活动目录简介及部署
  11. 1018. 可被 5 整除的二进制前缀
  12. 怎么查看linux硬盘多路径,linux下磁盘多路径
  13. C++ 用template实现的堆
  14. 华为防火墙网管配置实例
  15. Linux笔记17.数据完整性检测工具
  16. java 行政区划数据库_Java学习-056-Jsoup爬虫获取中国所有的三级行政区划数据(一)...
  17. FFmpeg 编码、解码器列表(IOS)
  18. Noip 2016 蛋碎一地晚节不保
  19. C++ 后退前进资源浏览器实现方式,附代码
  20. 网页打开速度很慢,怎么解决?

热门文章

  1. iTunes 10 选择自定义IPSW
  2. Android 状态栏背景颜色修改与状态栏字体颜色修改
  3. ROC、PR曲线、AUC值
  4. 上海大学社会学考研能用计算机吗,上海大学
  5. postgresql立式版本下载_【PostgreSQL下载】PostgreSQL官方版下载_多特软件站
  6. 直线型一阶倒立摆3---控制器设计
  7. python实现txt文本文档批量转为可编辑的pdf文档
  8. 挂牌!迎来【济南网络空间安全山东省实验室】等三所实验室!
  9. kali2020.4中文安装后,fcitx配置框中空白,无法添加输入法,请做如下操作尝试修复
  10. 「津津乐道播客」#301 这是一期价值3000元的当代社畜科学点餐指南