原文出自:https://blog.csdn.net/LilyXFan/article/details/70598509?locationNum=1&fps=1

参考文献:2014年发表在Nature上的文章Clustering by fast search and find of density peaks

核心思想:密度比邻居节点高、与比其密度大的点的距离相对大的点是聚类中心。

1. 两个定义:

1.1.局部密度ρ

ρi=∑jχ(dij−dc)

其中, χ(x)={1,0,x<0otherwise (cutoff kernal)
也可以采用gassion kernal计算:

ρi=∑jexp(−(dijdc)2)

1.2.密度比i大且距i最近的点与i的距离δ:

δi=minj:ρj>ρidij

特别的,对于密度最大的点, δi=maxj(dij)

2.聚类中心的选择
ρ

和 δ相对较大的点为聚类中心,通过 ρ- δ

散点图观察

3.其他点的分配
其余非聚类中心点,被分配到密度比其大、距离最近的点所属的类(高密度向低密度传播,因此适用于流型)

4.分配的可靠性度量

  • 没有引入noise-signal cutoff.本文为每个聚类定义了border

  • region(分配到该类但距其他类中点的距离小于dc的点的集合) 对每个聚类,找到其borderregion中点的最大密度ρb

在某个聚类c中,ρi

> ρb

  • ,则i会分配到聚类c中,否则i被称为halo(可以被理解为噪声)

5.dc的取值
可以去dc,使得平均邻居数占数据集中所有点的1%-2%
dc的取值具有鲁棒性,dc大,ρ

大,计算δ

和选中心点时只比较相对大小,与具体的数值无关

6.cutoff kernal or gaussion kernal
对与小数据集,ρ

和 δ 的计算不可避免的受统计误差影响,因此计算 ρ

时采用gaussion kernal要更好些。

7.实验效果
输入:距离矩阵/相似度矩阵
(不一定要是欧式距离),只需要点之间的关系(通过MDS多维尺度变换能直观的展现数据点之间在多种距离上离得多近,还可以产生一个低维的数据点表示,MDS不需要原始数据,只需要衡量点间距离的距离矩阵。)
7.1.Spiral

7.2.Flame

7.3.Aggregation

7.4.Jain

8.思考
Q1.当密度分布不均匀时,聚类效果如何?

效果不好(如Jain数据集),在计算局部密度时并没有考虑局部结构
Q2.重叠群组?
不交叉

Density Peak相关推荐

  1. 文献学习(part32)--Density Peak Clustering Based on Relative Density Optimization

    学习笔记,仅供参考,有错必究 文章目录 Density Peak Clustering Based on Relative Density Optimization 摘要 相关工作 算法 DPC算法 ...

  2. 密度峰值聚类(Density Peak Cluster,DPC)——Python实现

    密度峰值聚类(Density Peak Cluster,DPC)--Python实现 时间:2022/6/29 文章目录 密度峰值聚类(Density Peak Cluster,DPC)--Pytho ...

  3. 密度峰值聚类算法DPC(Density Peak Clustering)理论基础与python实现

    密度峰值聚类算法DPC(Density Peak Clustering) 基于密度峰值的聚类算法全称为基于快速搜索和发现密度峰值的聚类算法(clustering by fast search and ...

  4. 【聚类算法】密度峰值聚类算法DPC(Density Peak Clustering Algorithm)

    every blog every motto: You can do more than you think. https://blog.csdn.net/weixin_39190382?type=b ...

  5. density peak聚类算法

    见我的原创文章原文: https://mianbaoduo.com/o/bread/YZ2Tm5Y= - - - - - - - - - -

  6. ML之Clustering之普聚类算法:普聚类算法的相关论文、主要思路、关键步骤、代码实现等相关配图之详细攻略

    ML之Clustering之普聚类算法:普聚类算法的相关论文.主要思路.关键步骤.代码实现等相关配图之详细攻略 目录 普聚类算法的相关论文 普聚类算法的主要思路 普聚类算法的关键步骤 普聚类算法的代码 ...

  7. Science上发表的超赞聚类算法

    论文. Clustering by fast search and find of density peak. Alex Rodriguez, Alessandro Laio 参考链接:Science ...

  8. 吉林大学计算机学院刘衍衍教授,周柚-吉林大学计算机科学与技术学院

    发表学术论著68篇,近3年发表论文: [1]Yizhang Wang, Di Wang, Xiaofeng Zhang, Wei Pang, Chunyan Miao, Ahhwee Tan, You ...

  9. T-PAMI-2021论文Semi-Supervised Multi-View Deep Discriminant Representation Learning阅读笔记

    提示:文 0.论文信息 题目:Semi-Supervised Multi-View Deep Discriminant Representation Learning 期刊: IEEE Transac ...

最新文章

  1. 浅谈微软跨平台与MONO
  2. ftp 服务器的目录文件是否存在,ftp服务器的目录文件是否存在
  3. 飞利浦AC6608空气净化器粉尘传感器维修
  4. CF - 741(C. Arpa’s overnight party and Mehrdad’s silent entering) 二分图构造
  5. 92行JavaScript代码实现的类似Excel外观的UI
  6. JavaScript网络地址作为参数_JavaScript之bind的模拟实现
  7. 小猴子蓝裤黄袄的局域网聊天
  8. RadioGroup 的使用
  9. 如何来优化招聘类网站-SEO教学
  10. 如何把模糊照片变清晰把相片变高清修图#ps教程#ps学习视频
  11. 第二课 MC9S08DZ60之多功能时钟发生器S08MCGV1
  12. 如何消除文法的二义性
  13. iOS 之归档解档(nskeyarchieve)
  14. 计算机ps工具字母,PhotoShop7怎么把英文字母抠出来 一个工具搞定
  15. android喜马拉雅播放器,喜马拉雅车载播放器(随车听)-喜马拉雅FM车机版v2.0.0 安卓版-腾牛安卓网...
  16. 企业如何CRM管理软件中受益
  17. Error during export:Export job failed !
  18. 运算器设计(计算机组成实验)1
  19. 压控电流源等效成一个电阻
  20. c语言分支程序讲解,C语言基础知识之(二):分支

热门文章

  1. 给大家推荐一个超星图书馆
  2. EasyExcel 超百万数据处理总结
  3. dbvisualizer 查表结构_数据库表结构查询SQL
  4. 平板连接路由器掉线问题
  5. 小数加分数怎样计算讲解_小学数学整数、小数、分数加减法运算法则及练习(可打印)...
  6. 图像的Hessian矩阵
  7. rg1 蓝光危害rg0_新国标:儿童LED台灯防蓝光危害评估结果必须是RG0
  8. 【建议收藏】Redis学习笔记
  9. vue中使用bootstrapvue
  10. php基础(09):php模板引擎Smarty