层次化聚类可以使用树图表示。

自顶向下: 所有节点当做同一类, 然后逐层划分

自底向上: 每个节点都是独立的类, 然后逐层合并

其中需要用到两个距离函数, 用来识别“相似”:

1 metric: N范式、高维向量夹角衡量点与点之间的相似度

2 linkage:衡量类与类之间的相似度:

2.1) max{d(x,h): x in A, y in B}

2.2) min{d(x,h): x in A, y in B}

2.3) sigma(d(x,y))/(|A|*|B|), 均值, 类间所有点的距离之和的均值

以下几个不甚明白

  • The sum of all intra-cluster variance.
  • The increase in variance for the cluster being merged (Ward's criterion).
  • The probability that candidate clusters spawn from the same distribution function (V-linkage).
  • 在树的每一层都是一种聚类结果及对应的类个数

    http://en.wikipedia.org/wiki/Hierarchical_clustering

    基于划分

    k-means, 优势是算法简单且快,可以处理大数据量;

    缺点是每次算法过程得到的结果并不一定相同,取决于初始的随机k个质点;最小化了类内的方差,但不保证全局的最小方差; 并且要求均值是可定义的有意义的(质点是用均值计算得到的)【当均值无意义时, 可以使用k-medoids代替, 该算法选取中位点作为质点】

    模糊c-means: 点可以概率性的属于多个类

    QT clustering(quality threshold), 算法流程:

    • The user chooses a maximum diameter for clusters.
    • Build a candidate cluster for each point by iteratively including the point that is closest to the group, until the diameter of the cluster surpasses the threshold.
    • Save the candidate cluster with the most points as the first true cluster, and remove all points in the cluster from further consideration. Must clarify what happens if more than 1 cluster has the maximum number of points ?
    • Recurse with the reduced set of points.

    The distance between a point and a group of points is computed using complete linkage, i.e. as the maximum distance from the point to any member of the group (see the "Agglomerative hierarchical clustering" section about distance between clusters).

    spectral clustering:

clustering相关推荐

  1. 聚类Clustering

    聚类Clustering This page describes clustering algorithms in MLlib. The guide for clustering in the RDD ...

  2. 读自动驾驶激光雷达物体检测技术(Lidar Obstacle Detection)(4):Clustering(欧式聚类)

    在第(3)实现了地面点与障碍物的分离,此部分要实现的是聚类,聚类是指把不同物体的点云分别组合聚集起来, 从而能让你跟踪汽车, 行人等多个目标. 其中一种对点云数据进行分组和聚类的方法称为欧氏聚类. 欧 ...

  3. 2018/8/26 PSO-based Clustering Techniques to Solve Multimodal Optimization Problems: A Survey

    信息:  2018年    米尔普尔科技大学 题目: PSO-based Clustering Techniques to Solve Multimodal Optimization Problems ...

  4. python使用sklearn中的make_blobs函数生成聚类(clustering)分析需要的仿真数据、matplotlib可视化生成的仿真数据

    python使用sklearn中的make_blobs函数生成聚类(clustering)分析需要的仿真数据.matplotlib可视化生成的仿真数据 目录

  5. R语言层次聚类(hierarchical clustering):数据缩放、PCA聚类结果可视化、fpc包的clusterboot函数通过bootstrap重采样的方法评估hclust层次聚类的稳定性

    R语言层次聚类(hierarchical clustering):数据缩放.PCA聚类结果可视化.fpc包的clusterboot函数通过bootstrap重采样的方法评估hclust层次聚类的稳定性 ...

  6. R语言层次聚类(hierarchical clustering):使用scale函数进行特征缩放、hclust包层次聚类(创建距离矩阵、聚类、绘制树状图dendrogram,在树状图上绘制红色矩形框)

    R语言层次聚类(hierarchical clustering):使用scale函数进行特征缩放.hclust包层次聚类(创建距离矩阵.聚类.绘制树状图dendrogram,在树状图上绘制红色矩形框) ...

  7. R语言层次聚类(hierarchical clustering):特征缩放、抽取hclust中的聚类簇(cutree函数从hclust对象中提取每个聚类簇的成员)、基于主成分分析的进行聚类结果可视化

    R语言层次聚类(hierarchical clustering):特征缩放.抽取hclust中的聚类簇(cutree函数从hclust对象中提取每个聚类簇的成员).基于主成分分析的进行聚类结果可视化 ...

  8. R语言聚类分析之层次聚类(hierarchical clustering)实战

    R语言聚类分析之层次聚类(hierarchical clustering)实战 目录 R语言聚类分析之层次聚类(hierarchical clustering)实战 #距离计算

  9. 使用聚类算法进行标签传播学习(Clustering for Semi-Supervised Learning)

    使用聚类算法进行标签传播学习(Clustering for Semi-Supervised Learning) 目录 使用聚类算法进行标签传播学习(Clustering for Semi-Superv ...

  10. R构建层次聚类模型(Hierarchical Clustering)

    R构建层次聚类模型(Hierarchical Clustering) 目录 R构建层次聚类模型(Hierarchical Clustering) 聚类 什么是层次聚类?

最新文章

  1. Google的深度学习强在哪?谷歌首席科学家说了这些奇妙特性
  2. 腾讯2019暑期实习生提前批CV岗笔试题
  3. linux+4.4+android,Ubuntu 14.04 x64配置Android 4.4 kitkat编译环境的方法
  4. apache kafka_Apache Kafka消费者再平衡
  5. Spring Cloud Feign 负载均衡
  6. 冒泡排序和选择排序的JAVA程序
  7. zz在Ubuntu中通过源码安装编译安装软件(MySQL篇)
  8. 全新的Windows Phone 8开发资源汇总
  9. 如何成为一个AI产品经理?
  10. 数据分析团队的搭建与思考
  11. 测试象棋水平用哪个软件好,最新象棋软件作弊名单公布,软件测试员都被封,哪些网络象棋主播...
  12. 鸿蒙系统卸载App,强力卸载手机软件
  13. 关闭eslint语法检查
  14. 重磅!《中国医学影像人工智能发展报告2021-2022》
  15. c语言宏定义在预处理阶段,预处理和宏定义
  16. 3D真人手办,做一个迷你版的自己
  17. Java语言基础-面向对象编程三步走之打开冰箱门
  18. linux 系统开发
  19. nas 微型计算机,NETGEAR无线路由器和NAS试用
  20. ESP32-CAM:机器视觉视觉摄像头

热门文章

  1. CS231n课程笔记翻译
  2. Caffe学习系列(19): 绘制loss和accuracy曲线
  3. IaaS,PaaS,SaaS 的区别
  4. Github系列之二:开源 一行代码实现多形式多动画的推送小红点WZLBadge(iOS)
  5. OpenCV中SUFR、SIFT无法使用的原因及解决办法
  6. 解析几何:第三章 平面上的直线
  7. Stanford UFLDL教程 深度网络概览
  8. Spring Boot 参考指南(运行你的应用程序)
  9. 移动端banner css3(@keyframes )实现
  10. GitLab远程仓库迁移