Caliński, Tadeusz, and Jerzy Harabasz. “A dendrite method for cluster analysis.” Communications in Statistics-theory and Methods 3.1 (1974): 1-27.

公式与简介

CH指标的计算公式是:s=tr(Bk)tr(Wk)×nE−kk−1s = \frac{\mathrm{tr}(B_k)}{\mathrm{tr}(W_k)} \times \frac{n_E - k}{k - 1}s=tr(Wk​)tr(Bk​)​×k−1nE​−k​

其中BkB_{k}Bk​ 为 between-clusters dispersion mean(类间距离),WkW_{k}Wk​为 within-cluster dispersion(类内部的距离),详细公式如下:

Wk=∑q=1k∑x∈Cq(x−cq)(x−cq)TW_k = \sum_{q=1}^k \sum_{x \in C_q} (x - c_q) (x - c_q)^TWk​=∑q=1k​∑x∈Cq​​(x−cq​)(x−cq​)T

Bk=∑q=1knq(cq−cE)(cq−cE)TB_k = \sum_{q=1}^k n_q (c_q - c_E) (c_q - c_E)^TBk​=∑q=1k​nq​(cq​−cE​)(cq​−cE​)T

WkW_{k}Wk​ 中:CqC_qCq​表示当前点所在的类qqq;cqc_qcq​是当前类qqq的聚类中心点

BkB_{k}Bk​ 中:CeC_eCe​表示类eee的中心;nqn_qnq​表示类别qqq包含的点数。

值越大表示聚类效果越好

代码实现

import pandas as pd
import numpy as np
from sklearn import metrics
from sklearn.cluster import KMeansdataframe = pd.DataFrame(data=np.random.randint(0, 50, size=(200, 10)))
# 以kmeans聚类方法为例
kmeans_model = KMeans(n_clusters=3, random_state=1).fit(dataframe)
labels = kmeans_model.labels_
score = metrics.calinski_harabasz_score(dataframe, labels)
print(score)

参考文章

sklearn:https://scikit-learn.org/stable/modules/clustering.html#calinski-harabasz-index

聚类效果评价——Calinski-Harabasz(CH指标)——内部评估标准(2)相关推荐

  1. 聚类效果评价——Davies-Bouldin(DB指标)——内部评估标准(3)

    Davies, David L., and Donald W. Bouldin. "A cluster separation measure." IEEE transactions ...

  2. K-Means聚类算法 — 算法原理、质心计算、距离度量、聚类效果评价及优缺点

    分类知识   分类是根据样本某些属性或某类特征(可以融合多类特征),把样本类型归为已确定的某一类别中.机器学习中常见的分类算法有:SVM(支持向量机).KNN(最邻近法).Decision Tree( ...

  3. 聚类效果评价——Silhouette Coefficient(轮廓系数)——内部评估标准(1)

    公式与简介 Rousseeuw, Peter J. "Silhouettes: a graphical aid to the interpretation and validation of ...

  4. 聚类效果评估——轮廓系数(Silhouette Coefficient)附Python代码

    轮廓系数 前言 是什么? 为什么? 由此可得: 怎么用? 不适用 示例 前言 在机器学习中,无监督学习算法中聚类算法算作相对重要的一部分算法.也常在低资源和无标注的情况下使用. 其中KMeans作为聚 ...

  5. 聚类效果评估、内部指标(Jaccard系数、FM指数、Rand指数)、外部指标(DB指数、Dunn指数)、轮廓系数(Silhouette Coefficient)

    聚类效果评估.内部指标(Jaccard系数.FM指数.Rand指数).外部指标(DB指数.Dunn指数).轮廓系数(Silhouette Coefficient) 目录

  6. 聚类效果评估指标总结

    前言 实际工作中经常会用到一些聚类算法对一些数据进行聚类处理,如何评估每次聚类效果的好坏?可选的方法有1.根据一些聚类效果的指标来评估:2.直接打点.今天就主要总结下这段时间了解的聚类效果评估指标.废 ...

  7. rpn风险等级评价准则_2019一建经济学习重点:技术方案经济效果评价

    2019年一级建造师备考正在进行中,你是在看教材还是在刷题呢?今天优路教育小编是来送干货的,教材太厚,知识点太乱,那就来看这里的考点总结吧.接下来小编带大家一起学习<工程经济>第一章工程经 ...

  8. 重组标签云-标签聚类及其评价研究

    重组标签云-标签聚类及其评价研究 AlbertoPérez García-Plaza a*, Arkaitz Zubiaga b, Víctor Fresnoa,Raquel Martínez a a ...

  9. skfuzzy.cmeans与sklearn.KMeans聚类效果对比以及使用方法

    因为实验中要用到聚类效果的对比,没有时间自己来实现算法,所以Kmeans就用到了sklearn中的Kmeans类,FCM用到了skfuzzy.cmeans. 几个概念 1.Kmeans Kmeans是 ...

最新文章

  1. 基本url是由协议服务器,http协议基础之URL
  2. TTL and CMOS 的几个基本功能模块
  3. POJ 3608 Bridge Across Islands 《挑战程序设计竞赛》
  4. 为什么即使在班级均衡的情况下,准确度仍然令人困扰
  5. 让大数据分析更简单,4步教你玩转MongoDB BI Connector
  6. java运行win10_win10配置java运行环境
  7. OJ1006: 求等差数列的和
  8. 深度学习(三十八)卷积神经网络入门学习(2.0)
  9. 当TIME_WAIT状态的TCP正常挥手,收到SYN后…
  10. c++连接mysql的中文编码问题
  11. JavaScript强化教程——AngularJS 表达式
  12. WIN10下使用VS2017的MSVC编译FFMPEG3.4.2动态静态库
  13. php 实现网站克隆,自己写的php curl库实现整站克隆功能
  14. 脑电时频分析-短时傅里叶变换
  15. 计网 | 链路层协议及大题解构
  16. 单体架构与微服务架构的区别
  17. 高通WLAN框架学习(27)-- Types of regulatory 和WCNSS_qcom_cfg.ini配置参数
  18. 基于TPS(Thin Plate Spines)的STN网络的PyTorch实现
  19. JavaScript-百炼成仙(第1节掌握JavaScript基础1.1-1.21)
  20. android手机的语音助手在哪里设置,华为语音助手在哪设置 华为语音助手唤醒具体步骤...

热门文章

  1. 3dmax物体轴心点坐标和unity3d不一样_Unity3D新手必看:几个让你相见恨晚的小技巧...
  2. jupyter怎么调字体_夏天冰箱调到几档最好 冷藏调多少度合适
  3. Android:浏览器跳转
  4. 使用Adreno Profiler分析android游戏
  5. UE4 身体部件换装实现
  6. UE4 移动平台游戏开发
  7. UE4与WEB服务器交互(json)
  8. 2021-07-05 倒置链表(Cpp/C)
  9. SAP MM 如何取到供应商付款条款描述信息?
  10. Java应用程序的基本框架