聚类评估算法-轮廓系数(Silhouette Coefficient )
轮廓系数(Silhouette Coefficient),是聚类效果好坏的一种评价方式。最早由 Peter J. Rousseeuw 在 1986 提出。它结合内聚度和分离度两种因素。可以用来在相同原始数据的基础上用来评价不同算法、或者算法不同运行方式对聚类结果所产生的影响。
方法:
1,计算样本i到同簇其他样本的平均距离ai。ai 越小,说明样本i越应该被聚类到该簇。将ai 称为样本i的簇内不相似度。
簇C中所有样本的a i 均值称为簇C的簇不相似度。
2,计算样本i到其他某簇Cj 的所有样本的平均距离bij,称为样本i与簇Cj 的不相似度。定义为样本i的簇间不相似度:bi =min{bi1, bi2, …, bik}
bi越大,说明样本i越不属于其他簇。
3,根据样本i的簇内不相似度a i 和簇间不相似度b i ,定义样本i的轮廓系数:
4,判断:
si接近1,则说明样本i聚类合理;
si接近-1,则说明样本i更应该分类到另外的簇;
若si 近似为0,则说明样本i在两个簇的边界上。
所有样本的s i 的均值称为聚类结果的轮廓系数,是该聚类是否合理、有效的度量。
聚类评估算法-轮廓系数(Silhouette Coefficient )相关推荐
- 聚类评价指标(轮廓系数 Silhouette coefficient)
聚类评价指标 最近在做聚类的项目,聚类得到结果后我们需要知道聚类的好坏,用哪个算法效果比较好.肯定要选择那个最好评价的算法.今天我们就不谈算法只谈算法结果的评价. 我也从网上看了很多的别人写的东西,总 ...
- 聚类--评估指标--轮廓系数
让我们来分析一下这个评价指标: 轮廓系数分析 对于第iii个对象,计算它到所属簇中所有其他元素的平均距离,记作aia_iai(体现凝聚度) 对于第 iii 个对象和不包含该对象的任意簇,计算该对象到 ...
- 聚类算法是什么?聚类(clustering)有哪些常用的评估方法?评估方法的公示是什么?轮廓系数(Silhouette Coefficient)、平方根标准误差、R方、ARI分别是什么?
聚类(clustering)算法是一种无监督方法,无因变量或者目标变量: 核心就一句话: 物以类聚,人以群分 企业在进行客户分析时,往往希望通过了解不同的客户具有什么不同的特征来实现以下三种目的: 精 ...
- 如何选择kmeans中的k值——肘部法则–Elbow Method和轮廓系数–Silhouette Coefficient...
肘部法则–Elbow Method 我们知道k-means是以最小化样本与质点平方误差作为目标函数,将每个簇的质点与簇内样本点的平方距离误差和称为畸变程度(distortions),那么,对于一个簇, ...
- point 如何求elbow_如何选择kmeans中的k值——肘部法则–Elbow Method和轮廓系数–Silhouette...
肘部法则–Elbow Method 我们知道k-means是以最小化样本与质点平方误差作为目标函数,将每个簇的质点与簇内样本点的平方距离误差和称为畸变程度(distortions),那么,对于一个簇, ...
- Sklearn 成长之路(五)K-means聚类及其评价指标——轮廓系数
聚类结果评价指标--轮廓系数 某个点的轮廓系数定义为: s=disMeanout−disMeaninmax(disMeanout,disMeanin)s =\frac{disMean_{out} - ...
- spark聚类算法的聚类效果评估指标“轮廓系数”细节
什么是轮廓系数? 参见百度百科,讲的很清楚此处不赘述: https://baike.baidu.com/item/%E8%BD%AE%E5%BB%93%E7%B3%BB%E6%95%B0/173616 ...
- 从霍普金斯系数到k-means聚类再到轮廓系数
霍普金斯系数 目的:在进行数据聚类时,我们要进行评估数据集的聚类趋势,因为我们希望数据是非均匀分布的(均匀分布没有聚类的意义),因此采用霍普金斯统计量,用于检验空间分布的变量的空间随机性,从而判断数据 ...
- python计算3j系数_聚类算法评估——轮廓系数及python实现
含义 轮廓系数(Silhouette Coefficient),是聚类效果好坏的一种评价方式. 可见轮廓系数的值是介于 [-1,1] ,越趋近于1代表内聚度和分离度都相对较优. 计算步骤 1)对于簇中 ...
最新文章
- 乐视云监控数据存放到influxdb中
- windows server 远程桌面安装和配置
- React-Native Navigator 过渡动画卡顿的解决方案
- 基于华为云的Django网站部署
- linux 内存监控工具,系统运维|你值得拥有 —— 25 个 Linux 性能监控工具
- Linq to Entity中连接两个数据库时要注意的问题
- 【Vue】—动态绑定v-bind
- HDU-1069 Monkey and Banana 动态规划
- 服务器响应401,如果服务器返回401响应,则重定向到登录页面(Redirect to login page if server returns 401 response)...
- 乾颐堂现任明教教主(2014年课程)TCPIP协议详解卷一 第九节课笔记
- Git 删除提交\commit的log记录、修改历史提交消息、删除历史提交、修改所有提交的邮箱地址、从所有提交中删除一个文件
- 物联网案例(三):工业物联网中故障预警与风险管理的规范性分析
- asciidoc_如何使用AsciiDoc创建博客
- Scrum板与Kanban如何抉择?敏捷工具:czsva板与按照mgzaqbpe
- vm14下centos7配置NAT模式
- SpringBoot之——热部署的两种方式
- 电脑开机各种蓝屏错误代码,U盘重装系统彻底解决
- java mission control_JVM系列九(虚拟机性能监控工具 - Java Mission Control).
- 2020牛客寒假算法基础集训营1 D hanayo和米饭
- elecworks中“插入点”的意思
热门文章
- Java某人再玩游戏的时候输入密码123456后成功进入游戏(输错5次则被强行退出)要求用程序实现密码验证的过程。
- 城市轨道交通信号系统学习笔记(一)信号系统的特点
- 台式计算机显示屏不亮,电脑开机显示屏不亮怎么办 电脑连接显示屏不显示怎么办...
- HDU 2448 Mining Station on the Sea 最短路+KM
- 易语言路由器服务器,无线路由器一键设置工具,制作过程,成品。
- 函数:GetDistance,计算两个经度纬度之间距离
- post请求路径出错NET:ERR_CONNECTION_RESET
- RootBeanDefinition、ChildBeanDefinition、GenericBeanDefinition的区别
- 磨金石教育设计干货分享|20个海报设计小技巧,果断打包带走
- 反向比例运算电路微分关系_干货|电源工程师必备求生技能——经典20种模拟电路...