轮廓系数(Silhouette Coefficient),是聚类效果好坏的一种评价方式。最早由 Peter J. Rousseeuw 在 1986 提出。它结合内聚度和分离度两种因素。可以用来在相同原始数据的基础上用来评价不同算法、或者算法不同运行方式对聚类结果所产生的影响。
方法sklearn.metrics.silhouette_score(X, labels, metric=‘Euclidean’,sample_size=None, random_state=None, **kwds)返回所有样本的平均轮廓系数。
轮廓系数用于计算每个样本的平均簇内距离a(样本i到同簇其他样本的平均距离,ai值越小说明该样本越应该被聚到该类,即簇内不相似度)和平均邻近簇距离b(样本i到其他相邻簇的所有样本的平均距离bi,bi越大说明样本i越不属于其他簇,即簇间不相似度)。每个样本的轮廓系数计算公式为:(b-a)/Max(a,b),轮廓系数越接近1说明结果越好(聚类越准确),越接近-1说明结果越差,若值在0值附近,则说明样本在两个簇的边界上。
原文链接:http://blog.sina.com.cn/s/blog_1451b33d20102y2kk.html

轮廓系数sklearn.metrics.silhouette_score相关推荐

  1. 样本轮廓系数(原理、sklearn.metrics.silhouette_score、silhouette_samples参数介绍)

    一.轮廓系数含义: 轮廓系数(Silhouette Coefficient),是聚类效果好坏的一种评价方式. 最佳值为1,最差值为-1.接近0的值表示重叠的群集.负值通常表示样本已分配给错误的聚类,因 ...

  2. Kmeans聚类③——Kmeans聚类原理轮廓系数Sklearn实现

    数据分析目录(文末有超级彩蛋!): 一.Excel系列--四大常用函数及十大高级图表 二.SQL系列--性能优化/多表关联/窗口分析函数等 三.统计学系列--概率论/置信区间/相关/抽样等 四.Pan ...

  3. python sklearn库silhouette_score轮廓系数接口调用

    官方接口说明:https://scikit-learn.org/stable/modules/generated/sklearn.metrics.silhouette_score.html#sklea ...

  4. python计算3j系数_聚类算法评估——轮廓系数及python实现

    含义 轮廓系数(Silhouette Coefficient),是聚类效果好坏的一种评价方式. 可见轮廓系数的值是介于 [-1,1] ,越趋近于1代表内聚度和分离度都相对较优. 计算步骤 1)对于簇中 ...

  5. 机器学习之K均值的SSE和轮廓系数

    前文回顾: 肘部法:SSE误差平方和 SSE(sum of the squared errors)是对簇松散度的衡量,作为目标函数其实是一个严格的坐标下降(Coordinate Decendet)过程 ...

  6. point 如何求elbow_如何选择kmeans中的k值——肘部法则–Elbow Method和轮廓系数–Silhouette...

    肘部法则–Elbow Method 我们知道k-means是以最小化样本与质点平方误差作为目标函数,将每个簇的质点与簇内样本点的平方距离误差和称为畸变程度(distortions),那么,对于一个簇, ...

  7. spark聚类算法的聚类效果评估指标“轮廓系数”细节

    什么是轮廓系数? 参见百度百科,讲的很清楚此处不赘述: https://baike.baidu.com/item/%E8%BD%AE%E5%BB%93%E7%B3%BB%E6%95%B0/173616 ...

  8. 机器学习数据分析之-轮廓系数(评估聚类结果)

    在学习使用k-means算法进行负载聚类分析时看到了这样的图,查了之后是用轮廓系数来评估分类结果的准确度或者称合适度. silhouette 是一个衡量一个结点与它属聚类相较于其它聚类的相似程度. 取 ...

  9. [机器学习与scikit-learn-26]:算法-聚类-KMeans寻找最佳轮廓系数

    作者主页(文火冰糖的硅基工坊):文火冰糖(王文兵)的博客_文火冰糖的硅基工坊_CSDN博客 本文网址:https://blog.csdn.net/HiWangWenBing/article/detai ...

最新文章

  1. 教你用深度学习LSTM网络预测流行音乐趋势(附代码)
  2. OSPF的route-id选举
  3. linux检查邮件命令,Linux:mail的邮件收发及查看
  4. 【软件工程-Teamwork 3】团队角色分配和团队贡献分分配规则
  5. python编程自学能学会吗-python编程还能自学?怎么能学好? - 【大连东软睿道】
  6. 基于Django的乐观锁与悲观锁解决订单并发问题的一点浅见
  7. SpringCloud-路由网关(Zuul)
  8. 西门子,欧姆龙,施耐德PLC通信电缆制作图
  9. 【ihaonet微测试】你出题,我开发
  10. MATLAB图像灰度化—优化三种灰度化算法
  11. qq空间留言板php,qq留言板留言关心的话 qq空间留言板签名档图片
  12. SpringBoot的test测试类报com.netflix.discovery.shared.transport.TransportException异常
  13. 医院科室管理系统(IDEA开发)
  14. Deepin 微信版本太低无法登录
  15. matlab谐振峰值,谐振峰值Mr怎么求?
  16. 如何有效地学习知识,如何才能全面发展?
  17. 【ELM预测】基于粒子群算法PSO优化极限学习机预测含Matlab源码
  18. 8、取得比普通员工 的最高薪水还要高的领导人姓名【bjpowernode34道SQL题】
  19. 外卖cps 赚钱小程序源码
  20. 在 Flutter 中自定义画笔 Painter

热门文章

  1. h5逻辑_h5页面在微信打开-导航栏标题如何设置
  2. iOS定位示例与原理
  3. 被问 Linux 命令 su 和 sudo 的区别?当场蒙了!
  4. 常用的matlab函数命令
  5. 稳压二极管+三端稳压的双重电压分析
  6. 边打dota边学java 第一篇
  7. zip4j的正确使用方式
  8. 基于CPLD的数字时钟设计
  9. 终极解决方案:使用teamviewer和todesk时Visual Studio等软件显示全白或者全黑的解决办法!
  10. SwiftUI CloudKit 入门之 10 获取iCloud容器的API令牌