目录

一、K-means

1、概念

2、过程

3、API(K-means)

二、K-means性能评估

1、轮廓系数

2、API(轮廓系数)


一、K-means

1、概念

无监督学习:没有目标值(没有标签)。

(聚类一般在分类之前,没有目标值的时候使用聚类)

采用迭代式的算法,直观易懂且实用。

缺点:容易受到局部最优解(避免:多次聚类,取多次聚类中心)。

最优解:k个中心点挤在一起。

例:对这些人物的分类,没有目标值,就是无监督学习。

2、过程

例:对该无规则点图片进行分类,无监督学习分成3个区域(无目标值):

1、先选择K个特征点作为特征中心;(这里分成3堆,3个特征点)

2、分别计算每个点到K个聚类中心的距离,选择最近的一个中心,标记类别与其一致;

3、接着对着标记的聚类中心之后,重新计算出每个聚类的新中心点(平均值);

4、如果计算得出的新中心点与原中心点一样,那么结束,否则重新进行第2步过程。

求解中心点:

3、API(K-means)

二、K-means性能评估

1、轮廓系数

ai:内部距离;

bi:外部距离。

轮廓系数分析:

 效果好的指标:高内聚,低耦合。(内部聚合,外部分开)

可以看出:

轮廓系数Sc =1时,聚类效果最好(bi>>ai,即外部距离远大于内部距离);

轮廓系数Sc=-1时,聚类效果最差(bi<<ai,即外部距离远小于内部距离)。

2、API(轮廓系数)

机器学习(17)无监督学习 -- K-means算法与性能评估相关推荐

  1. 机器学习之无监督学习-K均值聚类算法

    机器学习之无监督学习-K均值聚类算法 对于无监督学习,有两类重要的应用,一个是聚类,一个是降维.我们今天主要学习聚类中的K均值聚类. 我们先看看下图,图a为原始的数据点,我们想要对图a的数据点进行分类 ...

  2. 入门机器学习(十五)--无监督学习(K均值)

    1.无监督学习-简介(Unsupervised Learning-Introduction) 如下图所示是一个典型的监督学习,训练集中的每一个样本都有标签,我们需要根据标签来拟合一个假设函数. 什么是 ...

  3. Python 机器学习实战 —— 无监督学习(下)

    前言 在上篇< Python 机器学习实战 -- 无监督学习(上)>介绍了数据集变换中最常见的 PCA 主成分分析.NMF 非负矩阵分解等无监督模型,举例说明使用使用非监督模型对多维度特征 ...

  4. Python 机器学习实战 —— 无监督学习(上)

    ​​​ 前言 在上篇<Python 机器学习实战 -- 监督学习>介绍了 支持向量机.k近邻.朴素贝叶斯分类 .决策树.决策树集成等多种模型,这篇文章将为大家介绍一下无监督学习的使用. 无 ...

  5. 机器学习之无监督学习——聚类

    机器学习之无监督学习--聚类 无监督学习 一.基于划分的聚类方法 1.基于划分的方法 简介 A.概念 B.分组 C.分组与样本 对应关系 D.硬聚类 与 软聚类 二.基于层次的聚类方法 1.基于层次的 ...

  6. 无监督学习--K-means聚类算法学习

    无监督学习–K-means聚类算法学习 介绍:k-means算法以k为参数,把n个对象分成k个簇,使簇内具有较高的相似度,而簇间的相似度比较低. 其处理过程如下: 1.随机选择k个点作为初始的聚类中心 ...

  7. 无监督学习之Kmeans算法

    Kmeans算法 1.算法区别 1.1.无监督学习与聚类算法理论的区别 1.2.聚类和分类算法的区别 2.Kmeans算法原理 2.1算法属性含义 2.2 算法结果预测 2.3 `Kmeans`有损失 ...

  8. 【机器学习】无监督学习

    [机器学习]无监督学习 https://mp.weixin.qq.com/s/NV84o6Jd_z8evjq05n2jzA 作者:水奈樾  人工智能爱好者 博客专栏:http://www.cnblog ...

  9. kmeans改进 matlab,基于距离函数的改进k―means 算法

    摘要:聚类算法在自然科学和和社会科学中都有很普遍的应用,而K-means算法是聚类算法中经典的划分方法之一.但如果数据集内相邻的簇之间离散度相差较大,或者是属性分布区间相差较大,则算法的聚类效果十分有 ...

最新文章

  1. 12.6%!IJCAI 2020接收率断崖式下跌,但还是有华人大佬中了三篇
  2. mongodb导入bson文件_Python爬虫进阶教程(七):MongoDB数据库
  3. R语言ggplot2可视化交互作用图(Interaction Plot):可视化不同分组(分类变量1)在不同剂量下(分类变量2)的箱图(box plot)、均值计算并连接成线图(line plot)
  4. Mongodb的索引
  5. Tiled 瓦片地图
  6. Dapr + .NET 实战(十三)跨语言开发
  7. php页面添加链接,怎么给一个PHP密码访问页面加超链接
  8. 【vijos P1914】【codevs 3904】[NOIP2014 普及组T4]子矩阵(dfs+状压dp)
  9. MongoDB中常用的几种数据类型
  10. python经典题库和答案_Python99道经典练习题答案.docx
  11. [转载]网页栅格系统研究(1):960的秘密
  12. ajax实现评论区功能,Ajax实现评论中顶和踩功能的实例代码
  13. 当前串口号不可以或被占用_原来团建是可以不占用私人时间当然,还可以拿加班费|不一样的团建...
  14. office2007过期后没有输入序列号对话框的激活方法
  15. Sliver RecyclerView 功能最强大、最好用的适配器
  16. 哥德巴赫猜想 php,哥德巴赫猜想的程序验证
  17. 杂谈:WiFi7 -802.11ax的实现成本
  18. 高等数学-线性代数:已知特征值,求解特征空间的特征向量
  19. 新手怎么租用传奇服务器
  20. 说说dota、人生、程序(长篇、神经质)

热门文章

  1. Android 获取联网的IP地址
  2. 微信小程序下拉刷新和上拉加载
  3. python join split
  4. url中去掉index.php,方便redirect()
  5. 用sed 给文本文件加行号
  6. 《监控》再起风云,连同创作中的《监控2》成功牵手影视公司
  7. Calling Oracle stored procedures from Microsoft.NET
  8. 微软图表控件MsChart
  9. linux7挂载ntfs分区,刚安装centos7,请教大神如何挂载ntfs的分区
  10. usaco Network of Schools