机器学习(17)无监督学习 -- K-means算法与性能评估
目录
一、K-means
1、概念
2、过程
3、API(K-means)
二、K-means性能评估
1、轮廓系数
2、API(轮廓系数)
一、K-means
1、概念
无监督学习:没有目标值(没有标签)。
(聚类一般在分类之前,没有目标值的时候使用聚类)
采用迭代式的算法,直观易懂且实用。
缺点:容易受到局部最优解(避免:多次聚类,取多次聚类中心)。
最优解:k个中心点挤在一起。
例:对这些人物的分类,没有目标值,就是无监督学习。
2、过程
例:对该无规则点图片进行分类,无监督学习分成3个区域(无目标值):
1、先选择K个特征点作为特征中心;(这里分成3堆,3个特征点)
2、分别计算每个点到K个聚类中心的距离,选择最近的一个中心,标记类别与其一致;
3、接着对着标记的聚类中心之后,重新计算出每个聚类的新中心点(平均值);
4、如果计算得出的新中心点与原中心点一样,那么结束,否则重新进行第2步过程。
求解中心点:
3、API(K-means)
二、K-means性能评估
1、轮廓系数
ai:内部距离;
bi:外部距离。
轮廓系数分析:
效果好的指标:高内聚,低耦合。(内部聚合,外部分开)
可以看出:
轮廓系数Sc =1时,聚类效果最好(bi>>ai,即外部距离远大于内部距离);
轮廓系数Sc=-1时,聚类效果最差(bi<<ai,即外部距离远小于内部距离)。
2、API(轮廓系数)
机器学习(17)无监督学习 -- K-means算法与性能评估相关推荐
- 机器学习之无监督学习-K均值聚类算法
机器学习之无监督学习-K均值聚类算法 对于无监督学习,有两类重要的应用,一个是聚类,一个是降维.我们今天主要学习聚类中的K均值聚类. 我们先看看下图,图a为原始的数据点,我们想要对图a的数据点进行分类 ...
- 入门机器学习(十五)--无监督学习(K均值)
1.无监督学习-简介(Unsupervised Learning-Introduction) 如下图所示是一个典型的监督学习,训练集中的每一个样本都有标签,我们需要根据标签来拟合一个假设函数. 什么是 ...
- Python 机器学习实战 —— 无监督学习(下)
前言 在上篇< Python 机器学习实战 -- 无监督学习(上)>介绍了数据集变换中最常见的 PCA 主成分分析.NMF 非负矩阵分解等无监督模型,举例说明使用使用非监督模型对多维度特征 ...
- Python 机器学习实战 —— 无监督学习(上)
前言 在上篇<Python 机器学习实战 -- 监督学习>介绍了 支持向量机.k近邻.朴素贝叶斯分类 .决策树.决策树集成等多种模型,这篇文章将为大家介绍一下无监督学习的使用. 无 ...
- 机器学习之无监督学习——聚类
机器学习之无监督学习--聚类 无监督学习 一.基于划分的聚类方法 1.基于划分的方法 简介 A.概念 B.分组 C.分组与样本 对应关系 D.硬聚类 与 软聚类 二.基于层次的聚类方法 1.基于层次的 ...
- 无监督学习--K-means聚类算法学习
无监督学习–K-means聚类算法学习 介绍:k-means算法以k为参数,把n个对象分成k个簇,使簇内具有较高的相似度,而簇间的相似度比较低. 其处理过程如下: 1.随机选择k个点作为初始的聚类中心 ...
- 无监督学习之Kmeans算法
Kmeans算法 1.算法区别 1.1.无监督学习与聚类算法理论的区别 1.2.聚类和分类算法的区别 2.Kmeans算法原理 2.1算法属性含义 2.2 算法结果预测 2.3 `Kmeans`有损失 ...
- 【机器学习】无监督学习
[机器学习]无监督学习 https://mp.weixin.qq.com/s/NV84o6Jd_z8evjq05n2jzA 作者:水奈樾 人工智能爱好者 博客专栏:http://www.cnblog ...
- kmeans改进 matlab,基于距离函数的改进k―means 算法
摘要:聚类算法在自然科学和和社会科学中都有很普遍的应用,而K-means算法是聚类算法中经典的划分方法之一.但如果数据集内相邻的簇之间离散度相差较大,或者是属性分布区间相差较大,则算法的聚类效果十分有 ...
最新文章
- 12.6%!IJCAI 2020接收率断崖式下跌,但还是有华人大佬中了三篇
- mongodb导入bson文件_Python爬虫进阶教程(七):MongoDB数据库
- R语言ggplot2可视化交互作用图(Interaction Plot):可视化不同分组(分类变量1)在不同剂量下(分类变量2)的箱图(box plot)、均值计算并连接成线图(line plot)
- Mongodb的索引
- Tiled 瓦片地图
- Dapr + .NET 实战(十三)跨语言开发
- php页面添加链接,怎么给一个PHP密码访问页面加超链接
- 【vijos P1914】【codevs 3904】[NOIP2014 普及组T4]子矩阵(dfs+状压dp)
- MongoDB中常用的几种数据类型
- python经典题库和答案_Python99道经典练习题答案.docx
- [转载]网页栅格系统研究(1):960的秘密
- ajax实现评论区功能,Ajax实现评论中顶和踩功能的实例代码
- 当前串口号不可以或被占用_原来团建是可以不占用私人时间当然,还可以拿加班费|不一样的团建...
- office2007过期后没有输入序列号对话框的激活方法
- Sliver RecyclerView 功能最强大、最好用的适配器
- 哥德巴赫猜想 php,哥德巴赫猜想的程序验证
- 杂谈:WiFi7 -802.11ax的实现成本
- 高等数学-线性代数:已知特征值,求解特征空间的特征向量
- 新手怎么租用传奇服务器
- 说说dota、人生、程序(长篇、神经质)