K-Means 聚类实例sample
假定我们有如下9个点
A1(2, 10) A2(2, 5) A3(8, 4) A4(5, 8) A5(7, 5) A6(6, 4) A7(1, 2) A8(4, 9)
希望分成3个聚类
初始化选择 A1(2, 10), A4(5, 8) ,A7(1, 2)为聚类中心点,两点距离定义为ρ(a, b) = |x2 – x1| + |y2 – y1| .
第一步
Iteration 1
(2, 10) |
(5, 8) |
(1, 2) |
|||
|
Point |
Dist Mean cluster 1 |
Dist Mean cluster2 |
Dist Mean cluster 3 |
Cluster |
A1 |
(2, 10) |
||||
A2 |
(2, 5) |
||||
A3 |
(8, 4) |
||||
A4 |
(5, 8) |
||||
A5 |
(7, 5) |
||||
A6 |
(6, 4) |
||||
A7 |
(1, 2) |
||||
A8 |
(4, 9) |
对A1点,计算其到每个cluster 的距离
A1->class1 = |2-2|+|10-10}=0
A1->class2 = |2-5|+|10-8|=5
A1->class3 = |2-1|+|10-2|=9
因此A1 属于cluster1
(2, 10) |
(5, 8) |
(1, 2) |
|||
|
Point |
Dist Mean cluster 1 |
Dist Mean cluster 2 |
Dist Mean cluster 3 |
Cluster |
A1 |
(2, 10) |
0 |
5 |
9 |
1 |
A2 |
(2, 5) |
||||
A3 |
(8, 4) |
||||
A4 |
(5, 8) |
||||
A5 |
(7, 5) |
||||
A6 |
(6, 4) |
||||
A7 |
(1, 2) |
||||
A8 |
(4, 9) |
余下继续计算,直到
(2, 10) |
(5, 8) |
(1, 2) |
|||
|
Point |
Dist Mean cluster 1 |
Dist Mean cluster 2 |
Dist Mean cluster 3 |
Cluster |
A1 |
(2, 10) |
0 |
5 |
9 |
1 |
A2 |
(2, 5) |
5 |
6 |
4 |
3 |
A3 |
(8, 4) |
12 |
7 |
9 |
2 |
A4 |
(5, 8) |
5 |
0 |
10 |
2 |
A5 |
(7, 5) |
10 |
5 |
9 |
2 |
A6 |
(6, 4) |
10 |
5 |
7 |
2 |
A7 |
(1, 2) |
9 |
10 |
0 |
3 |
A8 |
(4, 9) |
3 |
2 |
10 |
2 |
重新计算中心点
cluster1只有1个点,因此A1为中心点
cluster2的中心点为 ( (8+5+7+6+4)/5,(4+8+5+4+9)/5 )=(6,6)。注意:这个点并不实际存在。
cluster3的中心点为( (2+1)/2, (5+2)/2 )= (1.5, 3.5)
图形化的过程如下:
持续迭代,直到前后两次迭代不发生变化为止,如下:
以上例子来源:http://www.google.com/url?sa=t&rct=j&q=&esrc=s&frm=1&source=web&cd=1&ved=0CDsQFjAA&url=http%3A%2F%2Ffaculty.uscupstate.edu%2Fatzacheva%2FSHIM450%2FKMeansExample.doc&ei=ZDMVT56XJOmoiQLeyLm9DQ&usg=AFQjCNHMUw4sLHM82Pu6cXc2DTSz-cz2pw
from: http://blog.csdn.net/pennyliang/article/details/7207466
K-Means 聚类实例sample相关推荐
- OpenCV的k - means聚类 -对图片进行颜色量化
OpenCV的k - means聚类 目标 学习使用cv2.kmeans()数据聚类函数OpenCV 理解参数 输入参数 样品:它应该的np.float32数据类型,每个特性应该被放在一个单独的列. ...
- OpenCV官方文档 理解k - means聚类
理解k - means聚类 目标 在这一章中,我们将了解k - means聚类的概念,它是如何工作等. 理论 我们将这个处理是常用的一个例子. t恤尺寸问题 考虑一个公司要发布一个新模型的t恤. 显然 ...
- k means聚类算法_K-Means 聚类算法 20210108
说到聚类,应先理解聚类和分类的区别 聚类和分类最大的不同在于:分类的目标是事先已知的,而聚类则不一样,聚类事先不知道目标变量是什么,类别没有像分类那样被预先定义出来. K-Means 聚类算法有很多种 ...
- k means聚类算法_一文读懂K-means聚类算法
1.引言 什么是聚类?我们通常说,机器学习任务可以分为两类,一类是监督学习,一类是无监督学习.监督学习:训练集有明确标签,监督学习就是寻找问题(又称输入.特征.自变量)与标签(又称输出.目标.因变量) ...
- 机器学习(十四):K均值聚类(kmeans)
k均值聚类方法是一种无监督机器学习技术,用于识别数据集中的数据对象集群.有许多不同类型的聚类方法,但k -means是最古老和最平易近人的方法之一.这些特性使得在 Python 中实现k -means ...
- k均值聚类算法考试例题_k means聚类算法实例
所谓聚类问题,就是给定一个元素集合D,其中每个元素具有n个可观察属性,使用某种算法将D划分成k个子集,要求每个子集内部的元素之间相异度尽可能低,而不同子集的元素相异度尽可能高.其中每个子集叫做一个簇. ...
- OpenCV k均值聚类kmeans clustering的实例(附完整代码)
OpenCV k均值聚类kmeans clustering的实例 OpenCV k均值聚类kmeans clustering的实例 OpenCV k均值聚类kmeans clustering的实例 # ...
- matlab—— K均值聚类算法的步骤和实例
一.K均值聚类法分为如下几个步骤: 1. 初始化聚类中心 (1)凭经验选择.根据具体问题,凭经验从样本集中选出个 K 比较合适的样本作为初始聚类中心. (2)用前 K 个样本作为初始聚类中心. (3) ...
- k均值聚类算法(K Means)及其实战案例
算法说明 K均值聚类算法其实就是根据距离来看属性,近朱者赤近墨者黑.其中K表示要聚类的数量,就是说样本要被划分成几个类别.而均值则是因为需要求得每个类别的中心点,比如一维样本的中心点一般就是求这些样本 ...
最新文章
- Error in ggplot(df, aes(x = x, y = y)) : could not find function “ggplot“
- sharedpreferences 重启不保存_MMKV为什么可以替换SharedPreferences
- spring-cloud-sleuth+zipkin追踪服务实现(一)
- C/C++语言简介之关键字
- 。。。。。etc 时域错误隐藏个人理解
- python3提取字符串中的数字_如何在Python中从字符串中提取数字?
- Day9--Python--函数入门
- Python: str.split()和re.split()的区别
- 通过maven命令获取参数值
- 关于音频芯片MICIN和LINEIN,HPOUT和OUT的区别
- nopCommerce 3.9 大波浪系列 之 汉化-Roxy Fileman
- 华为hcip认证考试内容是什么?hcip认证有哪些方向
- 常用的抓包工具有哪些?
- android脚本精灵开发,触动精灵脚本开发示例代码
- dede分类名称_dede常用标签分类整理
- PS 滤镜——(扭曲)逆球面化 (凹陷效果)
- 记一次机器内存过高引起的线上故障
- springboot整合mybatis之Invalid bound statement解决
- faststone capture注册码
- 虚拟服务器hydra,使用hydra构建六大服务器及混合服务器
热门文章
- 程序化广告交易中的点击率预估
- 流行的就是最好的:Android开发者的职场规划
- elementui表格复制_Element-UI中关于table表格的那些骚操作
- jvm性能调优实战 -56没有WHERE条件的SQL语句引发的OOM MAT 排查步骤
- Apache Kafka-max.poll.interval.ms参数含义说明
- 实战SSM_O2O商铺_45【Redis缓存】配置Redis在Service层加入缓存
- Spring-Spring 开发环境搭建及HelloSpring
- minecraft666java_我的世界的666的世界
- linux源码编译rpm,Linux的RPM和源码包(CentOS)
- 用sk-learn的pipline的时候,现:TypeError: ‘Pipeline‘ object is not subscriptable