假定我们有如下9个点

A1(2, 10)  A2(2, 5) A3(8, 4)  A4(5, 8)  A5(7, 5) A6(6, 4)  A7(1, 2)  A8(4, 9)

希望分成3个聚类

初始化选择 A1(2, 10),  A4(5, 8) ,A7(1, 2)为聚类中心点,两点距离定义为ρ(a, b) = |x2 – x1| + |y2 – y1| .

第一步

Iteration 1

(2, 10)

(5, 8)

(1, 2)

 

Point

Dist Mean cluster 1

Dist Mean cluster2

Dist Mean cluster 3

Cluster

A1

(2, 10)

A2

(2, 5)

A3

(8, 4)

A4

(5, 8)

A5

(7, 5)

A6

(6, 4)

A7

(1, 2)

A8

(4, 9)

对A1点,计算其到每个cluster 的距离

A1->class1 = |2-2|+|10-10}=0

A1->class2 = |2-5|+|10-8|=5

A1->class3 = |2-1|+|10-2|=9

因此A1 属于cluster1

(2, 10)

(5, 8)

(1, 2)

 

Point

Dist Mean cluster  1

Dist Mean cluster 2

Dist Mean cluster 3

Cluster

A1

(2, 10)

0

5

9

1

A2

(2, 5)

A3

(8, 4)

A4

(5, 8)

A5

(7, 5)

A6

(6, 4)

A7

(1, 2)

A8

(4, 9)

余下继续计算,直到

(2, 10)

(5, 8)

(1, 2)

 

Point

Dist Mean cluster 1

Dist Mean cluster 2

Dist Mean cluster 3

Cluster

A1

(2, 10)

0

5

9

1

A2

(2, 5)

5

6

4

3

A3

(8, 4)

12

7

9

2

A4

(5, 8)

5

0

10

2

A5

(7, 5)

10

5

9

2

A6

(6, 4)

10

5

7

2

A7

(1, 2)

9

10

0

3

A8

(4, 9)

3

2

10

2

重新计算中心点

cluster1只有1个点,因此A1为中心点

cluster2的中心点为 ( (8+5+7+6+4)/5,(4+8+5+4+9)/5 )=(6,6)。注意:这个点并不实际存在。

cluster3的中心点为( (2+1)/2, (5+2)/2 )= (1.5, 3.5)

图形化的过程如下:

持续迭代,直到前后两次迭代不发生变化为止,如下:

以上例子来源:http://www.google.com/url?sa=t&rct=j&q=&esrc=s&frm=1&source=web&cd=1&ved=0CDsQFjAA&url=http%3A%2F%2Ffaculty.uscupstate.edu%2Fatzacheva%2FSHIM450%2FKMeansExample.doc&ei=ZDMVT56XJOmoiQLeyLm9DQ&usg=AFQjCNHMUw4sLHM82Pu6cXc2DTSz-cz2pw

from: http://blog.csdn.net/pennyliang/article/details/7207466

K-Means 聚类实例sample相关推荐

  1. OpenCV的k - means聚类 -对图片进行颜色量化

    OpenCV的k - means聚类 目标 学习使用cv2.kmeans()数据聚类函数OpenCV 理解参数 输入参数 样品:它应该的np.float32数据类型,每个特性应该被放在一个单独的列. ...

  2. OpenCV官方文档 理解k - means聚类

    理解k - means聚类 目标 在这一章中,我们将了解k - means聚类的概念,它是如何工作等. 理论 我们将这个处理是常用的一个例子. t恤尺寸问题 考虑一个公司要发布一个新模型的t恤. 显然 ...

  3. k means聚类算法_K-Means 聚类算法 20210108

    说到聚类,应先理解聚类和分类的区别 聚类和分类最大的不同在于:分类的目标是事先已知的,而聚类则不一样,聚类事先不知道目标变量是什么,类别没有像分类那样被预先定义出来. K-Means 聚类算法有很多种 ...

  4. k means聚类算法_一文读懂K-means聚类算法

    1.引言 什么是聚类?我们通常说,机器学习任务可以分为两类,一类是监督学习,一类是无监督学习.监督学习:训练集有明确标签,监督学习就是寻找问题(又称输入.特征.自变量)与标签(又称输出.目标.因变量) ...

  5. 机器学习(十四):K均值聚类(kmeans)

    k均值聚类方法是一种无监督机器学习技术,用于识别数据集中的数据对象集群.有许多不同类型的聚类方法,但k -means是最古老和最平易近人的方法之一.这些特性使得在 Python 中实现k -means ...

  6. k均值聚类算法考试例题_k means聚类算法实例

    所谓聚类问题,就是给定一个元素集合D,其中每个元素具有n个可观察属性,使用某种算法将D划分成k个子集,要求每个子集内部的元素之间相异度尽可能低,而不同子集的元素相异度尽可能高.其中每个子集叫做一个簇. ...

  7. OpenCV k均值聚类kmeans clustering的实例(附完整代码)

    OpenCV k均值聚类kmeans clustering的实例 OpenCV k均值聚类kmeans clustering的实例 OpenCV k均值聚类kmeans clustering的实例 # ...

  8. matlab—— K均值聚类算法的步骤和实例

    一.K均值聚类法分为如下几个步骤: 1. 初始化聚类中心 (1)凭经验选择.根据具体问题,凭经验从样本集中选出个 K 比较合适的样本作为初始聚类中心. (2)用前 K 个样本作为初始聚类中心. (3) ...

  9. k均值聚类算法(K Means)及其实战案例

    算法说明 K均值聚类算法其实就是根据距离来看属性,近朱者赤近墨者黑.其中K表示要聚类的数量,就是说样本要被划分成几个类别.而均值则是因为需要求得每个类别的中心点,比如一维样本的中心点一般就是求这些样本 ...

最新文章

  1. Error in ggplot(df, aes(x = x, y = y)) : could not find function “ggplot“
  2. sharedpreferences 重启不保存_MMKV为什么可以替换SharedPreferences
  3. spring-cloud-sleuth+zipkin追踪服务实现(一)
  4. C/C++语言简介之关键字
  5. 。。。。。etc 时域错误隐藏个人理解
  6. python3提取字符串中的数字_如何在Python中从字符串中提取数字?
  7. Day9--Python--函数入门
  8. Python: str.split()和re.split()的区别
  9. 通过maven命令获取参数值
  10. 关于音频芯片MICIN和LINEIN,HPOUT和OUT的区别
  11. nopCommerce 3.9 大波浪系列 之 汉化-Roxy Fileman
  12. 华为hcip认证考试内容是什么?hcip认证有哪些方向
  13. 常用的抓包工具有哪些?
  14. android脚本精灵开发,触动精灵脚本开发示例代码
  15. dede分类名称_dede常用标签分类整理
  16. PS 滤镜——(扭曲)逆球面化 (凹陷效果)
  17. 记一次机器内存过高引起的线上故障
  18. springboot整合mybatis之Invalid bound statement解决
  19. faststone capture注册码
  20. 虚拟服务器hydra,使用hydra构建六大服务器及混合服务器

热门文章

  1. 程序化广告交易中的点击率预估
  2. 流行的就是最好的:Android开发者的职场规划
  3. elementui表格复制_Element-UI中关于table表格的那些骚操作
  4. jvm性能调优实战 -56没有WHERE条件的SQL语句引发的OOM MAT 排查步骤
  5. Apache Kafka-max.poll.interval.ms参数含义说明
  6. 实战SSM_O2O商铺_45【Redis缓存】配置Redis在Service层加入缓存
  7. Spring-Spring 开发环境搭建及HelloSpring
  8. minecraft666java_我的世界的666的世界
  9. linux源码编译rpm,Linux的RPM和源码包(CentOS)
  10. 用sk-learn的pipline的时候,现:TypeError: ‘Pipeline‘ object is not subscriptable