K-means它是一个聚类算法,它要求用户设定群集数k作为输入参数。因此,该算法的实施前。该数字预计将需要有集群。

如果有n点,需要收集k个簇中。

K-means算法首先从包括k个中心点的初始集合開始。即随机初始化簇的中心。随后,算法进行多次迭代处理并调整中心位置,知道达到最大迭代次数或中性收敛于固定点。

k-means聚类实例。选择三个随机点用作聚类中心(左上)。map阶段(右上)将每一个点赋给离其近期的簇。在reduce阶段(左下),取相互关联的点的均值。作为新的簇的中心位置,得到本轮迭代的终于布局(右下)。在每一轮迭代结束后。终于布局将被反馈给相同的循环过程。直到聚类中心的位置不再移动。

使用weka进行聚类:

 public static void main(String[] args) throws Exception {// 读入样本数据  Instances data = new Instances(new BufferedReader(new FileReader("E:\\Weka-3-6\\data\\contact-lenses.arff")));// 实例化化聚类算法SimpleKMeans kmeans = new SimpleKMeans();//true if missing values are to be replacedkmeans.setPreserveInstancesOrder(true);//设置聚类要得到的类别数量  kmeans.setNumClusters(2);//開始进行聚类  kmeans.buildClusterer(data);// 打印聚类结果  int[] assignments = kmeans.getAssignments();int i=0;for(int clusterNum : assignments) {System.out.printf("Instance %d -> Cluster %d\n", i++, clusterNum);}}

版权声明:本文博客原创文章,博客,未经同意,不得转载。

转载于:https://www.cnblogs.com/mengfanrong/p/4620110.html

机器学习笔记——K-means相关推荐

  1. 机器学习笔记 - 机器学习基础面试题一

    1. 机器学习有哪些不同类型? 监督学习:模型根据过去或标记的数据做出预测或决策.例如,股票市场价格的预测.         无监督学习:没有标记数据.模型可以识别输入数据中的模式.异常和关系.例如, ...

  2. 机器学习笔记十四:随机森林

    在上一篇机器学习笔记十三:Ensemble思想(上)中,简要的提了一下集成学习的原理和两种主要的集成学习形式.  而在这部分要讲的随机森林,就算是其中属于bagging思路的一种学习方法.为了篇幅,b ...

  3. Python机器学习笔记:sklearn库的学习

    自2007年发布以来,scikit-learn已经成为Python重要的机器学习库了,scikit-learn简称sklearn,支持包括分类,回归,降维和聚类四大机器学习算法.还包括了特征提取,数据 ...

  4. 机器学习笔记 :LSTM 变体 (conv-LSTM、Peephole LSTM、 coupled LSTM、conv-GRU)

    1 LSTM复习 机器学习笔记 RNN初探 & LSTM_UQI-LIUWJ的博客-CSDN博客 机器学习笔记:GRU_UQI-LIUWJ的博客-CSDN博客_gru 机器学习 2 Peeph ...

  5. 机器学习笔记:时间序列分解(滑动平均)

    0 前言 时间序列数据可以表现出多种模式,将时间序列拆分为多个组件通常很有帮助,每个组件代表一个基础模式类别. 在机器学习笔记(时间序列):不同类型的图示_UQI-LIUWJ的博客-CSDN博客中,我 ...

  6. 机器学习笔记:Transformer

    1 传统Seq2Seq的不足 传统seq2seq 使用 bi-direction RNN,那么生成每个b的时候,对于输入的整个序列,模型都需要看过一遍. 问题在于,这样的用bi-direction R ...

  7. OpenCV官方文档 理解k - means聚类

    理解k - means聚类 目标 在这一章中,我们将了解k - means聚类的概念,它是如何工作等. 理论 我们将这个处理是常用的一个例子. t恤尺寸问题 考虑一个公司要发布一个新模型的t恤. 显然 ...

  8. Scikit-Learn 机器学习笔记 -- MNIST

    Scikit-Learn 机器学习笔记 – MNIST 参考文档: handson-ml import numpy as np import matplotlib.pyplot as plt from ...

  9. 文献记录(part89)--I-k-means-+:An iterative clustering algorithm based on an enhanced k -means

    学习笔记,仅供参考,有错必究 关键词:k均值:解决方案改进:准确的k均值:迭代改进 I-k-means-+:An iterative clustering algorithm based on an ...

  10. 机器学习笔记(3) 随机森林

    random forest 和 extra-trees是对decison tree做ensemble而得到最终模型的两种算法. 阅读本文前需要先了解一下 机器学习笔记1:决策树 机器学习笔记2:集成学 ...

最新文章

  1. python安装进度条不动_python – tkinter中的进度条不起作用
  2. python 求直线交点坐标
  3. Bigpipe---FaceBook使用的页面加载技术
  4. mysql函数使用场景_mysql的函数和存储过程的比较,以及在实际场景中的使用案例...
  5. BTREE这种Mysql默认的索引方式,具有普遍的适用性
  6. 敏捷结果30天练习即将开始
  7. 5.23考前友情提醒
  8. macbook 终端命令怎么使用_mac怎么打开终端?mac打开命令提示符的方法
  9. GC(1.1OOPMap)
  10. 计算机组装要哪些硬件,DIY组装电脑要买哪些硬件
  11. beta阶段测试基本概况对应机型硬件信息
  12. python中ix用法_Python Pandas Series.ix用法及代码示例
  13. 终结HashMap面试?我是谁?我在哪
  14. RNC/SGSN/PDP/IUPS概念
  15. 超火的数码产品犀牛rhino模型素材网站合集看过来
  16. .NET基础-11-ArrayList|Hashtable|File文件操作|Dircetioy文件夹操作|Path路径操作
  17. 读书笔记 - 短线操盘:实战技法 第十一章 投资计划的制定与执行
  18. linux 安装配置java环境 jdk1.6 jdk-6u45-linux-x64.bin
  19. C#将文件复制到另一个目录下
  20. 微软WindowsPhone7.5发布会图文实录windowsphone

热门文章

  1. 在某公司用到一些shell
  2. 2.3.4 mysql 用户密码管理
  3. do…while循环
  4. java获取eureka_Spring Cloud服务发现:Eureka客户端
  5. python程序改错题字符统计_Python练习题 012:字符统计
  6. linux 命令行使用技巧linux 下的文件管理
  7. 《云计算开放应用架构》标准发布,阿里云持续领航云原生
  8. 更便捷:阿里云DCDN离线日志转存全新升级
  9. 如何实现Spark on Kubernetes?
  10. 开放下载!《15分钟打造你自己的小程序》(内附详细代码)