机器学习笔记——K-means
K-means它是一个聚类算法,它要求用户设定群集数k作为输入参数。因此,该算法的实施前。该数字预计将需要有集群。
如果有n点,需要收集k个簇中。
K-means算法首先从包括k个中心点的初始集合開始。即随机初始化簇的中心。随后,算法进行多次迭代处理并调整中心位置,知道达到最大迭代次数或中性收敛于固定点。
k-means聚类实例。选择三个随机点用作聚类中心(左上)。map阶段(右上)将每一个点赋给离其近期的簇。在reduce阶段(左下),取相互关联的点的均值。作为新的簇的中心位置,得到本轮迭代的终于布局(右下)。在每一轮迭代结束后。终于布局将被反馈给相同的循环过程。直到聚类中心的位置不再移动。
使用weka进行聚类:
public static void main(String[] args) throws Exception {// 读入样本数据 Instances data = new Instances(new BufferedReader(new FileReader("E:\\Weka-3-6\\data\\contact-lenses.arff")));// 实例化化聚类算法SimpleKMeans kmeans = new SimpleKMeans();//true if missing values are to be replacedkmeans.setPreserveInstancesOrder(true);//设置聚类要得到的类别数量 kmeans.setNumClusters(2);//開始进行聚类 kmeans.buildClusterer(data);// 打印聚类结果 int[] assignments = kmeans.getAssignments();int i=0;for(int clusterNum : assignments) {System.out.printf("Instance %d -> Cluster %d\n", i++, clusterNum);}}
版权声明:本文博客原创文章,博客,未经同意,不得转载。
转载于:https://www.cnblogs.com/mengfanrong/p/4620110.html
机器学习笔记——K-means相关推荐
- 机器学习笔记 - 机器学习基础面试题一
1. 机器学习有哪些不同类型? 监督学习:模型根据过去或标记的数据做出预测或决策.例如,股票市场价格的预测. 无监督学习:没有标记数据.模型可以识别输入数据中的模式.异常和关系.例如, ...
- 机器学习笔记十四:随机森林
在上一篇机器学习笔记十三:Ensemble思想(上)中,简要的提了一下集成学习的原理和两种主要的集成学习形式. 而在这部分要讲的随机森林,就算是其中属于bagging思路的一种学习方法.为了篇幅,b ...
- Python机器学习笔记:sklearn库的学习
自2007年发布以来,scikit-learn已经成为Python重要的机器学习库了,scikit-learn简称sklearn,支持包括分类,回归,降维和聚类四大机器学习算法.还包括了特征提取,数据 ...
- 机器学习笔记 :LSTM 变体 (conv-LSTM、Peephole LSTM、 coupled LSTM、conv-GRU)
1 LSTM复习 机器学习笔记 RNN初探 & LSTM_UQI-LIUWJ的博客-CSDN博客 机器学习笔记:GRU_UQI-LIUWJ的博客-CSDN博客_gru 机器学习 2 Peeph ...
- 机器学习笔记:时间序列分解(滑动平均)
0 前言 时间序列数据可以表现出多种模式,将时间序列拆分为多个组件通常很有帮助,每个组件代表一个基础模式类别. 在机器学习笔记(时间序列):不同类型的图示_UQI-LIUWJ的博客-CSDN博客中,我 ...
- 机器学习笔记:Transformer
1 传统Seq2Seq的不足 传统seq2seq 使用 bi-direction RNN,那么生成每个b的时候,对于输入的整个序列,模型都需要看过一遍. 问题在于,这样的用bi-direction R ...
- OpenCV官方文档 理解k - means聚类
理解k - means聚类 目标 在这一章中,我们将了解k - means聚类的概念,它是如何工作等. 理论 我们将这个处理是常用的一个例子. t恤尺寸问题 考虑一个公司要发布一个新模型的t恤. 显然 ...
- Scikit-Learn 机器学习笔记 -- MNIST
Scikit-Learn 机器学习笔记 – MNIST 参考文档: handson-ml import numpy as np import matplotlib.pyplot as plt from ...
- 文献记录(part89)--I-k-means-+:An iterative clustering algorithm based on an enhanced k -means
学习笔记,仅供参考,有错必究 关键词:k均值:解决方案改进:准确的k均值:迭代改进 I-k-means-+:An iterative clustering algorithm based on an ...
- 机器学习笔记(3) 随机森林
random forest 和 extra-trees是对decison tree做ensemble而得到最终模型的两种算法. 阅读本文前需要先了解一下 机器学习笔记1:决策树 机器学习笔记2:集成学 ...
最新文章
- python安装进度条不动_python – tkinter中的进度条不起作用
- python 求直线交点坐标
- Bigpipe---FaceBook使用的页面加载技术
- mysql函数使用场景_mysql的函数和存储过程的比较,以及在实际场景中的使用案例...
- BTREE这种Mysql默认的索引方式,具有普遍的适用性
- 敏捷结果30天练习即将开始
- 5.23考前友情提醒
- macbook 终端命令怎么使用_mac怎么打开终端?mac打开命令提示符的方法
- GC(1.1OOPMap)
- 计算机组装要哪些硬件,DIY组装电脑要买哪些硬件
- beta阶段测试基本概况对应机型硬件信息
- python中ix用法_Python Pandas Series.ix用法及代码示例
- 终结HashMap面试?我是谁?我在哪
- RNC/SGSN/PDP/IUPS概念
- 超火的数码产品犀牛rhino模型素材网站合集看过来
- .NET基础-11-ArrayList|Hashtable|File文件操作|Dircetioy文件夹操作|Path路径操作
- 读书笔记 - 短线操盘:实战技法 第十一章 投资计划的制定与执行
- linux 安装配置java环境 jdk1.6 jdk-6u45-linux-x64.bin
- C#将文件复制到另一个目录下
- 微软WindowsPhone7.5发布会图文实录windowsphone