《数据挖掘导论》实验课——实验七、数据挖掘之K-means聚类算法
实验七、数据挖掘之K-means聚类算法
一、实验目的
1. 理解K-means聚类算法的基本原理
2. 学会用python实现K-means算法
二、实验工具
1. Anaconda
2. sklearn
3. matplotlib
三、实验简介
1 K-means算法简介
k-means算法是一种聚类算法,所谓聚类,即根据相似性原则,将具有较高相似度的数据对象划分至同一类簇,将具有较高相异度的数据对象划分至不同类簇。聚类与分类最大的区别在于,聚类过程为无监督过程,即待处理数据对象没有任何先验知识,而分类过程为有监督过程,即存在有先验知识的训练数据集。
2 K-means算法原理
k-means算法中的k代表类簇个数,means代表类簇内数据对象的均值(这种均值是一种对类簇中心的描述),因此,k-means算法又称为k-均值算法。k-means算法是一种基于划分的聚类算法,以距离作为数据对象间相似性度量的标准,即数据对象间的距离越小,则它们的相似性越高,则它们越有可能在同一个类簇。数据对象间距离的计算有很多种,k-means算法通常采用欧氏距离来计算数据对象间的距离
四、实验内容
1. 随机生成100个数,并对这100个数进行k-mean聚类(k=3,4,5,6)(并用matplot画图)
1) 随机创建100个样本的二维数据作为训练集
2)k=3进行聚类
3)k=4进行聚类
4)k=5 进行聚类
5)k=6进行聚类,并观察簇分布
2. 对鸢尾花数据进行K-means算法聚类(并用matplot画图)。
五、实验总结(写出本次实验的收获,遇到的问题等)
通过本次实验的学习与操作,我掌握了KMeans算法的基本原理,以及使用sklearn方便的进行聚类构造的方法。并且使用matplot画图,形象直观地看出了K=3,4,5时不同的簇分布情况。
转载于:https://www.cnblogs.com/wonker/p/11079333.html
《数据挖掘导论》实验课——实验七、数据挖掘之K-means聚类算法相关推荐
- 【模式识别】K均值聚类算法应用实验报告及MATLAB仿真
一. 实验目的 1.掌握K均值聚类算法的原理和实现过程: 2.掌握K均值聚类算法的应用方法. 二. 实验内容 1.彩色图像分割 选择一幅图像,分别按三种颜色数进行彩色图像分割的结果(原图和分割图).步 ...
- Thinking in SQL系列之五:数据挖掘K均值聚类算法与城市分级
原创: 牛超 2017-02-21 Mail:10867910@qq.com 引言:前一篇文章开始不再介绍简单算法,而是转到数据挖掘之旅.感谢CSDN将我前一篇机器学习C4.5决策树算法的博文 ...
- 《数据挖掘导论》实验课——实验一、数据处理之Numpy
实验一.数据处理之Numpy 一.实验目的 1. 了解numpy库的基本功能 2. 掌握Numpy库的对数组的操作与运算 二.实验工具: 1. Anaconda 2. Numpy 三.Numpy简介 ...
- SQL Server 数据库实验课第七周——授权:授予与收回
目录 4.2.3 自主存取控制方法 4.2.4 授权:授予与收回 1.GRANT 2.REVOKE 4.2.5 数据库角色 4.2.3 自主存取控制方法 通过 SQL 的GRANT 语句和REVOKE ...
- 吉林大学单片机实验课实验五——重量测量
主要数模转换和点阵液晶屏显示屏,距离上次更新时间有点久,今天把所有的实验全部更新完,实话说啊,这种不加注释的代码,虽然每个命令都是我亲手写的,但是隔了这么久,第一眼看我也是有点懵的,所以从这篇教程开始 ...
- 华中科技大学操作系统实验课 实验四
一.实验目的 (1)理解设备是文件的概念. (2)掌握Linux模块.驱动的概念和编程流程 (3)Windows /Linux下掌握文件读写基本操作 二.实验内容 (1)编写一个Linux内核模块,并 ...
- 如何用matlab画nyqist,机械控制工程基础实验课实验报告
试验一数学模型的Matlab描述 一.实验目的 ①掌握Malab中数学模型的三种表现形式 ②掌握三种模型之间的转换方法 ③掌握复杂传递函数的求取方法 ④了解复杂系统表现形式及建模方法 二.实验要求 ① ...
- 微机实验课-实验四扬声器程序设计
微机实验四操作参考 2018年11月 William 〇.实验准备 本次实验是设计汇编程序,控制8253和8255的工作原理及其应用编程.8253为微机系统中使用的定时/计数器,8255为并行接口,即 ...
- 华中科技大学操作系统实验课 实验三
一.实验目的 (1)理解页面淘汰算法原理,编写程序演示页面淘汰算法. (2)验证Linux虚拟地址转化为物理地址的机制 (3)理解和验证程序运行局部性的原理. (4)理解和验证缺页处理的流程. 二.实 ...
- 数据挖掘导论读书笔记5关联分析的基本概念和算法
关联规则的强度可以用support度和confidence(置信)度来度量 关联规则发现 给定事务的集合T,关联规则发现是指找出支持度大于等于minsup并且置信度大于等于minconf的所有规则, ...
最新文章
- SAP创建webservice
- 2018年Python开源项目Top100!只在这里!
- Swing中的一些对话框
- python编写程序判断今天是今年的第几天_C语言判断今天是今年的第几天
- 阿里云天池 Python训练营Task2: Python基础练习:数据结构大汇总 学习笔记
- MongoDB Shell和Robo3T使用以及与SQL语法比较
- 超过12000个零件,钢琴就是一部复杂的机器
- synchronized关键字理解
- qt根据散点图拟合曲线_R可视化 | 散点图系列(1)
- 力扣-692 前k个高频单词
- 第一章 DHT11温湿度传感器的使用
- uni ios视频黑屏、无声音或无法播放
- 基于MicroStation CE的点云软件二次开发
- 无人机在抢险救灾的优化运用---2017年中国研究生数学建模竞赛A题 (试题+优秀论文)
- (d2l-ai/d2l-zh)《动手学深度学习》pytorch 笔记(4)线性神经网络(暂停)
- 毫米波雷达系列 | 基于前后向空间平滑的MUSIC算法详解
- Handler中MessageQueue的enqueueMessage笔记
- 夺命雷公狗---Smarty NO:04 设计篇2 变量调节器
- java编写的简单工厂模式
- Normal map (Bump mapping) 法线贴图(凹凸映射) Standard Shader系列10