实验七、数据挖掘之K-means聚类算法

一、实验目的

1. 理解K-means聚类算法的基本原理

2. 学会用python实现K-means算法

二、实验工具

1. Anaconda

2. sklearn

3. matplotlib

三、实验简介

1 K-means算法简介

k-means算法是一种聚类算法,所谓聚类,即根据相似性原则,将具有较高相似度的数据对象划分至同一类簇,将具有较高相异度的数据对象划分至不同类簇。聚类与分类最大的区别在于,聚类过程为无监督过程,即待处理数据对象没有任何先验知识,而分类过程为有监督过程,即存在有先验知识的训练数据集。

2 K-means算法原理

k-means算法中的k代表类簇个数,means代表类簇内数据对象的均值(这种均值是一种对类簇中心的描述),因此,k-means算法又称为k-均值算法。k-means算法是一种基于划分的聚类算法,以距离作为数据对象间相似性度量的标准,即数据对象间的距离越小,则它们的相似性越高,则它们越有可能在同一个类簇。数据对象间距离的计算有很多种,k-means算法通常采用欧氏距离来计算数据对象间的距离

四、实验内容

1. 随机生成100个数,并对这100个数进行k-mean聚类(k=3,4,5,6)(并用matplot画图)

1) 随机创建100个样本的二维数据作为训练集

2)k=3进行聚类

3)k=4进行聚类

4)k=5 进行聚类

5)k=6进行聚类,并观察簇分布

2. 对鸢尾花数据进行K-means算法聚类(并用matplot画图)。

五、实验总结(写出本次实验的收获,遇到的问题等)

通过本次实验的学习与操作,我掌握了KMeans算法的基本原理,以及使用sklearn方便的进行聚类构造的方法。并且使用matplot画图,形象直观地看出了K=3,4,5时不同的簇分布情况。

转载于:https://www.cnblogs.com/wonker/p/11079333.html

《数据挖掘导论》实验课——实验七、数据挖掘之K-means聚类算法相关推荐

  1. 【模式识别】K均值聚类算法应用实验报告及MATLAB仿真

    一. 实验目的 1.掌握K均值聚类算法的原理和实现过程: 2.掌握K均值聚类算法的应用方法. 二. 实验内容 1.彩色图像分割 选择一幅图像,分别按三种颜色数进行彩色图像分割的结果(原图和分割图).步 ...

  2. Thinking in SQL系列之五:数据挖掘K均值聚类算法与城市分级

    原创: 牛超   2017-02-21   Mail:10867910@qq.com 引言:前一篇文章开始不再介绍简单算法,而是转到数据挖掘之旅.感谢CSDN将我前一篇机器学习C4.5决策树算法的博文 ...

  3. 《数据挖掘导论》实验课——实验一、数据处理之Numpy

    实验一.数据处理之Numpy 一.实验目的 1. 了解numpy库的基本功能 2. 掌握Numpy库的对数组的操作与运算 二.实验工具: 1. Anaconda 2. Numpy 三.Numpy简介 ...

  4. SQL Server 数据库实验课第七周——授权:授予与收回

    目录 4.2.3 自主存取控制方法 4.2.4 授权:授予与收回 1.GRANT 2.REVOKE 4.2.5 数据库角色 4.2.3 自主存取控制方法 通过 SQL 的GRANT 语句和REVOKE ...

  5. 吉林大学单片机实验课实验五——重量测量

    主要数模转换和点阵液晶屏显示屏,距离上次更新时间有点久,今天把所有的实验全部更新完,实话说啊,这种不加注释的代码,虽然每个命令都是我亲手写的,但是隔了这么久,第一眼看我也是有点懵的,所以从这篇教程开始 ...

  6. 华中科技大学操作系统实验课 实验四

    一.实验目的 (1)理解设备是文件的概念. (2)掌握Linux模块.驱动的概念和编程流程 (3)Windows /Linux下掌握文件读写基本操作 二.实验内容 (1)编写一个Linux内核模块,并 ...

  7. 如何用matlab画nyqist,机械控制工程基础实验课实验报告

    试验一数学模型的Matlab描述 一.实验目的 ①掌握Malab中数学模型的三种表现形式 ②掌握三种模型之间的转换方法 ③掌握复杂传递函数的求取方法 ④了解复杂系统表现形式及建模方法 二.实验要求 ① ...

  8. 微机实验课-实验四扬声器程序设计

    微机实验四操作参考 2018年11月 William 〇.实验准备 本次实验是设计汇编程序,控制8253和8255的工作原理及其应用编程.8253为微机系统中使用的定时/计数器,8255为并行接口,即 ...

  9. 华中科技大学操作系统实验课 实验三

    一.实验目的 (1)理解页面淘汰算法原理,编写程序演示页面淘汰算法. (2)验证Linux虚拟地址转化为物理地址的机制 (3)理解和验证程序运行局部性的原理. (4)理解和验证缺页处理的流程. 二.实 ...

  10. 数据挖掘导论读书笔记5关联分析的基本概念和算法

    关联规则的强度可以用support度和confidence(置信)度来度量 关联规则发现  给定事务的集合T,关联规则发现是指找出支持度大于等于minsup并且置信度大于等于minconf的所有规则, ...

最新文章

  1. SAP创建webservice
  2. 2018年Python开源项目Top100!只在这里!
  3. Swing中的一些对话框
  4. python编写程序判断今天是今年的第几天_C语言判断今天是今年的第几天
  5. 阿里云天池 Python训练营Task2: Python基础练习:数据结构大汇总 学习笔记
  6. MongoDB Shell和Robo3T使用以及与SQL语法比较
  7. 超过12000个零件,钢琴就是一部复杂的机器
  8. synchronized关键字理解
  9. qt根据散点图拟合曲线_R可视化 | 散点图系列(1)
  10. 力扣-692 前k个高频单词
  11. 第一章 DHT11温湿度传感器的使用
  12. uni ios视频黑屏、无声音或无法播放
  13. 基于MicroStation CE的点云软件二次开发
  14. 无人机在抢险救灾的优化运用---2017年中国研究生数学建模竞赛A题 (试题+优秀论文)
  15. (d2l-ai/d2l-zh)《动手学深度学习》pytorch 笔记(4)线性神经网络(暂停)
  16. 毫米波雷达系列 | 基于前后向空间平滑的MUSIC算法详解
  17. Handler中MessageQueue的enqueueMessage笔记
  18. 夺命雷公狗---Smarty NO:04 设计篇2 变量调节器
  19. java编写的简单工厂模式
  20. Normal map (Bump mapping) 法线贴图(凹凸映射) Standard Shader系列10

热门文章

  1. 《简约之美:软件设计之道》总结
  2. FFMPEG 的学习
  3. java底层实现分页
  4. 【2030】排队打水问题
  5. 第八周 4.18 --- 4.24
  6. 网站颜色搭配[收藏]
  7. MYSQL 碎片查询
  8. Java通过BCrypt加密
  9. SecureCRT连接Ubuntu,centos失败解决
  10. 转----cer文件和pfx文件的区别