机器学习之K-means聚类分析NBA球员案例

本次案例利用k-means算法分析NBA球员球队实力,具体采用2种方式实现案例,一种为自己实现,一种为调用sklearn库,数据来源nba_2013.csv。

k-means的计算理解过程:
1.从集合D中随机选取k个元素,作为k个簇的各自的中心;
2.分别计算剩下的元素到k个簇中心的相异度,将这些元素分别划归到相异度最低的簇;
3.根据聚类结果,重新计算k个簇各自的中心,计算方法是取簇中所有的元素各自维度的算术平均数;
4.将D中全部元素按照新的中心重新聚类;
5.重复第4步,直到聚类结果不再变化;
6.将结果输出。

2.数据处理及分析

2.1.数据导入
导入数据集
Player-球员名称
Age–年龄
Bref_team_id–战队名
程序编写:

数据集内容输出截图:

2.2取出后卫的数据
程序编写:

结果截图:

2.3定义失误次数及助攻次数
程序编写:

结果图展示:

使用K-means聚类时,
第一步:当k=5时,他会随机选取5个点作为中心点,然后计算所有点到这5个点的距离
第二步:将每一个点划到不同的簇
第三步:将每一个簇中的点计算横纵坐标的均值,计算出新的中心点(可以是不是实际的点)
第四步:重新计算每一个点到中心点的距离,重新划分属于不同的簇
第五步:不断的更新中心点,不断的重新划分簇,直到再怎么更新中心点,簇里的元素都不再发生变化了

2.4 随机选出5个点并选出中心点
程序编写:

2.5 编写程序输出初始化后的中心点

点位图

2.6将中心点的信息保存再字典里:

结果截图:

2.7计算距离 程序编写

输出距离值

2.8对所有数据选择自己的中心点,进行分类

2.9对每行的数据进行比较,得出这一行数据最近的中心点,属于这一簇

2.10将结果显示出来

将分类的数据显示出来

2.11重新计算中心点

2.12重新计算中心点,对所有点进行重新划分中心点,并将分类的数据显示出来

3、利用库函数实现
导入数据:
from sklearn.cluster import KMeans
调用sklearn的库函数,只需指定需要分类的个数

结果点位图

机器学习之K-means聚类分析NBA球员案例相关推荐

  1. 基于K-Means聚类算法对NBA球员数据的聚类分析

      聚类分析的研究成果主要集中在基于距离(或者称为基于相似度)的聚类方法,用距离来作为相似性度量的优点是十分直观,从我们对物体的识别角度来分析,同类的数据样本是相互靠近的,不同类样本应该相聚较远.K- ...

  2. 基于k-means聚类算法对NBA球员数据的一次聚类分析

    数据挖掘大作业 前言 本章工具 k-means介绍 k-means原理 最佳k值的确定 拐点法 轮廓系数法 聚类运算 结果分析 小结 参考文献 前言 聚类分析的研究成果主要集中在基于距离(或者称为基于 ...

  3. k均值聚类算法(K Means)及其实战案例

    算法说明 K均值聚类算法其实就是根据距离来看属性,近朱者赤近墨者黑.其中K表示要聚类的数量,就是说样本要被划分成几个类别.而均值则是因为需要求得每个类别的中心点,比如一维样本的中心点一般就是求这些样本 ...

  4. 人工智能-seaborn单双多变量绘图、两案例:NBA球员数据分析、北京租房数据统

    1. seaborn 作用:更高效地绘图 #安装 pip3 install seaborn#导入 import seaborn as sns 单变量:直方图或核密度曲线 双变量:散点图.二维直方图. ...

  5. 实例:【基于机器学习的NBA球员信息数据分析与可视化】

    文章目录 一.项目任务 二.代码实现及分析 1. 导入模块 2. 导入文件并对文件信息进行整体探测 3. 数据预处理 3.1 查看数据集信息 3.2 数据清洗与转换 3.3 数据去重 4. 数据可视化 ...

  6. NBA球员总得分预测——K近邻算法

    Dataset 本文的数据集nba_2013.csv是2013到2014赛季的NBA球员信息: player – name of the player pos – the position of th ...

  7. 【MATLAB统计分析与应用100例】案例018:matlab读取Excel数据,进行K均值聚类分析

    文章目录 1. K均值聚类分析结果 2. matlab完整代码 (1)读取数据,并进行标准化变换 (2)选取初始凝聚点,进行聚类 (3)绘制轮廓图 1. K均值聚类分析结果 2. matlab完整代码 ...

  8. 【MATLAB统计分析与应用100例】案例019:matlab读取Excel数据,进行K均值聚类分析

    文章目录 1. 读取数据,并进行标准化变换 2. 进行模糊C均值聚类 3. 查看聚类结果 4. K均值聚类分析结果 1. 读取数据,并进行标准化变换 % 从文件examp09_05.xls中读取数据 ...

  9. nba球员python_分组NBA球员

    nba球员python In basketball, we typically talk about 5 positions: point guard, shooting guard, small f ...

最新文章

  1. Vue:echarts画图实战,异步获取数据在Vue上使用echarts进行画图
  2. F5 配置手册 -F5 BIG-IP 10.1-2-配置-基本参数
  3. linux c 延迟函数 sleep usleep 使用区别
  4. 【引用】phpmyadmin提示Access denied for user 'root'@'localhost' (using password: NO)的解决办法...
  5. 《大数据分析原理与实践》——习题
  6. ustc小道消息20211216
  7. 电脑硬件知识学习_31岁,还在熬夜学习到2点的背后,是一个丈夫和父亲的责任与担当...
  8. minetest Window编译运行
  9. 如果现在单位让你内退,拿基本工资,不用上班,你是否愿意?
  10. 物理层-宽带接入技术
  11. 关于ireport中文不显示问题
  12. 华南理工计算机就业棒棒,为梦想、为公益,华南理工大学学子为爱发声
  13. 计算机科学与技术学校学科评估,计算机科学与技术学科评估具体排名「大学专业排名」...
  14. T470P笔记本安装固态以及固态中安装系统_完整步骤
  15. 342_Linux Mint使用国内的软件源
  16. 操作系统概念_第六章_进程同步
  17. css盒模型(css的两种盒模型:标准盒模型、怪异盒模型)和 css3指定盒子模型种类的box-sizing属性
  18. 电脑上不去网?一行命令解决
  19. Echarts地图添加引导线效果(labelLine)
  20. 比尔·盖茨的分布式爱情

热门文章

  1. 液压控制系列之活塞位置测量(带原点标定功能)
  2. 佛山科学技术学院计算机期末试题,佛山科学技术学院 2002-2003学年第一学期概率与数理统计试卷(A卷)...
  3. 开放式激光振镜+运动控制器(六):双振镜运动
  4. 蓝牙LL数据包交互【More Data多数据传输】【Acknowledgement and Flow Control】
  5. 简单典型二阶系统_FFM及DeepFFM模型在推荐系统的探索
  6. 微信小程序云开发———云数据库
  7. git 生成patch和打patch的方法
  8. mysql安装5.1.57_数据库mysql57安装
  9. 这五年来,我每天做完功课后都会抽空挖这口井,即使有时很忙,能挖多少就算多少。如今终于让我挖出井水,我就不用再下山挑水,我可以有更多时间练我喜欢的太极拳
  10. Pi-Cardia的ShortCut™器械成功治疗首批患者