机器学习之K-means聚类分析NBA球员案例
机器学习之K-means聚类分析NBA球员案例
本次案例利用k-means算法分析NBA球员球队实力,具体采用2种方式实现案例,一种为自己实现,一种为调用sklearn库,数据来源nba_2013.csv。
k-means的计算理解过程:
1.从集合D中随机选取k个元素,作为k个簇的各自的中心;
2.分别计算剩下的元素到k个簇中心的相异度,将这些元素分别划归到相异度最低的簇;
3.根据聚类结果,重新计算k个簇各自的中心,计算方法是取簇中所有的元素各自维度的算术平均数;
4.将D中全部元素按照新的中心重新聚类;
5.重复第4步,直到聚类结果不再变化;
6.将结果输出。
2.数据处理及分析
2.1.数据导入
导入数据集
Player-球员名称
Age–年龄
Bref_team_id–战队名
程序编写:
数据集内容输出截图:
2.2取出后卫的数据
程序编写:
结果截图:
2.3定义失误次数及助攻次数
程序编写:
结果图展示:
使用K-means聚类时,
第一步:当k=5时,他会随机选取5个点作为中心点,然后计算所有点到这5个点的距离
第二步:将每一个点划到不同的簇
第三步:将每一个簇中的点计算横纵坐标的均值,计算出新的中心点(可以是不是实际的点)
第四步:重新计算每一个点到中心点的距离,重新划分属于不同的簇
第五步:不断的更新中心点,不断的重新划分簇,直到再怎么更新中心点,簇里的元素都不再发生变化了
2.4 随机选出5个点并选出中心点
程序编写:
2.5 编写程序输出初始化后的中心点
点位图
2.6将中心点的信息保存再字典里:
结果截图:
2.7计算距离 程序编写
输出距离值
2.8对所有数据选择自己的中心点,进行分类
2.9对每行的数据进行比较,得出这一行数据最近的中心点,属于这一簇
2.10将结果显示出来
将分类的数据显示出来
2.11重新计算中心点
2.12重新计算中心点,对所有点进行重新划分中心点,并将分类的数据显示出来
3、利用库函数实现
导入数据:
from sklearn.cluster import KMeans
调用sklearn的库函数,只需指定需要分类的个数
结果点位图
机器学习之K-means聚类分析NBA球员案例相关推荐
- 基于K-Means聚类算法对NBA球员数据的聚类分析
聚类分析的研究成果主要集中在基于距离(或者称为基于相似度)的聚类方法,用距离来作为相似性度量的优点是十分直观,从我们对物体的识别角度来分析,同类的数据样本是相互靠近的,不同类样本应该相聚较远.K- ...
- 基于k-means聚类算法对NBA球员数据的一次聚类分析
数据挖掘大作业 前言 本章工具 k-means介绍 k-means原理 最佳k值的确定 拐点法 轮廓系数法 聚类运算 结果分析 小结 参考文献 前言 聚类分析的研究成果主要集中在基于距离(或者称为基于 ...
- k均值聚类算法(K Means)及其实战案例
算法说明 K均值聚类算法其实就是根据距离来看属性,近朱者赤近墨者黑.其中K表示要聚类的数量,就是说样本要被划分成几个类别.而均值则是因为需要求得每个类别的中心点,比如一维样本的中心点一般就是求这些样本 ...
- 人工智能-seaborn单双多变量绘图、两案例:NBA球员数据分析、北京租房数据统
1. seaborn 作用:更高效地绘图 #安装 pip3 install seaborn#导入 import seaborn as sns 单变量:直方图或核密度曲线 双变量:散点图.二维直方图. ...
- 实例:【基于机器学习的NBA球员信息数据分析与可视化】
文章目录 一.项目任务 二.代码实现及分析 1. 导入模块 2. 导入文件并对文件信息进行整体探测 3. 数据预处理 3.1 查看数据集信息 3.2 数据清洗与转换 3.3 数据去重 4. 数据可视化 ...
- NBA球员总得分预测——K近邻算法
Dataset 本文的数据集nba_2013.csv是2013到2014赛季的NBA球员信息: player – name of the player pos – the position of th ...
- 【MATLAB统计分析与应用100例】案例018:matlab读取Excel数据,进行K均值聚类分析
文章目录 1. K均值聚类分析结果 2. matlab完整代码 (1)读取数据,并进行标准化变换 (2)选取初始凝聚点,进行聚类 (3)绘制轮廓图 1. K均值聚类分析结果 2. matlab完整代码 ...
- 【MATLAB统计分析与应用100例】案例019:matlab读取Excel数据,进行K均值聚类分析
文章目录 1. 读取数据,并进行标准化变换 2. 进行模糊C均值聚类 3. 查看聚类结果 4. K均值聚类分析结果 1. 读取数据,并进行标准化变换 % 从文件examp09_05.xls中读取数据 ...
- nba球员python_分组NBA球员
nba球员python In basketball, we typically talk about 5 positions: point guard, shooting guard, small f ...
最新文章
- Vue:echarts画图实战,异步获取数据在Vue上使用echarts进行画图
- F5 配置手册 -F5 BIG-IP 10.1-2-配置-基本参数
- linux c 延迟函数 sleep usleep 使用区别
- 【引用】phpmyadmin提示Access denied for user 'root'@'localhost' (using password: NO)的解决办法...
- 《大数据分析原理与实践》——习题
- ustc小道消息20211216
- 电脑硬件知识学习_31岁,还在熬夜学习到2点的背后,是一个丈夫和父亲的责任与担当...
- minetest Window编译运行
- 如果现在单位让你内退,拿基本工资,不用上班,你是否愿意?
- 物理层-宽带接入技术
- 关于ireport中文不显示问题
- 华南理工计算机就业棒棒,为梦想、为公益,华南理工大学学子为爱发声
- 计算机科学与技术学校学科评估,计算机科学与技术学科评估具体排名「大学专业排名」...
- T470P笔记本安装固态以及固态中安装系统_完整步骤
- 342_Linux Mint使用国内的软件源
- 操作系统概念_第六章_进程同步
- css盒模型(css的两种盒模型:标准盒模型、怪异盒模型)和 css3指定盒子模型种类的box-sizing属性
- 电脑上不去网?一行命令解决
- Echarts地图添加引导线效果(labelLine)
- 比尔·盖茨的分布式爱情
热门文章
- 液压控制系列之活塞位置测量(带原点标定功能)
- 佛山科学技术学院计算机期末试题,佛山科学技术学院 2002-2003学年第一学期概率与数理统计试卷(A卷)...
- 开放式激光振镜+运动控制器(六):双振镜运动
- 蓝牙LL数据包交互【More Data多数据传输】【Acknowledgement and Flow Control】
- 简单典型二阶系统_FFM及DeepFFM模型在推荐系统的探索
- 微信小程序云开发———云数据库
- git 生成patch和打patch的方法
- mysql安装5.1.57_数据库mysql57安装
- 这五年来,我每天做完功课后都会抽空挖这口井,即使有时很忙,能挖多少就算多少。如今终于让我挖出井水,我就不用再下山挑水,我可以有更多时间练我喜欢的太极拳
- Pi-Cardia的ShortCut™器械成功治疗首批患者