原文链接:http://tecdat.cn/?p=4167

原文出处:拓端数据部落公众号

数据集

fooball球员在场上的位置

数据来自国际足联的视频游戏FIFA 。游戏的特点是在游戏的各个方面评价每个球员的能力。等级是量化变量(介于0和100之间),但我们将它们转换为分类变量。所有能力都被编码在4个等级:1.低/ 2.平均/ 3.高/ 4.非常高。

加载和准备数据

首先将数据集加载到data.frame中。

第二行也将整数列转换为因子。

数据分析

我们的数据集包含分类变量。适当的数据分析方法是多重对应分析。

产生了三个图:类别和球员在坐标轴上的投影,以及变量的图形。

这里显然有两个球员集群。

解释

显然,我们必须先将分析减少到一定数量的维度。选择变量数量的方法是肘法。我们绘制特征值的图形:

> barplot(mca_no_gk $ eig $ eigenvalue)

特征值图

围绕第三或第四个特征值,我们观察到一个值的下降(这是MCA解释的方差的百分比)。因此,我们选择将我们的分析减少到前三个因子。

> plot.MCA(mca_no_gk  )

在前两个因子坐标轴上投影

我们可以通过在图表上读取最有代表性的变量名称来开始分析。

第一因子的最有代表性的能力是:在轴的右侧攻击能力 的能力较弱,左边的能力非常强。因此,我们的解释是,因子1根据他们的进攻能力(左侧更好的攻击能力,右侧更弱)来区分球员。我们对第2因子进行同样的分析,并得出结论:根据他们的防守能力来区分球员:在顶部会发现更好的防守者,而在底部会发现弱防守者。

补充变量也可以帮助确认我们的解释,特别是位置变量:

> plot.MCA(mca_no_gk,invisible = c(“ind”,“var”))

在前两个维度上投影补充变量

实际上,我们在图的左边部分发现了攻击位置(LW,ST,RW),并在图顶部看到了防守位置(CB,LB,RB)。

如果我们的解释是正确的,那么图表中第二个维度上的投影就可以代表球员的整体水平。最强的球员将会在左上角找到,而较弱的将会在右下角找到。“overall_4”位于左上角,“overall_1”位于右下角。此外,在补充变量的图表中,我们观察到“法甲联赛第一”(Ligue 1)位于左上方,而“Ligue 2”位于右下方。

> plot.MCA(mca_no_gk,invisible = c(“ind”,“var”),axes = c(2,3))

在第二和第三维度上投影变量

最具代表性的第三维度是技术上的弱点:技术能力较低的球员(运球,控球等)位于坐标轴的末端,而这些能力中成绩最高的球员往往被发现在坐标轴的中心:

在第二和第三因子坐标轴上投影补充变量

在补充变量的帮助下,中场平均拥有最高的技术能力,而前锋(ST)和后卫(CB,LB,RB)似乎一般都不以球控技术着称。

参考Mathieu Valbuena在坐标轴1和坐标轴2上生成的图形:

1和2因子坐标轴补充变量

第2和3因子坐标轴

所以,马蒂厄·瓦尔布纳似乎有很好的进攻技巧,但他也有很好的整体水平(他在第二因子上的投射比较高)。他也位于第三坐标轴的中心,这表示他具有良好的技术能力。因此,最适合他的位置(统计上)是中场位置(CAM,LM,RM)。再加上几行代码,我们可以找到法国联赛中最相似的球员:

我们得到:Ladislas Douniama,FrédéricSammaritano,Florian Thauvin,N'GoloKanté和Wissam Ben Yedder。


最受欢迎的见解

1.matlab偏最小二乘回归(PLSR)和主成分回归(PCR)

2.R语言高维数据的主成分pca、 t-SNE算法降维与可视化分析

3.主成分分析(PCA)基本原理及分析实例

4.基于R语言实现LASSO回归分析

5.使用LASSO回归预测股票收益数据分析

6.r语言中对lasso回归,ridge岭回归和elastic-net模型

7.r语言中的偏最小二乘回归pls-da数据分析

8.r语言中的偏最小二乘pls回归算法

9.R语言线性判别分析(LDA),二次判别分析(QDA)和正则判别分析(RDA)

拓端tecdat|R语言法国足球联赛球员多重对应分析(MCA)相关推荐

  1. 拓端tecdat|R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险

    最近我们被客户要求撰写关于冠心病风险的研究报告,包括一些图形和统计输出. 相关视频:R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险 逻辑回归Logistic模型原理和R语言分类预测冠 ...

  2. 拓端tecdat|R语言用LOESS(局部加权回归)季节趋势分解(STL)进行时间序列异常检测

    最近我们被客户要求撰写关于LOESS(局部加权回归)的研究报告,包括一些图形和统计输出. 这篇文章描述了一种对涉及季节性和趋势成分的时间序列的中点进行建模的方法.我们将对一种叫做STL的算法进行研究, ...

  3. 拓端tecdat|R语言向量误差修正模型 (VECMs)分析长期利率和通胀率影响关系

    最近我们被客户要求撰写关于向量误差修正模型的研究报告,包括一些图形和统计输出. 向量自回归模型估计的先决条件之一是被分析的时间序列是平稳的.但是,经济理论认为,经济变量之间在水平上存在着均衡关系,可以 ...

  4. 拓端tecdat|R语言线性回归和时间序列分析北京房价影响因素可视化案例

    最近我们被客户要求撰写关于北京房价影响因素的研究报告,包括一些图形和统计输出. 目的 房价有关的数据可能反映了中国近年来的变化: 人们得到更多的资源(薪水),期望有更好的房子 人口众多 独生子女政策: ...

  5. 拓端tecdat荣获掘金社区入驻新人奖

    2021年7月,由掘金发起了"入驻成长礼"颁奖活动.本次活动邀请到知名开发者.服务机构代表等业界人士. 据了解,掘金社区"新入驻创作者礼"主要对已经积累了一定历 ...

  6. 拓端tecdat荣获2022年度51CTO博主之星

    相信技术,传递价值,这是51CTO每一个技术创作者的动力与信念,2022 年度,拓端tecdat 作为新锐的数据分析咨询公司,在51CTO平台上,不断的输出优质的技术文章,分享前沿创新技术,输出最佳生 ...

  7. 拓端tecdat|bilibili视频流量数据潜望镜

    最近我们被客户要求撰写关于bilibili视频流量的研究报告,包括一些图形和统计输出. 最新研究表明,中国有超过7亿人在观看在线视频内容.Bilibili,被称为哔哩哔哩或简称为B站,是中国大陆第二个 ...

  8. R语言分析蛋白质组学数据:飞行时间质谱(MALDI-TOF)法、峰值检测、多光谱比较...

    全文链接:http://tecdat.cn/?p=30051 •研究生物体产生的全部蛋白质. • Foci:鉴定.结构测定.生物标志物.通路.表达(点击文末"阅读原文"获取完整代码 ...

  9. R语言广义加性模型GAMs分析温度、臭氧环境数据绘制偏回归图与偏残差图

    最近我们被客户要求撰写关于广义加性模型的研究报告,包括一些图形和统计输出. 视频:R语言广义相加模型(GAM)在电力负荷预测中的应用 拓端tecdat:R语言广义相加模型(GAM)在电力负荷预测中的应 ...

  10. R语言中的广义线性模型(GLM)和广义相加模型(GAM):多元(平滑)回归分析保险资金投资组合信用风险敞口

    最近我们被客户要求撰写关于信用风险敞口的研究报告,包括一些图形和统计输出. 在之前的课堂上,我们已经看到了如何可视化多元回归模型(带有两个连续的解释变量).在此,目标是使用一些协变量(例如,驾驶员的年 ...

最新文章

  1. 汽车和山羊问题matlab_关于博弈的山羊与汽车问题
  2. 如何用C语言编写wav读取函数,C++读取WAV音频文件的头部数据的实现方法
  3. 精通python-助你精通python,这些学习资源请收好
  4. Socket编程(C语言实现)—— 为什么流式传输类似于管道?不区分边界?
  5. 阻止计算机访问注册表,电脑怎么样防止注册表被强行的篡改,保护电脑安全
  6. DotNet(C#)自定义运行时窗体设计器 一
  7. 安卓微软雅黑字体ttf_618巨献丨精致的悦黑5字重小字体
  8. compat包_使用Compat Patchers,API的稳定性既便宜又容易!
  9. 单选 textarea 赋初值
  10. python中的append()有什么功能_在python中append()函数能做什么
  11. JUnit测试用例– Eclipse和Maven
  12. Java 学习第一天
  13. 关于编程开发的最小系统学习法
  14. 京东一面:如何用 Nginx 禁止国外 IP 访问网站,直接凉凉!
  15. 攻防世界——MyDriver2-397
  16. c语言如何用气泡法编程最大 最小值,[c语言冒泡排序法]C语言冒泡排序法详解
  17. SparkMLlib之01-Spark机器学习库介绍
  18. python实战-爬取斗鱼所有颜值主播头像
  19. light动名词_动名词的用法英语语法大全
  20. 阳光系统 软件无法卸载怎么办

热门文章

  1. [菜鸟必学]网络以及***命令行全收录
  2. 欧几里得算法求最大公约数
  3. rm -f .... 恢复
  4. 递归神经网络的非零初始状态
  5. C# 使用 Topshelf 创建Windows服务
  6. UITableViewController与UIViewController中使用UITableView
  7. Timeline Storyteller 现已加入自定义图表库
  8. Codeforces Round #339 (Div. 1) C. Necklace 构造题
  9. ASP.NET MVC+EF框架+EasyUI实现权限管理系列(19)-用户信息的修改和浏览
  10. Android系统Surface机制的SurfaceFlinger服务渲染应用程序UI的过程分析(2)