1、作用

主成分分析将多个有一定相关性的指标进行线性组合,以最少的维度解释原数据中尽可能多的信息为目标进行降维,降维后的各变量间彼此线性无关,最终确定的新变量是原始变量的线性组合,且越往后主成分在方差中的比重也小,综合原信息的能力越弱,与因子分析不同的是,因子分析是利用少数几个公共因子去解释较多个要观测变量中存在的关系,它不是对原始变量的重新组合。

2、输入输出描述

输入:2个或两个以上的定量变量(假设为N个变量)
输出:最低可降维成1维(一个变量,一般用于综合评价),最多可降维成N个变量(一般用于数据脱敏),同时可以获取降维后各个变量的组成权重,用于代表原先变量的数据保留情况。

3、案例示例

示例:某金融服务公司为了了解贷款客户的信用程度,评价客户的信用等级,采用信用评级常用的5C(能力,品格 ,担保 ,资本,环境)方法, 说明客户违约的可能性。某金融服务公司为了了解贷款客户的信用程度,评价客户的信用等级,采用信用评级常用的5C(能力,品格 ,担保 ,资本,环境)方法, 说明客户违约的可能性。

  • 品格:指客户的名誉;
  • 能力:指客户的偿还能力;
  • 资本:指客户的财务实力和财务状况;
  • 担保:指对申请贷款项担保的覆盖程度;
  • 环境:指外部经济政策环境对客户的影响

4、案例数据

主成分分析案例数据

5、案例操作

Step1:新建项目;
Step2:上传数据;
Step3:选择对应数据打开后进行预览,确认无误后点击开始分析;

step4:选择【主成分分析】;
step5:查看对应的数据数据格式,【主成分分析】要求输入数据为放入 [定量] 自变量X(变量数≥2)。
step6:选择主成分个数(注意:主成分个数的选择,依赖于个人能接受的最大主成分个数,而特征根选择则是根据设定的阈值为界限,以大于该界限对应的主成分个数作为选取的主成分个数,默认为1。)
step7:点击【开始分析】,完成全部操作。

6、输出结果分析

输出结果1:KMO检验和Bartlett的检验

图表说明: KMO检验的结果显示,KMO的值为0.796,同时,Bartlett球形检验的结果显示,显著性P值为0.000***,水平上呈现显著性,拒绝原假设,即表明各变量间具有相关性,主成分分析的结果是有效的,结果可靠程度为一般。

输出结果2:方差解释表格

图表说明: 上表为总方差解释表格,主要是看主成分对于变量解释的贡献率(可以理解为究竟需要多少主成分才能把变量表达为100%),一般都要表达到90%以上才可以,否则就要调整主成分数量。由表可知,前三个主成分累积解释的贡献率达到93.192%(一般情况下大于90%即可),说明使用前三个主成分就能够很好地评价客户的信用等级。

输出结果3:碎石图

图表说明: 当折线由陡峭突然变得平稳时,陡峭到平稳对应的因子个数即为参考提取因子个数。由图可知,从第三个主成分开始,主成分的特征根值开始缓慢的下降,且在满足主成分累积解释的贡献率达到90%的情况下,我们可以选择三个主成分。

输出结果4:因子载荷系数表

图表说明: 上表为因子载荷系数表,可以分析到每个主成分中隐变量的重要性。 第一个主成分与能力、品格、资本、担保这四个变量的相关程度较大,可以概括为“个人信用品质”;第二个主成分主与环境这一个变量的相关程度较大,可以概括为“外部政策影响”。(注意:因子载荷矩系数表在主成分分析的意义不大)

输出结果5:因子载荷矩阵热力图

图表说明:上图为载荷矩阵热力图,可以分析到每个主成分中隐变量的重要性,热力图颜色越深说明相关性越大。第一个主成分与能力、品格、资本、担保这四个变量的相关程度较大,第二个主成分主与环境这一个变量的相关程度较大。(注意:因子载荷矩阵热力图在主成分分析的意义不大)

输出结果6:因子载荷象限分析

图表说明:因子载荷图通过将多因子降维成双主成分或者三主成分,通过象限图的方式呈现主成分的空间分布。
如果提取3个主成分时,则呈现三维载荷因子散点图。(注意:因子载荷象限分析在主成分分析的意义不大)。

输出结果7:成分矩阵表

图表说明:由上表可得到主成分分析降维后的计算公式:
模型的公式:
F1=0.249×资本+0.257×能力+0.259×品格+0.253×担保+0.152×环境
F2=-0.22×资本-0.28×能力-0.224×品格+0.121×担保+1.014×环境
F3=1.164×资本+0.438×能力-0.693×品格-1.096×担保+0.351×环境
由上可以得到: F=(0.708/0.932)×F1+(0.164/0.932)×F2+(0.06/0.932)×F3

输出结果8:因子权重分析
主成分权重结果

名称 方差解释率 累计方差解释率 权重
主成分1 0.708 0.708 76.007%
主成分2 0.164 0.872 17.589%
主成分3 0.06 0.932 6.405%

图表说明: 主成分分析的权重计算结果显示,主成分1的权重为76.007%、主成分2的权重为17.589%、主成分3的权重为6.405%,其中指标权重最大值为主成分1(76.007%),最小值为主成分3(6.405%)。

输出结果9:综合得分表

排名 行索引 综合得分 主成分1 主成分2 主成分3
1 15 1.8538295995859835 2.3248216300730853 0.9779487873062188 -1.3303185831711435
2 75 1.4723957232759053 1.544483584272385 1.2945857359568032 1.1051978488533383
3 38 1.4298921242938714 1.5887697372260392 1.4345302365976729 -0.46833778766180745
4 73 1.4008217827223286 1.6464177131142415 0.7084566988169066 0.3875996122435289
5 79 1.3732757944415963 1.3877097295577525 0.6550270848498913 3.1744695634450593
6 85 1.2953101116714913 1.6990247160343628 0.1316428119766888 -0.3000846705856502
7 78 1.1059035231396432 1.8868381363056903 -1.258557370289778 -1.668501316949743
8 42 1.0220092257911602 1.6020659364712124 -0.7066790149104903 -1.1144512450972166
9 77 1.0083686566692855 0.9119272719161094 1.626777380958888 0.45459014754220217
10 20 0.9895379357348344 0.9742050138033878 1.7206025988609701 -0.8361828333192036

图表说明:由综合得分可知,其中第15位客户的综合得分最高,也就是他的信用等级最高,其次是第75位客户。(注意:综合得分在主成分分析的意义不大)

7、注意事项

  • 主成分要求变量之间的共线性或相关关系比较强,否则不能通过KMO检验和Bartlett球形检验;
  • 主成分分析倾向于降维,从而达到简化系统结构,抓住问题实质的目的。(可侧重于输出结果2、输出结果3、输出结果8);
  • 主成分分析时通常需要综合自己的专业知识,以及软件结果进行综合判断,即使是特征根值小于1,也一样可以提取主成分;
  • KMO值为null不存在可能导致的原因为:

(1)样本量过少容易导致相关系数过高,一般希望分析样本量大于5倍分析项个数;
(2)各个分析项之间的相关关系过高或过低。

8、模型理论

主成分分析法是运用“降维”思想,把多个指标 变换成少数综合指标的多元统计方法,这里的综合 指标就是主成分。每个主成分都是原始变量的线性组合,彼此相互独立,并保留了原始变量绝大部分信息。其本质是通过原始变量的相关性,寻求相关变 量的综合替代对象,并且保证了转化过程中的信息损失最小 。
根据标准化后的数据集计算协方差矩阵:

计算矩阵  的特征值 λ1≥λ2≥…≥λn≥0及 对应的特征向量 1 ,2 ,…,n ,其中 j= (u1j,u2j, …,unj) ,unj表示第j个特征向量的第n个分量; 由特征向量组成n个新的指标变量:

式中,y1 是第1主成分,y2是第2主成分,…,yn 是第n主成分。 计算各主成分yj贡献率 bj(j=1,2,...,n) 及 y1,y2 ,…,yn (p≤n)的累计贡献率 αp 。

9、参考文献

[1]何晓群.多元统计分析.北京:中国人民大学出版社,2012.
[2] 王 伟,赵 明.主成分分析法在航材分类指标体系构建中的应用[J].舰船电子工程,2019,39 (1): 118-120.
[3]丁敬国,郭锦华. 基于主成分分析协同随机森林算法的热连轧带钢宽度预测[J]. 东北大学学报(自然科学版)2021,42(9):1268-1274,1289.

10、学习网站

SPSSPRO-免费专业的在线数据分析平台

什么是主成分分析?经典案例解析变量降维相关推荐

  1. 关于Visual C#.NET数据库开发经典案例解析(附光盘两张)(珍藏版)—的读后感...

    关于Visual C#.NET数据库开发经典案例解析(附光盘两张)(珍藏版)- 评论 读后感:里面的内容很经典,很实用 读后感:给初学者是好,但是是比较旧的了!VS2003 C/S的 读后感:< ...

  2. 微信小程序wxml如何判断字符串中汉语某字符_微信小程序开发经典案例解析“嗨兔儿”...

    嗨兔儿是微信公众号嗨日语歌(hitaici)助手,主要为用户提供,关键词检索,帮助手册等,为外语学习者提供一个便捷的操作方式,能够开心工作,开心生活. 开发过程及注意事项分享视频. 1. 微信小程序开 ...

  3. 100个Shell脚本经典案例解析

    1)编写 hello world 脚本 #!/bin/bash# 编写hello world脚本echo "Hello World!" 2)通过位置变量创建 Linux 系统账户及 ...

  4. 开箱即用:100个Linux Shell脚本经典案例解析

    作者丨baiduoWang 来源丨https://blog.csdn.net/yugemengjing/article/details/82469785 1)编写hello world脚本 #!/bi ...

  5. 100个Linux Shell脚本经典案例解析

    1)编写hello world脚本 #!/bin/bash# 编写hello world脚本echo "Hello World!" 2)通过位置变量创建 Linux 系统账户及密码 ...

  6. 深度学习经典案例解析:YOLO系列

    https://www.toutiao.com/a6621051339352834564/ 2018-11-07 17:40:45 Faster R-CNN的方法目前是主流的目标检测方法,但是速度上并 ...

  7. 信贷客户调查中最需关注的十个方面(附经典案例解析)

    小额贷款公司在对小微企业进行放贷时,往往面临着较高的风险.无论是从客户的背景.历史经营.借款用途.还款来源.政策变化等方面,都要进行详尽的排摸,贷前调查就显得尤为重要.几年来,XX小贷公司针对小微企业 ...

  8. 行转列和列转行,经典案例解析

    一.行转列 1.建表 create table table01(sname varchar2(10), --姓名subject varchar2(10), --科目score int --分数 ); ...

  9. JavaScript基础语法笔记,ECMAScript基础,每部分都有经典案例以及解析。会持续更新(2022.0310)

    提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言 一.JavaScript导读 1.1 什么是JavaScript(这里借鉴Js红宝书的内容,看一看就可以了) 1.2 ...

最新文章

  1. cross-entropy(交叉熵)是什么?用了表征什么东西?
  2. 马斯克明年送3人到太空站旅游:票价3.8亿,仅剩2席,手慢无
  3. 白盒测试工具 - sonar的安装、配置与使用入门手册,用sonar检查代码质量实战演示
  4. hdu 2586(LCA + 节点间距离)
  5. 【机器学习】传统目标检测算法之级联分类器Cascade
  6. 使用PostgREST的RestAPI操作之管理与优化
  7. curl_setopt函数相关应用及介绍
  8. mips linux gcc mingw,gcc
  9. Linux自学笔记——iptables
  10. 常用值得收藏的网站/软件 持续更新中
  11. BP神经网络算法原理
  12. 针对文本文件单行连续多字符内容根据分隔符号转多行方法
  13. DTM、DEM与DSM的区别及其他
  14. DICOM影像中的窗宽窗位
  15. eui怎么在名字后面显示服务器,怀旧服EUI怎么调姓名版 设置血条的方法
  16. [禅悟人生]真知从实践中来
  17. 学习方法-学习观(03)费曼技巧
  18. 华为v3鸿蒙系统_安卓系统:鸿蒙系统,正式再见
  19. java jsp面积怎么算,JSP 课后作业:编写 Tag 文件计算矩形、圆形面积
  20. 关于邮件服务器的dns解析及mx记录问题!

热门文章

  1. ffmpeg截取mp3指定时间的内容
  2. 计算机签名数据大小时错误,看过来!介绍开机出现数字签名错误的具体解决步骤...
  3. 现存最古老青海撒拉族手抄本《古兰经》首次公开展览
  4. S32 Design Studio licence missing
  5. GitHub标星7000+,快速恢复像素化图像,效果惊人
  6. u-boot-1.1.6在mini2440开发板上的移植
  7. Ubuntu安装Go环境以及GoLand编辑器
  8. 北斗三号精密单点定位(PPP-B2b)
  9. 第一章、安装、登录CentOS7
  10. 使用Mac端 Charle 抓 ios 包