主成分分析和因子分析_简单易懂!一文理清主成分分析思路
主成分分析是一种浓缩数据信息的方法,可将很多个指标浓缩成综合指标(主成分),并保证这些综合指标彼此之间互不相关。可用于简化数据信息浓缩、计算权重、竞争力评价等。
一、研究背景
某研究想要了解各地区高等教育发展水平的综合排名。从中选取30个地区10个评价指标,使用主成分分析进行降维,并计算综合得分。
二、操作步骤
(1)点击【进阶方法】--【主成分】。
(2)将分析项拖拽至右侧,勾选[成分得分]、[综合得分]。点击开始分析。
也可以根据自己的分析需要,主动设置主成分个数。
三、分析思路
Step1:判断是否适合进行主成分分析
上表展示KMO检验和Bartlett 的检验结果,用来看此数据适不适合进行主成分分析。
通常KMO值的判断标准为0.6。大于0.6说明适合进行分析,反之,说明不适合进行分析。同时Bartlett检验对应P值小于0.05也说明适合分析。
SPSSAU输出的结果中会给出智能解读结果,直接查看智能分析:
Step2:确定主成分个数,及判断主成分与分析项对应关系
确定可以使用主成分分析后,下一步重点确定主成分个数。
方差解释率表格主要用于判断提取多少个主成分合适。以及每个主成分的方差解释率和累计方差解释率情况。方差解释率越大说明主成分包含原数据信息的越多。
从上表可知:本次共提取了2个主成分。这2个主成分的方差解释率分别是75.024%,15.767%,累积方差解释率为,90.791%。说明两个主成分能够表达10个分析项90.791%的信息量,主成分分析效果很好。
同时可结合碎石图辅助判断主成分提取个数。
当折线由陡峭突然变得平稳时,陡峭到平稳对应的主成分个数即为参考提取主成分个数。实际研究中更多以专业知识,结合主成分与研究项对应关系情况,综合权衡判断得出主成分个数。
载荷系数表格,主要展示主成分对于研究项的信息提取情况,以及主成分和研究项对应关系。
蓝色数值代表载荷系数绝对值大于0.4,如高等院校数对应的载荷系数(0.958,-0.247)说明这个分析项更适合归于主成分1下。
共同度代表某题项可被提取的信息量,共同度越高说明指标能被主成分解释的程度越高,被提取的信息量越多。一般以0.4作为标准。
从结果中可以看出,主成分1中反映高等院校数X1、毕业生数X2、招生人数X3、在校生数X4、教职工数X5、专职教师数X6、教育经费占国内生产总值比重X9、生均教育经费X10,共八个指标的信息。
主成分2反映高级职称占专职教师的比例X7、院校平均在校生数X8两个指标的信息。共同度均超过0.4,说明各指标均能被2个主成分较好地解释。
Step3:利用主成分得到综合得分
根据之前勾选的[综合得分],即可自动得到综合得分结果。
SPSSAU默认命名为CompScore_XXXX。使用【数据处理】→【标题处理】功能可以对题目重命名。
在页面右上角【我的数据】中可以具体查看具体的综合得分。综合得分值越大表示越有竞争力,也就说明该地区高等教育发展水平越发达。
Step4:得到综合排名情况
【数据处理】→【生成变量】里的排名功能。点击“综合得分”,再选择“排名(Rank)”,点击确认处理。
下载后可使用EXCEL对数据进行整理,最终结果如下:
四、疑问解答
- 综合得分具体如何计算?
SPSSAU提供一键生成综合得分非常方便,但也会有人有疑问:综合得分是怎么计算得到?如果想描述计算过程应该怎么说?
综合得分实际就等于每个主成分得分乘以各自权重求和所得的结果。
(综合得分=主成分1得分*主成分1权重+主成分2得分*主成分2权重+.....)
“主成分得分”可以通过勾选[成分得分],由SPSSAU自动输出。
本次共提取2个主成分,因此分别生成2个主成分得分。
有了主成分得分,下面要解决权重问题。如何计算得到每个主成分的权重?
权重是以各主成分对应的方差贡献率除以累计方差贡献率。
以本例来说,2个主成分的方差解释率分别是75.024%,15.767%,累积方差解释率为,90.791%。
主成分1的权重:75.024%/90.791%=82.63%
主成分2的权重:15.767%/90.791%=17.37%
权重结果在智能分析中也有提供,可以直接使用。
成分得分和权重都得到即可计算综合得分。
F=82.63%*主成分1得分+17.37%*主成分2得分
- 分析之前是否需要对数据进行标准化处理?
SPSSAU默认就已经进行过标准化处理,因此不需要再对数据处理。当然标准化后的数据再次标准化依旧还是自身没有任何变化,结果均一致。
- 相关矩阵在哪里计算?
可使用【通用方法】--【相关】得到相关矩阵。
通过相关矩阵可以看出哪些指标之间相关性较强,哪些指标之间相关性不大。
五、其他说明
主成分分析的作用更多侧重于计算权重、计算综合竞争力。不会过多关注主成分与分析项对应关系,不要求每个主成分有明确的含义。如果研究目的侧重于浓缩题项信息,更建议采用因子分析。
更多干货内容可登录SPSSAU官网查看。
SPSSAU-在线SPSS分析软件www.spssau.com?100001000
主成分分析和因子分析_简单易懂!一文理清主成分分析思路相关推荐
- 小米node2红外_简单易懂,联动好用:小米 米家蓝牙温湿度计2 晒单
简单易懂,联动好用:小米 米家蓝牙温湿度计2 晒单 2020-10-06 09:33:10 4点赞 6收藏 5评论 去年买过米家的温湿度计Pro,在家摆着和电暖风联动挺不错的,比如室温低于20℃自动开 ...
- 结构方程模型_简单易懂,结构方程模型思路总结
结构方程模型是结合了多种统计分析方法,可同时检验因子.分析项.误差项间的关系.本文将基于SPSSAU系统进行说明. 1.方法辨别 结构方程模型SEM包括测量关系和影响关系:既可以测量各因素内部结构及相 ...
- qtablewidget固定一列滚动_简单易懂,最全滚动轴承基本知识汇总
小编的话:滚动轴承是将运转的轴与轴座之间的滑动摩擦变为滚动摩擦,从而减少摩擦损失的一种精密的机械元件. 滚动轴承一般由内圈.外圈.滚动体和保持架四部分组成.内圈的作用是与轴相配合并与轴一起旋转: 外圈 ...
- ps2改usb接口_简单易懂,改装任意手柄为Type-C接口的方法
为什么要改Type-C 我常用的PS3手柄,因为使用过多所以现在不太好用了,这主要是因为数据线充电拔出插入多了,导致簧片松弛,没法夹紧,最近经常充电时候要把线凹出各种奇怪的姿势.Type-C接口挺好用 ...
- 私有云的优缺点_简单易懂:公有云和私有云的区别,优缺点
1.公有云:关键词 共享资源 公有云提供的是服务,用户只有服务的使用权. 公有云是指由IDC服务商或第三方提供商以共享资源(硬件.存储和带宽等)的方式,面向大众提供计算资源的服务.公有云的最大意义是使 ...
- 主成分分析法案例_机器学习理论(五)主成分分析法
(小小:机器学习的经典算法与应用) (小小:机器学习理论(一)KNN-k近邻算法) (小小:机器学习理论(二)简单线性回归) (小小:机器学习理论(三)多元线性回归) (小小:机器学习理论(四)线性回 ...
- 公式太多,读不懂? 一文带你领略KNN近邻算法~简单易懂
↑ 点击上方[计算机视觉联盟]关注我们 K近邻算法采用测量不同特征值之间的距离方法进行分类. K-近邻算法工作原理: 存在一个样本数据集合,也称作训练样本集,并且样本集中的每个数据都存在标签,即我们知 ...
- 业务数据分析中可能用到的简单的数据挖掘方法——相关性分析、主成分分析、因子分析
业务数据分析中可能用到的简单的数据挖掘方法--相关性分析.主成分分析.因子分析 相关性分析 相关性分析通过相关系数来描述两个变量之间的相关性程度. 通过相关系数判断两者会不会相互影响,影响是正相关还是 ...
- 可用于 主成分分析、R型因子分析、简单相应分析 的R语言函数总结
一.主成分分析 主成分分析是多元统计分析的一种常用的降维方法,它以尽量少的信息损失,最大程度将变量个数减少,且彼此间互不相关.提取出来的新变量成为主成分,主成分是原始变量的线性组合. 1.1 KMO检 ...
- 主成分与因子分析异同_如何做主成分分析和因子分析?它们的区别与联系在哪里?...
"主成分分析和因子分析有什么区别和联系?"这个问题其实很多朋友在后台提问过,今天将这个问题的答案写成推送分享给大家.以后有问题或需求,请在下方留言区留言.觉得解释得好的朋友,记得打 ...
最新文章
- JedisConnectionException: java.net.SocketException: Broken pipe
- 注意:python flask 里image文件 css文件 html文件都必须有固定存放位置!
- android 始终显示overflow菜单
- javascript 查看变量类型
- android 自定义 child,Android自定义View
- JS异步操作新体验之 async函数
- python:copy()和deepcopy()区别
- mongodb实验报告_Dropwizard,MongoDB和Gradle实验
- AngularJS国际化配置
- python 关于反射和类的特殊成员方法
- mysql配置好后_安装完 MySQL 后必须调整的 10 项配置
- 关于计算机的幻想作文600字,科学幻想作文600字
- 深入理解C语言(转载)
- JAVA编写飞机大战---分析过程及源代码(超详细超完整)
- 基于直流电机调速平台的PID参数整定心得
- 男生如何找准自己的穿衣风格,提升衣着品味(转载:搜狐男人)
- xshell功能大全(上)
- 将CD转MP3工具(WIN7以上可以使用)
- 谈谈 DNS 原理及“域名劫持”和“域名欺骗/域名污染”
- CVPR 2022|上海交大腾讯优图提出IFRNet:视频插帧新范式新SOTA
热门文章
- T-SQL笔记8:索引
- Hibernate简介与运行原理
- [数据结构] 伸展树(Splay Tree)原理及若干应用详解(无指针)
- Fiddler中常用的方法
- python字符串转为ascii码_Python学习经验:无重复字符的最长子串
- python 消息队列 go_Python并发编程-RabbitMq消息队列
- httphandler java_java – 使用HTTPHandler上传文件
- python贪吃蛇源代码_python实现贪吃蛇游戏源码
- es6 对象中是否有键值_JS获取对象键值对中key值的方法
- 计算机网络传输介质中速率最快的是,通常传输速率最快的网络类型是()