主成分分析是一种浓缩数据信息的方法,可将很多个指标浓缩成综合指标(主成分),并保证这些综合指标彼此之间互不相关。可用于简化数据信息浓缩、计算权重、竞争力评价等。

一、研究背景

某研究想要了解各地区高等教育发展水平的综合排名。从中选取30个地区10个评价指标,使用主成分分析进行降维,并计算综合得分。

二、操作步骤

(1)点击【进阶方法】--【主成分】。

(2)将分析项拖拽至右侧,勾选[成分得分]、[综合得分]。点击开始分析。

也可以根据自己的分析需要,主动设置主成分个数。

三、分析思路

Step1:判断是否适合进行主成分分析

上表展示KMO检验和Bartlett 的检验结果,用来看此数据适不适合进行主成分分析。

通常KMO值的判断标准为0.6。大于0.6说明适合进行分析,反之,说明不适合进行分析。同时Bartlett检验对应P值小于0.05也说明适合分析。

SPSSAU输出的结果中会给出智能解读结果,直接查看智能分析:

Step2:确定主成分个数,及判断主成分与分析项对应关系

确定可以使用主成分分析后,下一步重点确定主成分个数。

方差解释率表格主要用于判断提取多少个主成分合适。以及每个主成分的方差解释率和累计方差解释率情况。方差解释率越大说明主成分包含原数据信息的越多。

从上表可知:本次共提取了2个主成分。这2个主成分的方差解释率分别是75.024%,15.767%,累积方差解释率为,90.791%。说明两个主成分能够表达10个分析项90.791%的信息量,主成分分析效果很好。

碎石图

同时可结合碎石图辅助判断主成分提取个数。

当折线由陡峭突然变得平稳时,陡峭到平稳对应的主成分个数即为参考提取主成分个数。实际研究中更多以专业知识,结合主成分与研究项对应关系情况,综合权衡判断得出主成分个数。

载荷系数表格,主要展示主成分对于研究项的信息提取情况,以及主成分和研究项对应关系。

蓝色数值代表载荷系数绝对值大于0.4,如高等院校数对应的载荷系数(0.958,-0.247)说明这个分析项更适合归于主成分1下。

共同度代表某题项可被提取的信息量,共同度越高说明指标能被主成分解释的程度越高,被提取的信息量越多。一般以0.4作为标准。

从结果中可以看出,主成分1中反映高等院校数X1、毕业生数X2、招生人数X3、在校生数X4、教职工数X5、专职教师数X6、教育经费占国内生产总值比重X9、生均教育经费X10,共八个指标的信息。

主成分2反映高级职称占专职教师的比例X7、院校平均在校生数X8两个指标的信息。共同度均超过0.4,说明各指标均能被2个主成分较好地解释。

Step3:利用主成分得到综合得分

根据之前勾选的[综合得分],即可自动得到综合得分结果。

SPSSAU默认命名为CompScore_XXXX。使用【数据处理】→【标题处理】功能可以对题目重命名。

在页面右上角【我的数据】中可以具体查看具体的综合得分。综合得分值越大表示越有竞争力,也就说明该地区高等教育发展水平越发达。

Step4:得到综合排名情况

【数据处理】→【生成变量】里的排名功能。点击“综合得分”,再选择“排名(Rank)”,点击确认处理。

综合得分排序

下载后可使用EXCEL对数据进行整理,最终结果如下:

四、疑问解答

  • 综合得分具体如何计算?

SPSSAU提供一键生成综合得分非常方便,但也会有人有疑问:综合得分是怎么计算得到?如果想描述计算过程应该怎么说?

综合得分实际就等于每个主成分得分乘以各自权重求和所得的结果。

(综合得分=主成分1得分*主成分1权重+主成分2得分*主成分2权重+.....)

“主成分得分”可以通过勾选[成分得分],由SPSSAU自动输出。

勾选成分得分

本次共提取2个主成分,因此分别生成2个主成分得分。

主成分得分

有了主成分得分,下面要解决权重问题。如何计算得到每个主成分的权重?

权重是以各主成分对应的方差贡献率除以累计方差贡献率

以本例来说,2个主成分的方差解释率分别是75.024%,15.767%,累积方差解释率为,90.791%。

主成分1的权重:75.024%/90.791%=82.63%

主成分2的权重:15.767%/90.791%=17.37%

权重结果在智能分析中也有提供,可以直接使用。

成分得分和权重都得到即可计算综合得分。

F=82.63%*主成分1得分+17.37%*主成分2得分

  • 分析之前是否需要对数据进行标准化处理?

SPSSAU默认就已经进行过标准化处理,因此不需要再对数据处理。当然标准化后的数据再次标准化依旧还是自身没有任何变化,结果均一致。

  • 相关矩阵在哪里计算?

可使用【通用方法】--【相关】得到相关矩阵。

通过相关矩阵可以看出哪些指标之间相关性较强,哪些指标之间相关性不大。

五、其他说明

主成分分析的作用更多侧重于计算权重、计算综合竞争力。不会过多关注主成分与分析项对应关系,不要求每个主成分有明确的含义。如果研究目的侧重于浓缩题项信息,更建议采用因子分析。

更多干货内容可登录SPSSAU官网查看。

SPSSAU-在线SPSS分析软件​www.spssau.com?100001000

主成分分析和因子分析_简单易懂!一文理清主成分分析思路相关推荐

  1. 小米node2红外_简单易懂,联动好用:小米 米家蓝牙温湿度计2 晒单

    简单易懂,联动好用:小米 米家蓝牙温湿度计2 晒单 2020-10-06 09:33:10 4点赞 6收藏 5评论 去年买过米家的温湿度计Pro,在家摆着和电暖风联动挺不错的,比如室温低于20℃自动开 ...

  2. 结构方程模型_简单易懂,结构方程模型思路总结

    结构方程模型是结合了多种统计分析方法,可同时检验因子.分析项.误差项间的关系.本文将基于SPSSAU系统进行说明. 1.方法辨别 结构方程模型SEM包括测量关系和影响关系:既可以测量各因素内部结构及相 ...

  3. qtablewidget固定一列滚动_简单易懂,最全滚动轴承基本知识汇总

    小编的话:滚动轴承是将运转的轴与轴座之间的滑动摩擦变为滚动摩擦,从而减少摩擦损失的一种精密的机械元件. 滚动轴承一般由内圈.外圈.滚动体和保持架四部分组成.内圈的作用是与轴相配合并与轴一起旋转: 外圈 ...

  4. ps2改usb接口_简单易懂,改装任意手柄为Type-C接口的方法

    为什么要改Type-C 我常用的PS3手柄,因为使用过多所以现在不太好用了,这主要是因为数据线充电拔出插入多了,导致簧片松弛,没法夹紧,最近经常充电时候要把线凹出各种奇怪的姿势.Type-C接口挺好用 ...

  5. 私有云的优缺点_简单易懂:公有云和私有云的区别,优缺点

    1.公有云:关键词 共享资源 公有云提供的是服务,用户只有服务的使用权. 公有云是指由IDC服务商或第三方提供商以共享资源(硬件.存储和带宽等)的方式,面向大众提供计算资源的服务.公有云的最大意义是使 ...

  6. 主成分分析法案例_机器学习理论(五)主成分分析法

    (小小:机器学习的经典算法与应用) (小小:机器学习理论(一)KNN-k近邻算法) (小小:机器学习理论(二)简单线性回归) (小小:机器学习理论(三)多元线性回归) (小小:机器学习理论(四)线性回 ...

  7. 公式太多,读不懂? 一文带你领略KNN近邻算法~简单易懂

    ↑ 点击上方[计算机视觉联盟]关注我们 K近邻算法采用测量不同特征值之间的距离方法进行分类. K-近邻算法工作原理: 存在一个样本数据集合,也称作训练样本集,并且样本集中的每个数据都存在标签,即我们知 ...

  8. 业务数据分析中可能用到的简单的数据挖掘方法——相关性分析、主成分分析、因子分析

    业务数据分析中可能用到的简单的数据挖掘方法--相关性分析.主成分分析.因子分析 相关性分析 相关性分析通过相关系数来描述两个变量之间的相关性程度. 通过相关系数判断两者会不会相互影响,影响是正相关还是 ...

  9. 可用于 主成分分析、R型因子分析、简单相应分析 的R语言函数总结

    一.主成分分析 主成分分析是多元统计分析的一种常用的降维方法,它以尽量少的信息损失,最大程度将变量个数减少,且彼此间互不相关.提取出来的新变量成为主成分,主成分是原始变量的线性组合. 1.1 KMO检 ...

  10. 主成分与因子分析异同_如何做主成分分析和因子分析?它们的区别与联系在哪里?...

    "主成分分析和因子分析有什么区别和联系?"这个问题其实很多朋友在后台提问过,今天将这个问题的答案写成推送分享给大家.以后有问题或需求,请在下方留言区留言.觉得解释得好的朋友,记得打 ...

最新文章

  1. JedisConnectionException: java.net.SocketException: Broken pipe
  2. 注意:python flask 里image文件 css文件 html文件都必须有固定存放位置!
  3. android 始终显示overflow菜单
  4. javascript 查看变量类型
  5. android 自定义 child,Android自定义View
  6. JS异步操作新体验之 async函数
  7. python:copy()和deepcopy()区别
  8. mongodb实验报告_Dropwizard,MongoDB和Gradle实验
  9. AngularJS国际化配置
  10. python 关于反射和类的特殊成员方法
  11. mysql配置好后_安装完 MySQL 后必须调整的 10 项配置
  12. 关于计算机的幻想作文600字,科学幻想作文600字
  13. 深入理解C语言(转载)
  14. JAVA编写飞机大战---分析过程及源代码(超详细超完整)
  15. 基于直流电机调速平台的PID参数整定心得
  16. 男生如何找准自己的穿衣风格,提升衣着品味(转载:搜狐男人)
  17. xshell功能大全(上)
  18. 将CD转MP3工具(WIN7以上可以使用)
  19. 谈谈 DNS 原理及“域名劫持”和“域名欺骗/域名污染”
  20. CVPR 2022|上海交大腾讯优图提出IFRNet:视频插帧新范式新SOTA

热门文章

  1. T-SQL笔记8:索引
  2. Hibernate简介与运行原理
  3. [数据结构] 伸展树(Splay Tree)原理及若干应用详解(无指针)
  4. Fiddler中常用的方法
  5. python字符串转为ascii码_Python学习经验:无重复字符的最长子串
  6. python 消息队列 go_Python并发编程-RabbitMq消息队列
  7. httphandler java_java – 使用HTTPHandler上传文件
  8. python贪吃蛇源代码_python实现贪吃蛇游戏源码
  9. es6 对象中是否有键值_JS获取对象键值对中key值的方法
  10. 计算机网络传输介质中速率最快的是,通常传输速率最快的网络类型是()