主成分分析碎石图_科学网—主成分分析之R篇 - 林元震的博文
R中psych包可以进行主成分分析,其分析的步骤为:
(1) 判断主成分的个数;
(2) 提取主成分;
(3) 获取主成分得分;
(4) 列出主成分方程,解释主成分意义。
【例子】 测定了20株杨树树叶,每个叶子测定了4个变量(叶长x1,2/3处叶宽x2,1/3处叶宽x2,1/2处叶宽x2),测定结果如表4-52所示。试进行本样本的主成分分析。
psych包中的fa.parallel()函数可以判断主成分的个数,其使用格式为:
fa.parallel(x, fa = , n.iter =)
其中,x为待研究的数据集或相关系数矩阵,fa为主成分分析(fa= "pc")或者因子分析(fa = "fa"),n.iter指定随机数据模拟的平行分析的次数。分析代码如下:
运行上述代码,得到结果如下:
上图中,直线与x符号链接的曲线为碎石图,1.0水平线为1准则的特征值,虚线为100次随机数据模拟的平行分析。碎石图画出了特征值与主成分分数的图形。结果表明,选择2个主成分即可保留样本中的大量分信息。
第二步,提取主成分。psych包中的principal( )函数可以根据原始数据或相关系数矩阵做主成分分析,其使用格式为:
principal(x, nfactors =, rotate =, scores =)
其中,x是原始数据或相关系数矩阵,nfactors指定主成分个数,rotate指定旋转的方法(“none”或“varimax”),scores为是否需要计算主成分得分(“T”或”F”)。
分析代码和运行结果如下:
从上述的结果中可以看出,RC1、RC2栏包含了旋转的成分载荷(component loadings),成分载荷是观观测变量与主成分的相关系数。成分载荷可用于解释主成分的含义。在本例中,第一主成分(RC1)与X2、X3、X4高度相关(相关值 > 0.9),第二主成分(RC2)与X1高度相关(相关值 = 1)。
h2栏是成分公因子方差,是主成分对每个变量的方差解释度。U2栏是成分唯一性,是主成分无法解释变量方差的比例,其值 = 1-h2。比如,本例中,第一主成分对x2变量方差的解释为97%,2.97%不能解释。
SS loadings包含了与主成分相关联的特征值,其含义是与特定主成分相关联的标准化后的方差值。比如,本例中,第一主成分的值为2.86。接下来的proportion var和cumulative var分别为主成分对整个数据集的方差解释度和累积解释度。
本例中,第一主成分解释了4个变量71%的方差,第二主成分解释了27%的方差,累计方差的解释度为99%。
第三步,获取主成分的得分。在第二步的代码基础上,加上下面的代码,即可获得主成分的得分。
round(unclass(pc$weights),2) ## 获取主成分得分的系数。
运行结果如下:
根据上述的结果,即可写出第一和第二主成分的方程:
Y1 = 0.09 X1 + 0.31 X2 + 0.37 X3 + 0.35 X4
Y2 = 0.94 X1 - 0. 16 X2 + 0.20 X3 + 0.02 X4
从上述的两个方程中可知,第一主成分中,x2、x3、x4的系数相差不多,x1的系数较小,而x2、x3、x4均是叶宽的变量,因此第一主成分是表示叶宽的综合因子。同理,第二主成分主要由x1决定,是表示叶长的综合因子。总之,叶片之间的差异主要表现为叶宽,其次是叶长。
最后,还可画出样本排序图,横坐标为各样本第一主成分的得分,纵坐标为各样本第二主成分的得分,图中可直观地看出样本间的相互关系。全部叶片大致可分为两组:a1 ~ a10样本为一组,b1 ~ b10样本为一组。
转载本文请联系原作者获取授权,同时请注明本文来自林元震科学网博客。
链接地址:http://blog.sciencenet.cn/blog-1114360-736595.html
上一篇:双性状分析之MCMCglmm篇
下一篇:颜色等高图之R篇
主成分分析碎石图_科学网—主成分分析之R篇 - 林元震的博文相关推荐
- r语言算巢式设计方差分析_科学网—巢式设计之R篇 - 林元震的博文
巢式设计(Nested design),也称为嵌套设计或系统分组设计.把研究对象分成若干组,每组内又分若干亚组,每个亚组又有若干观测值的设计,称为巢式设计.根据因素数的不同,巢式设计可分为二因素(二级 ...
- r语言 林元震_科学网—ASReml-R之简介 - 林元震的博文
目前用于遗传分析的主要统计软件有SAS和SPSS等,并已经开发出了包括WOMBAT.MCMCglmm(R语言的程序包)等在内一系列遗传方差组份估计软件.ASReml是一个非常强大的统计软件,由NSW ...
- r语言 林元震_科学网—R语言简介 - 林元震的博文
R既是软件,也是语言,在GNU协议General Public Licence下免费发行,是1995年由新西兰奥克兰大学统计系的Ross Ihaka和Robert Gentleman基于S语言基础上共 ...
- r语言 林元震_林木多地点半同胞子代测定遗传分析 R语言程序包及其应用
[1]孔繁浩,阮梓材.半同胞子代测定的试验设计和分析[j].广东林业科技,1988(1):32-35.kongfh,ruanzc.theexperimentaldesignandanalysisofh ...
- 主成分分析碎石图_选取公共因子时 碎石图怎么看
R语言实战(九)主成分和因子分析 - gy_jerry - 博客园2017年2月28日-含平行分析的碎石图 factorot 绘制因子分析或提取公共因子的方法有很多,包括似然法(ml).主轴可以将SE ...
- 主成分分析碎石图_用户体验数据的多维度处理:PC A法及碎石图
无关乎算法原理,本文将从用户体验的角度,着重分析多维度数据处理的降维方法:主成分分析法(PC A) 主成分分析法(PC A):类似SUS,该方法能够将诸多因子如(满意度,可用性,简易性等多指标转化成低 ...
- 主成分分析碎石图_主成分分析(PCA)基本原理及分析实例
主成分分析(PCA)是一种数据降维技巧,它能将大量相关变量转化为一组很少的不相关变量,这些无关变量称为主成分.例如,使用PCA可将30个相关(很可能冗余)的环境变量转化为5个无关的成分变量,并且尽可能 ...
- 主成分分析碎石图_用R软件包ade4做主成分分析图(PCA)
该篇文章参考了ade4的软件包的说明,以及如下文档: 一:数据输入格式: 每一行代表样本,每列代表一个表征值.第二例为分组因子. 二:命令处理: x library(ade4) row.names=1 ...
- hdc mfc 画扇形图_科学网—画扇形图(idl程序) - 张国印的博文
IDL画扇形图还是有些麻烦的,今天中午没午休,以红移和RA为例写了程序,希望以后能用上 pro sector set_plot,'ps' device,file='F:Aprilmap.ps' REA ...
最新文章
- python重复import_Python module重复载入的问题
- 图神经网络的二阶池化:从节点表示中学习图的表示
- (转)Python开发规范
- 使用镜像源安装EASY_INSTALL和PIP教程
- Anti-Screen Capture(Prevent Screen Captures)截屏与反截屏
- 【Flink】SqlValidatorException: Column xxx not found in any table
- centos设置启动mysql,Centos设置开机启动Apache和Mysql
- curl: (52) Empty reply from server
- mybaitplus 根据id批量进行修改_phpcms小程序插件api接口升级到4.3(新增批量获取、搜索等接口)...
- 责任分配矩阵和raci的区别_有限责任公司实现盈利,当年就一定可以分红吗?...
- echarts Map(地图) 不同颜色区块显示
- Kubernets k8s中yml格式与pod yml格式
- 如何批量下载上海证券交易所上市公司年报
- GIS应用水平考试2009年度第一次全国统一考试
- 认证的公众号可以快速免费注册认证小程序
- 使用plugman开发cordova 高德地图定位插件
- Kahan summation
- 学校学生工科学生接私活_理工科学生在美国以外的最佳城市
- 破解TP-Link路由-嗅探PPPoE拨号密码
- matlab实用教程第2版 答案,MATLAB实用教程(第2版)