实验06 主成分分析法
实验06 主成分分析法
一、实验目的
做作业顺便分析一下安徽省各个地级市的经济实力做个排序分类
二、实验内容
主成分分析找出主要指标
计算得分,搞排序
聚类搞分类
三、实验数据准备
安徽省2007年各地市经济指标数据
四、实验过程
(一)SAS程序
①主成分分析法
data indicators;
input x1-x8 @@;
cards;
491.70 380.31 158.39 121.54 22.74 439.65 344.44 17.43
21.12 30.55 6.40 12.40 3.31 21.17 17.71 2.03
1.71 2.35 0.57 0.68 0.13 1.48 1.36 -0.03
9.83 9.05 3.13 3.43 0.64 8.76 7.81 0.54
64.06 77.86 20.63 30.37 5.96 63.57 52.15 4.71
30.38 46.90 9.19 9.83 17.87 28.24 21.90 3.80
31.20 70.07 8.93 18.88 33.05 31.17 26.50 2.84
104.69 78.95 29.61 25.96 5.39 98.08 84.81 3.81
12.79 14.16 3.66 4.07 1.57 11.95 10.24 0.73
39.43 44.60 15.17 15.72 3.27 36.03 27.87 3.48
;
proc princomp out=prin ;
var x1-x8;
run;
②主成分得分
data indicators;
input x1-x8 @@;
cards;
491.70 380.31 158.39 121.54 22.74 439.65 344.44 17.43
21.12 30.55 6.40 12.40 3.31 21.17 17.71 2.03
1.71 2.35 0.57 0.68 0.13 1.48 1.36 -0.03
9.83 9.05 3.13 3.43 0.64 8.76 7.81 0.54
64.06 77.86 20.63 30.37 5.96 63.57 52.15 4.71
30.38 46.90 9.19 9.83 17.87 28.24 21.90 3.80
31.20 70.07 8.93 18.88 33.05 31.17 26.50 2.84
104.69 78.95 29.61 25.96 5.39 98.08 84.81 3.81
12.79 14.16 3.66 4.07 1.57 11.95 10.24 0.73
39.43 44.60 15.17 15.72 3.27 36.03 27.87 3.48
;
Proc Princomp data=indicators n=5 outstat=fstat std;
Var X1-X8;
Proc Score data=indicators score=fstat out=fscore;
Proc Print data=fscore;
Run;
③主成分聚类
input x1-x8 @@;
cards;
491.70 380.31 158.39 121.54 22.74 439.65 344.44 17.43
21.12 30.55 6.40 12.40 3.31 21.17 17.71 2.03
1.71 2.35 0.57 0.68 0.13 1.48 1.36 -0.03
9.83 9.05 3.13 3.43 0.64 8.76 7.81 0.54
64.06 77.86 20.63 30.37 5.96 63.57 52.15 4.71
30.38 46.90 9.19 9.83 17.87 28.24 21.90 3.80
31.20 70.07 8.93 18.88 33.05 31.17 26.50 2.84
104.69 78.95 29.61 25.96 5.39 98.08 84.81 3.81
12.79 14.16 3.66 4.07 1.57 11.95 10.24 0.73
39.43 44.60 15.17 15.72 3.27 36.03 27.87 3.48
;
Proc Princomp data=indicators out=fscore;
Var X1-X8;
Proc Print data=fscore;
Proc Cluster data=fscore method=ave;
Var prin1-prin5;
Proc Tree horizontal graphics;
Run;
(二)SAS运行结果
①主成分分析
PRINCOMP 过程
观测 |
10 |
变量 |
8 |
简单统计量 |
||||||||
|
x1 |
x2 |
x3 |
x4 |
x5 |
x6 |
x7 |
x8 |
均值 |
80.6910000 |
75.4800000 |
25.56800000 |
24.28800000 |
9.39300000 |
74.0100000 |
59.4790000 |
3.934000000 |
StD |
147.5287150 |
110.6940138 |
47.50593198 |
35.51512129 |
11.23277254 |
131.6203630 |
103.0715512 |
5.003374861 |
相关矩阵 |
||||||||
|
x1 |
x2 |
x3 |
x4 |
x5 |
x6 |
x7 |
x8 |
x1 |
1.0000 |
0.9909 |
0.9994 |
0.9900 |
0.4256 |
0.9999 |
0.9993 |
0.9777 |
x2 |
0.9909 |
1.0000 |
0.9908 |
0.9965 |
0.5252 |
0.9918 |
0.9908 |
0.9904 |
x3 |
0.9994 |
0.9908 |
1.0000 |
0.9904 |
0.4208 |
0.9990 |
0.9978 |
0.9795 |
x4 |
0.9900 |
0.9965 |
0.9904 |
1.0000 |
0.4746 |
0.9915 |
0.9909 |
0.9883 |
x5 |
0.4256 |
0.5252 |
0.4208 |
0.4746 |
1.0000 |
0.4284 |
0.4272 |
0.5077 |
x6 |
0.9999 |
0.9918 |
0.9990 |
0.9915 |
0.4284 |
1.0000 |
0.9997 |
0.9790 |
x7 |
0.9993 |
0.9908 |
0.9978 |
0.9909 |
0.4272 |
0.9997 |
1.0000 |
0.9772 |
x8 |
0.9777 |
0.9904 |
0.9795 |
0.9883 |
0.5077 |
0.9790 |
0.9772 |
1.0000 |
相关矩阵的特征值 |
||||
|
特征值 |
差分 |
比例 |
累积 |
1 |
7.18394158 |
6.40624654 |
0.8980 |
0.8980 |
2 |
0.77769504 |
0.74971454 |
0.0972 |
0.9952 |
3 |
0.02798050 |
0.01974328 |
0.0035 |
0.9987 |
4 |
0.00823722 |
0.00616221 |
0.0010 |
0.9997 |
5 |
0.00207501 |
0.00201722 |
0.0003 |
1.0000 |
6 |
0.00005780 |
0.00004564 |
0.0000 |
1.0000 |
7 |
0.00001216 |
0.00001149 |
0.0000 |
1.0000 |
8 |
0.00000067 |
0.0000 |
1.0000 |
特征向量 |
||||||||
|
Prin1 |
Prin2 |
Prin3 |
Prin4 |
Prin5 |
Prin6 |
Prin7 |
Prin8 |
x1 |
0.370593 |
-.116427 |
0.296863 |
0.203379 |
-.065478 |
-.210779 |
0.626233 |
-.527950 |
x2 |
0.372953 |
0.012785 |
-.064937 |
-.221184 |
-.197380 |
-.689141 |
-.513769 |
-.172545 |
x3 |
0.370450 |
-.122168 |
0.198176 |
0.226288 |
-.687598 |
0.463903 |
-.246146 |
0.093682 |
x4 |
0.371410 |
-.050379 |
-.247636 |
-.803189 |
-.029312 |
0.280222 |
0.269291 |
0.034349 |
x5 |
0.192516 |
0.971093 |
0.112743 |
0.030382 |
0.005680 |
0.065492 |
0.040682 |
0.017486 |
x6 |
0.370856 |
-.112975 |
0.258806 |
0.102516 |
0.186895 |
-.261797 |
0.202854 |
0.792209 |
x7 |
0.370563 |
-.114159 |
0.297724 |
0.032807 |
0.655512 |
0.333353 |
-.406800 |
-.231579 |
x8 |
0.369426 |
-.001090 |
-.799204 |
0.448205 |
0.135816 |
0.054549 |
0.049767 |
0.003239 |
②主成分得分
Obs |
x1 |
x2 |
x3 |
x4 |
x5 |
x6 |
x7 |
x8 |
Prin1 |
Prin2 |
Prin3 |
Prin4 |
Prin5 |
1 |
491.70 |
380.31 |
158.39 |
121.54 |
22.74 |
439.65 |
344.44 |
17.43 |
2.75800 |
-0.28032 |
0.26592 |
0.12523 |
-0.52934 |
2 |
21.12 |
30.55 |
6.40 |
12.40 |
3.31 |
21.17 |
17.71 |
2.03 |
-0.41738 |
-0.36953 |
-0.43077 |
-0.61992 |
-0.03576 |
3 |
1.71 |
2.35 |
0.57 |
0.68 |
0.13 |
1.48 |
1.36 |
-0.03 |
-0.65342 |
-0.59153 |
1.04031 |
-0.03381 |
-0.83732 |
4 |
9.83 |
9.05 |
3.13 |
3.43 |
0.64 |
8.76 |
7.81 |
0.54 |
-0.58395 |
-0.57514 |
0.74696 |
0.05402 |
-0.56917 |
5 |
64.06 |
77.86 |
20.63 |
30.37 |
5.96 |
63.57 |
52.15 |
4.71 |
-0.02461 |
-0.29756 |
-1.78137 |
-1.53138 |
0.60334 |
6 |
30.38 |
46.90 |
9.19 |
9.83 |
17.87 |
28.24 |
21.90 |
3.80 |
-0.23515 |
1.03509 |
-0.86111 |
2.20389 |
0.41583 |
7 |
31.20 |
70.07 |
8.93 |
18.88 |
33.05 |
31.17 |
26.50 |
2.84 |
-0.09083 |
2.50333 |
0.62522 |
-1.01636 |
-0.25050 |
8 |
104.69 |
78.95 |
29.61 |
25.96 |
5.39 |
98.08 |
84.81 |
3.81 |
0.07541 |
-0.48313 |
0.90622 |
0.13736 |
2.48429 |
9 |
12.79 |
14.16 |
3.66 |
4.07 |
1.57 |
11.95 |
10.24 |
0.73 |
-0.55292 |
-0.49473 |
0.70501 |
0.10597 |
-0.41579 |
10 |
39.43 |
44.60 |
15.17 |
15.72 |
3.27 |
36.03 |
27.87 |
3.48 |
-0.27515 |
-0.44649 |
-1.21637 |
0.57501 |
-0.86557 |
③主成分聚类
CLUSTER 过程
类平均聚类分析
协方差矩阵的特征值 |
||||
|
特征值 |
差分 |
比例 |
累积 |
1 |
7.18394158 |
6.40624654 |
0.8980 |
0.8980 |
2 |
0.77769504 |
0.74971454 |
0.0972 |
0.9952 |
3 |
0.02798050 |
0.01974328 |
0.0035 |
0.9987 |
4 |
0.00823722 |
0.00616221 |
0.0010 |
0.9997 |
5 |
0.00207501 |
0.0003 |
1.0000 |
根均方总样本标准差 |
1.264905 |
观测之间的根均方距离 |
3.999982 |
聚类历史 |
|||||
聚类数 |
连接聚类 |
频数 |
Norm RMS |
结值 |
|
9 |
OB4 |
OB9 |
2 |
0.0275 |
|
8 |
OB3 |
CL9 |
3 |
0.0615 |
|
7 |
OB2 |
OB10 |
2 |
0.1062 |
|
6 |
OB5 |
OB8 |
2 |
0.1438 |
|
5 |
CL7 |
CL8 |
5 |
0.1943 |
|
4 |
OB6 |
OB7 |
2 |
0.3513 |
|
3 |
CL5 |
CL6 |
7 |
0.3733 |
|
2 |
CL3 |
CL4 |
9 |
0.5684 |
|
1 |
OB1 |
CL2 |
10 |
2.0735 |
(三)运行结果分析
①主成分分析法
从特征值表中很简单可以看到x1指标累计解释方差的比率已经达到89%,x1,x2两个指标累积解释方差的比值高达97%。说明安徽省地级市经济第一主成分是工业总产值,第二主成分是地区资产合计,因此这两个指标可以反映所有信息的97%。
②主成分得分
不做赘述,用对应的proportion乘以prinx就成,而且我觉得可以直接用x1的proportion乘以prin1就行,因为代表了差不多90%的信息,做完后可以发现obs1的得分最高=2.48分,说明其最发达,其次是obs8得分=0.07分,第二发达,后面的以此类推就行,限于时间不展开计算。
③主成分聚类
城市1是第一类,5和8是第二类,6和7是第三类,城市2 3 4 9 10是第四类
五、实验感想
我拿MATLAB也做过主成分分析,看来SAS的主成分分析确实要比较简单操作些,起码代码啥的都比较简单。这个实验做得失败的地方在于我没怎么看懂最后的聚类分析。遗憾。(这个疑问在做完聚类分析的题目后得到了解答)
实验06 主成分分析法相关推荐
- [MATLAB] 主成分分析法 求矩阵的权重
主成分分析法 求矩阵的权重 clc clear close all R = ...[ 0.12 0.41 0.33 0.12 0.03; ...0.14 0.52 0.21 0.10 0.03; .. ...
- 数学建模之主成分分析法
评价方法大体可分为两类,其主要区别在确定权重的方法上.一类是主观赋权法,多数采取综合咨询评分确定权重,如综合指数法,模糊综合评价法,层次分析法,功效系数法等.另一类是客观赋权,根据各指标间相关关系或各 ...
- 最小二乘法与主成分分析法原理及应用详解和它们的联系
网上关于最小二乘法及主成分分析的介绍数不胜数,这两种方法均为挖掘数据分布规律的最重要也是最基本的工具.主成分分析法与最小二乘法实际上有所联系,前者分析出的"主方向"实质上是最小二乘 ...
- Python 主成分分析法 PCA
主成分分析法是一种利用相关系数对数据进行降维的方法,可用于处理维数过多.指标意义不明确的数据.求相关系数的方法有很多种,下面只以协方差法为例 相关系数 输入是 shape 为 [sample, fea ...
- pca主成分分析结果解释_SKLEARN中的PCA(Principal Component Analysis)主成分分析法
PCA(Principal Component Analysis)主成分分析法是机器学习中非常重要的方法,主要作用有降维和可视化.PCA的过程除了背后深刻的数学意义外,也有深刻的思路和方法. 1. 准 ...
- 主成分分析 图像处理 matlab,matlab信号处理与主成分分析法,毕业设计求助
虽然这里没人帮我,但是这个论坛的免费资源依然对我起到了不小的帮助,现在我的东西的MATLAB部分基本已经完成,数据需要经过SPSS处理,我不会主成分分析法,SPSS倒是会了基本操作了,如果有人能帮我用 ...
- 主成分分析法_“主成分分析法”——线上讨论会等你加入
Hi-新朋友,记得点蓝字关注我们哟 主成分分析法 --线上讨论会 新一轮的线上讨论会又要来啦~这次由我们实证会计板块与大家一起分享有关层次分析法的内容,也十分欢迎大家提前了解并与群内的各位学者研究讨论 ...
- 主成分分析法怎么提取图片中的字_在主成分分析里,如何提取主成分
因子分析---选项中有一项是特征根植大于1 或者说是指定主成分个数,默认是提取的特征根植为1, 你改成 下面的指定主成分个数那一项就可以了 你想指定几项都可以 不过要小于所有变量个数 Fp = a1i ...
- sklearn 主成分分析法 PCA和IPCA
主成分分析法 (PCA) 是一种常用的数据分析手段.对于一组不同维度 之间可能存在线性相关关系的数据,PCA 能够把这组数据通过正交变换变 成各个维度之间线性无关的数据.经过 PCA 处理的数据中的各 ...
- 主成分分析法(PCA)原理漫谈
在研究OpenCV人脸识别算法时,了解到其中OpenCV特征脸法Eigenfaces是基于主成分分析法(principal component analysis,简称PCA),后来再了解到PCA不仅仅 ...
最新文章
- java中的常用的文件流_Java 基础(四)| IO 流之使用文件流的正确姿势
- vue与php通过axios进行数据交互
- OS- -操作系统概念
- 如何处理SAP Fiori Launchpad KPI tile点击后出现的错误消息
- 虚拟空间独立服务器哪个好,共享虚拟主机和独立哪个好
- 10年+,阿里沉淀出怎样的搜索引擎?
- dubbo调用超时回滚_面试必问之Dubbo面试题
- oracle的in集合,oracle中in与not in集合中有空值问题
- Flex组件的行为和动画效果(实例)
- Linux仿真运算集群,fluent DPM Linux计算集群运行报错 - 计算模拟 - 小木虫 - 学术 科研 互动社区...
- python实现单链表快速排序升序linkedqueue_数据结构回顾
- c语言赌徒游戏,The Gambler(I)赌徒(英文版)
- 各种ListView列表方法
- 批量数据插入(Java读取Excel文件并使用mybatis写入MySQL数据库)(含免费源码下载)
- 找工作,首先找的是老板和主管
- 四川省高中计算机考试,四川高中信息技术学业水平考试时间
- Java函数replaceAll 的使用
- J2ME 访问JAR和JAD文件中的属性
- CTS测试中CameraTest#testPreviewFpsRange项
- 小米电视ec、小米电视es、小米电视ea2022款的区别