实验06  主成分分析法

一、实验目的

做作业顺便分析一下安徽省各个地级市的经济实力做个排序分类

二、实验内容

主成分分析找出主要指标

计算得分,搞排序

聚类搞分类

三、实验数据准备

安徽省2007年各地市经济指标数据

四、实验过程

(一)SAS程序

①主成分分析法

data indicators;

input x1-x8 @@;

cards;

491.70 380.31 158.39 121.54 22.74 439.65 344.44 17.43

21.12 30.55 6.40 12.40 3.31 21.17 17.71 2.03

1.71 2.35 0.57 0.68 0.13 1.48 1.36 -0.03

9.83 9.05 3.13 3.43 0.64 8.76 7.81 0.54

64.06 77.86 20.63 30.37 5.96 63.57 52.15 4.71

30.38 46.90 9.19 9.83 17.87 28.24 21.90 3.80

31.20 70.07 8.93 18.88 33.05 31.17 26.50 2.84

104.69 78.95 29.61 25.96 5.39 98.08 84.81 3.81

12.79 14.16 3.66 4.07 1.57 11.95 10.24 0.73

39.43 44.60 15.17 15.72 3.27 36.03 27.87 3.48

;

proc princomp out=prin ;

var x1-x8;

run;

②主成分得分

data indicators;

input x1-x8 @@;

cards;

491.70 380.31 158.39 121.54 22.74 439.65 344.44 17.43

21.12 30.55 6.40 12.40 3.31 21.17 17.71 2.03

1.71 2.35 0.57 0.68 0.13 1.48 1.36 -0.03

9.83 9.05 3.13 3.43 0.64 8.76 7.81 0.54

64.06 77.86 20.63 30.37 5.96 63.57 52.15 4.71

30.38 46.90 9.19 9.83 17.87 28.24 21.90 3.80

31.20 70.07 8.93 18.88 33.05 31.17 26.50 2.84

104.69 78.95 29.61 25.96 5.39 98.08 84.81 3.81

12.79 14.16 3.66 4.07 1.57 11.95 10.24 0.73

39.43 44.60 15.17 15.72 3.27 36.03 27.87 3.48

;

Proc Princomp data=indicators n=5 outstat=fstat std;

Var X1-X8;

Proc Score data=indicators score=fstat out=fscore;

Proc Print data=fscore;

Run;

③主成分聚类

input x1-x8 @@;

cards;

491.70 380.31 158.39 121.54 22.74 439.65 344.44 17.43

21.12 30.55 6.40 12.40 3.31 21.17 17.71 2.03

1.71 2.35 0.57 0.68 0.13 1.48 1.36 -0.03

9.83 9.05 3.13 3.43 0.64 8.76 7.81 0.54

64.06 77.86 20.63 30.37 5.96 63.57 52.15 4.71

30.38 46.90 9.19 9.83 17.87 28.24 21.90 3.80

31.20 70.07 8.93 18.88 33.05 31.17 26.50 2.84

104.69 78.95 29.61 25.96 5.39 98.08 84.81 3.81

12.79 14.16 3.66 4.07 1.57 11.95 10.24 0.73

39.43 44.60 15.17 15.72 3.27 36.03 27.87 3.48

;

Proc Princomp data=indicators out=fscore;

Var X1-X8;

Proc Print data=fscore;

Proc Cluster data=fscore method=ave;

Var prin1-prin5;

Proc Tree horizontal graphics;

Run;

(二)SAS运行结果

①主成分分析

PRINCOMP 过程

观测

10

变量

8

简单统计量

 

x1

x2

x3

x4

x5

x6

x7

x8

均值

80.6910000

75.4800000

25.56800000

24.28800000

9.39300000

74.0100000

59.4790000

3.934000000

StD

147.5287150

110.6940138

47.50593198

35.51512129

11.23277254

131.6203630

103.0715512

5.003374861

相关矩阵

 

x1

x2

x3

x4

x5

x6

x7

x8

x1

1.0000

0.9909

0.9994

0.9900

0.4256

0.9999

0.9993

0.9777

x2

0.9909

1.0000

0.9908

0.9965

0.5252

0.9918

0.9908

0.9904

x3

0.9994

0.9908

1.0000

0.9904

0.4208

0.9990

0.9978

0.9795

x4

0.9900

0.9965

0.9904

1.0000

0.4746

0.9915

0.9909

0.9883

x5

0.4256

0.5252

0.4208

0.4746

1.0000

0.4284

0.4272

0.5077

x6

0.9999

0.9918

0.9990

0.9915

0.4284

1.0000

0.9997

0.9790

x7

0.9993

0.9908

0.9978

0.9909

0.4272

0.9997

1.0000

0.9772

x8

0.9777

0.9904

0.9795

0.9883

0.5077

0.9790

0.9772

1.0000

相关矩阵的特征值

 

特征值

差分

比例

累积

1

7.18394158

6.40624654

0.8980

0.8980

2

0.77769504

0.74971454

0.0972

0.9952

3

0.02798050

0.01974328

0.0035

0.9987

4

0.00823722

0.00616221

0.0010

0.9997

5

0.00207501

0.00201722

0.0003

1.0000

6

0.00005780

0.00004564

0.0000

1.0000

7

0.00001216

0.00001149

0.0000

1.0000

8

0.00000067

0.0000

1.0000

特征向量

 

Prin1

Prin2

Prin3

Prin4

Prin5

Prin6

Prin7

Prin8

x1

0.370593

-.116427

0.296863

0.203379

-.065478

-.210779

0.626233

-.527950

x2

0.372953

0.012785

-.064937

-.221184

-.197380

-.689141

-.513769

-.172545

x3

0.370450

-.122168

0.198176

0.226288

-.687598

0.463903

-.246146

0.093682

x4

0.371410

-.050379

-.247636

-.803189

-.029312

0.280222

0.269291

0.034349

x5

0.192516

0.971093

0.112743

0.030382

0.005680

0.065492

0.040682

0.017486

x6

0.370856

-.112975

0.258806

0.102516

0.186895

-.261797

0.202854

0.792209

x7

0.370563

-.114159

0.297724

0.032807

0.655512

0.333353

-.406800

-.231579

x8

0.369426

-.001090

-.799204

0.448205

0.135816

0.054549

0.049767

0.003239

②主成分得分

Obs

x1

x2

x3

x4

x5

x6

x7

x8

Prin1

Prin2

Prin3

Prin4

Prin5

1

491.70

380.31

158.39

121.54

22.74

439.65

344.44

17.43

2.75800

-0.28032

0.26592

0.12523

-0.52934

2

21.12

30.55

6.40

12.40

3.31

21.17

17.71

2.03

-0.41738

-0.36953

-0.43077

-0.61992

-0.03576

3

1.71

2.35

0.57

0.68

0.13

1.48

1.36

-0.03

-0.65342

-0.59153

1.04031

-0.03381

-0.83732

4

9.83

9.05

3.13

3.43

0.64

8.76

7.81

0.54

-0.58395

-0.57514

0.74696

0.05402

-0.56917

5

64.06

77.86

20.63

30.37

5.96

63.57

52.15

4.71

-0.02461

-0.29756

-1.78137

-1.53138

0.60334

6

30.38

46.90

9.19

9.83

17.87

28.24

21.90

3.80

-0.23515

1.03509

-0.86111

2.20389

0.41583

7

31.20

70.07

8.93

18.88

33.05

31.17

26.50

2.84

-0.09083

2.50333

0.62522

-1.01636

-0.25050

8

104.69

78.95

29.61

25.96

5.39

98.08

84.81

3.81

0.07541

-0.48313

0.90622

0.13736

2.48429

9

12.79

14.16

3.66

4.07

1.57

11.95

10.24

0.73

-0.55292

-0.49473

0.70501

0.10597

-0.41579

10

39.43

44.60

15.17

15.72

3.27

36.03

27.87

3.48

-0.27515

-0.44649

-1.21637

0.57501

-0.86557

③主成分聚类

CLUSTER 过程

类平均聚类分析

协方差矩阵的特征值

 

特征值

差分

比例

累积

1

7.18394158

6.40624654

0.8980

0.8980

2

0.77769504

0.74971454

0.0972

0.9952

3

0.02798050

0.01974328

0.0035

0.9987

4

0.00823722

0.00616221

0.0010

0.9997

5

0.00207501

0.0003

1.0000

根均方总样本标准差

1.264905

观测之间的根均方距离

3.999982

聚类历史

聚类数

连接聚类

频数

Norm RMS
Distance

结值

9

OB4

OB9

2

0.0275

8

OB3

CL9

3

0.0615

7

OB2

OB10

2

0.1062

6

OB5

OB8

2

0.1438

5

CL7

CL8

5

0.1943

4

OB6

OB7

2

0.3513

3

CL5

CL6

7

0.3733

2

CL3

CL4

9

0.5684

1

OB1

CL2

10

2.0735

(三)运行结果分析

①主成分分析法

从特征值表中很简单可以看到x1指标累计解释方差的比率已经达到89%,x1,x2两个指标累积解释方差的比值高达97%。说明安徽省地级市经济第一主成分是工业总产值,第二主成分是地区资产合计,因此这两个指标可以反映所有信息的97%。

②主成分得分

不做赘述,用对应的proportion乘以prinx就成,而且我觉得可以直接用x1的proportion乘以prin1就行,因为代表了差不多90%的信息,做完后可以发现obs1的得分最高=2.48分,说明其最发达,其次是obs8得分=0.07分,第二发达,后面的以此类推就行,限于时间不展开计算。

③主成分聚类

城市1是第一类,5和8是第二类,6和7是第三类,城市2 3 4 9 10是第四类

五、实验感想

我拿MATLAB也做过主成分分析,看来SAS的主成分分析确实要比较简单操作些,起码代码啥的都比较简单。这个实验做得失败的地方在于我没怎么看懂最后的聚类分析。遗憾。(这个疑问在做完聚类分析的题目后得到了解答)

实验06 主成分分析法相关推荐

  1. [MATLAB] 主成分分析法 求矩阵的权重

    主成分分析法 求矩阵的权重 clc clear close all R = ...[ 0.12 0.41 0.33 0.12 0.03; ...0.14 0.52 0.21 0.10 0.03; .. ...

  2. 数学建模之主成分分析法

    评价方法大体可分为两类,其主要区别在确定权重的方法上.一类是主观赋权法,多数采取综合咨询评分确定权重,如综合指数法,模糊综合评价法,层次分析法,功效系数法等.另一类是客观赋权,根据各指标间相关关系或各 ...

  3. 最小二乘法与主成分分析法原理及应用详解和它们的联系

    网上关于最小二乘法及主成分分析的介绍数不胜数,这两种方法均为挖掘数据分布规律的最重要也是最基本的工具.主成分分析法与最小二乘法实际上有所联系,前者分析出的"主方向"实质上是最小二乘 ...

  4. Python 主成分分析法 PCA

    主成分分析法是一种利用相关系数对数据进行降维的方法,可用于处理维数过多.指标意义不明确的数据.求相关系数的方法有很多种,下面只以协方差法为例 相关系数 输入是 shape 为 [sample, fea ...

  5. pca主成分分析结果解释_SKLEARN中的PCA(Principal Component Analysis)主成分分析法

    PCA(Principal Component Analysis)主成分分析法是机器学习中非常重要的方法,主要作用有降维和可视化.PCA的过程除了背后深刻的数学意义外,也有深刻的思路和方法. 1. 准 ...

  6. 主成分分析 图像处理 matlab,matlab信号处理与主成分分析法,毕业设计求助

    虽然这里没人帮我,但是这个论坛的免费资源依然对我起到了不小的帮助,现在我的东西的MATLAB部分基本已经完成,数据需要经过SPSS处理,我不会主成分分析法,SPSS倒是会了基本操作了,如果有人能帮我用 ...

  7. 主成分分析法_“主成分分析法”——线上讨论会等你加入

    Hi-新朋友,记得点蓝字关注我们哟 主成分分析法 --线上讨论会 新一轮的线上讨论会又要来啦~这次由我们实证会计板块与大家一起分享有关层次分析法的内容,也十分欢迎大家提前了解并与群内的各位学者研究讨论 ...

  8. 主成分分析法怎么提取图片中的字_在主成分分析里,如何提取主成分

    因子分析---选项中有一项是特征根植大于1 或者说是指定主成分个数,默认是提取的特征根植为1, 你改成 下面的指定主成分个数那一项就可以了 你想指定几项都可以 不过要小于所有变量个数 Fp = a1i ...

  9. sklearn 主成分分析法 PCA和IPCA

    主成分分析法 (PCA) 是一种常用的数据分析手段.对于一组不同维度 之间可能存在线性相关关系的数据,PCA 能够把这组数据通过正交变换变 成各个维度之间线性无关的数据.经过 PCA 处理的数据中的各 ...

  10. 主成分分析法(PCA)原理漫谈

    在研究OpenCV人脸识别算法时,了解到其中OpenCV特征脸法Eigenfaces是基于主成分分析法(principal component analysis,简称PCA),后来再了解到PCA不仅仅 ...

最新文章

  1. java中的常用的文件流_Java 基础(四)| IO 流之使用文件流的正确姿势
  2. vue与php通过axios进行数据交互
  3. OS- -操作系统概念
  4. 如何处理SAP Fiori Launchpad KPI tile点击后出现的错误消息
  5. 虚拟空间独立服务器哪个好,共享虚拟主机和独立哪个好
  6. 10年+,阿里沉淀出怎样的搜索引擎?
  7. dubbo调用超时回滚_面试必问之Dubbo面试题
  8. oracle的in集合,oracle中in与not in集合中有空值问题
  9. Flex组件的行为和动画效果(实例)
  10. Linux仿真运算集群,fluent DPM Linux计算集群运行报错 - 计算模拟 - 小木虫 - 学术 科研 互动社区...
  11. python实现单链表快速排序升序linkedqueue_数据结构回顾
  12. c语言赌徒游戏,The Gambler(I)赌徒(英文版)
  13. 各种ListView列表方法
  14. 批量数据插入(Java读取Excel文件并使用mybatis写入MySQL数据库)(含免费源码下载)
  15. 找工作,首先找的是老板和主管
  16. 四川省高中计算机考试,四川高中信息技术学业水平考试时间
  17. Java函数replaceAll 的使用
  18. J2ME 访问JAR和JAD文件中的属性
  19. CTS测试中CameraTest#testPreviewFpsRange项
  20. 小米电视ec、小米电视es、小米电视ea2022款的区别

热门文章

  1. 汽车智能化新赛道——CMS国标明年1月1日落地,供应链已提前布局
  2. 邮箱搬家操作步骤及详细说明
  3. 12v电瓶20安时是什么意思
  4. 体检信息管理系统功能表
  5. 体验+营销+云,Adobe越来越“不务正业”了?
  6. CSDN博文精选:最受欢迎的系列专栏博客推荐
  7. 9.STC15W408AS单片机EEPROM
  8. ramda_使用Ramda.js进行动手功能编程
  9. html一键删除空白格,如何一次性删除空白行 word里的空白行怎么批量删除
  10. CausalImpact