主成分分析法概述、案例实例分析
主成分分析法
主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。在实证问题研究中,为了全面、系统地分析问题,我们必须考虑众多影响因素。这些涉及的因素一般称为指标,在多元统计分析中也称为变量。因为每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而所得的统计数据反映的信息在一定程度上有重叠。在用统计方法研究多变量问题时,变量太多会增加计算量和增加分析问题的复杂性,人们希望在进行定量分析的过程中,涉及的变量较少,得到的信息量较多。主成分分析正是适应这一要求产生的,是解决这类题的理想工具。
主成分分析法是一种数学变换的方法, 它把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差,称为第一主成分,第二变量的方差次大,并且和第一变量不相关,称为第二主成分。依次类推,I个变量就有I个主成分。
这种方法避免了在综合评分等方法中权重确定的主观性和随意性,评价结果比较符合实际情况;同时,主成份分量表现为原变量的线性组合,如果最后综合指标包括所有分量,则可以得到精确的结果,百分之百地保留原变量提供的变差信息,即使舍弃若干分量,也可以保证将85%以上的变差信息体现在综合评分中,使评价结果真实可靠。是在实际中应用得比较广的一种方法。由于其第一主成份(因子)在所有的主成分中包含信息量最大,很多学者在研究综合评价问题时常采用第一主成分来比较不同实体间的差别。综上所述,该方法的优点主要体现在两个方面:1.权重确定的客观性;2.评价结果真实可靠。
1.主成分分析的基本原理
主成分分析:把原来多个变量划为少数几个综合指标的一种统计分析方法,是一种降维处理技术。)
记原来的变量指标为x1,x2,…,xP,它们的综合指标——新变量指标为z1,z2,…,zm(m≤p),则
z1,z2,…,zm分别称为原变量指标x1,x2,…,xP的第一,第二,…,第m主成分,在实际问题的分析中,常挑选前几个最大的主成分。
① zi与zj(i≠j;i,j=1,2,…,m)相互无关;
② z1是x1,x2,…,xP的一切线性组合中方差最大者,z2是与z1不相关的x1,x2,…,xP的所有线性组合中方差最大者;……;zm是与z1,z2,……,zm-1都不相关的x1,x2,…,xP的所有线性组合中方差最大者。
2. 主成分分析的计算步骤
① 计算相关系数矩阵
② 计算特征值与特征向量
③ 计算主成分贡献率及累计贡献率
④ 计算主成分载荷
主成分分析方法(举例)
3. 主成分分析方法应用实例 注:表中数据详见书本87和88页。 ② 由相关系数矩阵计算特征值,以及各个主成分的贡献率与累计贡献率(见表3.5.3)。由表3.5.3可知,第一,第二,第三主成分的累计贡献率已高达86.5%,故只需求出第一、第二、第三主成分z1,z2,z3即可。
(2) 结果分析: |
http://hi.baidu.com/penpaopen/blog
主成分分析法概述、案例实例分析相关推荐
- openGauss数据库性能调优概述及实例分析
目录 调优思路概述 调优流程 确定性能调优范围 性能因素 调优范围确定 硬件瓶颈点分析 CPU 内存 I/O 网络 查询最耗性能的SQL 分析作业是否被阻塞 调优思路概述 openGauss的总体性能 ...
- 数学建模学习笔记(21)主成分分析法
主成分分析法概述 主成分分析(PCA)是一种降维算法,能够将多个数据指标转换为少数几个主成分,这些主成分是原始变量的线性组合,并且彼此之间互不相关,能够反映原始数据的大部分信息. 主成分分析法的适用情 ...
- 【编译原理笔记06】语法分析,移入-归约分析:自底向上的分析,LR(0)分析法,LR(0)分析表的构建(基于自动机)
本次笔记内容: 4-8 自底向上的分析概述 4-9 LR分析法概述 4-10 LR0分析 4-11 LR0分析表构造 本节课幻灯片,见于我的 GitHub 仓库:第6讲 语法分析_3.pdf 本节课介 ...
- 分层结构的生活例子_层次分析法经典案例
层次分析法经典案例 篇一:层次分析法步骤 层次分析法实例与步骤 结合一个具体例子,说明层次分析法的基本步骤和要点. [案例分析] 市政工程项目建设决策: 层次分析法问题提出 市政部门管理人员需要对 修 ...
- 主成分分析法(PCA)的理解(附python代码案例)
目录 一.PCA简介 二.举个例子 三.计算过程(公式) 3.0 题干假设 3.1 标准化 3.2 计算协方差矩阵 3.3 计算特征值和特征值向量 3.3 多重共线性检验(可跳过) 3.4 适合性检验 ...
- 主成分分析法案例_因子分析案例及操作解析
分析一个省的科技创新能力受哪些潜在因素的影响?(本数据来源于网络收集,x1~x15代表各省市相关经济指标) 第一步:数据输入(如下图) 第二步:操作步骤:分析--降维--因子分析(F). 得出下图:( ...
- Python实现主成分分析(PCA)降维:原理及实例分析
转载文章:Python实现主成分分析(PCA)降维:原理及实例分析 简介 降维是由一些问题带来的: 可以缓解由维度诅咒(高维)带来的问题: 可以用来压缩数据,将损失数据最小化: 可以将高维数据降到低维 ...
- 主成分分析法案例_机器学习理论(五)主成分分析法
(小小:机器学习的经典算法与应用) (小小:机器学习理论(一)KNN-k近邻算法) (小小:机器学习理论(二)简单线性回归) (小小:机器学习理论(三)多元线性回归) (小小:机器学习理论(四)线性回 ...
- 层次分析法原理及实例(AHP)
层次分析法(AHP) 一.层次分析法概述 层次分析法(analytic hierarchy process),简称AHP,是指将与决策总是有关的元素分解成目标.准则.方案等层次,在此基础之上进行定性和 ...
最新文章
- Java爬虫--json数据处理:JSONObject的使用
- Python内置方法大全
- 设置cookie和查找cookie的方法
- 让IE和Firefox(包括chrome)浏览器默认产生滚动条的滚动槽
- 前端学习(2029)vue之电商管理系统电商系统之timeline组件
- MyBatis之输入(parameterType)与输出(resultType、resultMap)映射
- 【codevs1285】【BZOJ1208】宠物收养所,splay练习
- 使用函数统计指定数字的个数_四种函数方法实现按条件统计一个区间数字的个数...
- linux man命令原理,Linux命令之man详解
- python中安装decimal模块_第38天:Python decimal 模块
- 淘晶驰串口屏下载工程慢怎么办
- 数字图像处理·自适应滤波器降低噪声
- 云计算与虚拟化技术发展编年史
- 数据结构实习——重言式的判别(写的不好不要见怪)
- 从零实践强化学习之连续动作空间上求解RL(PARL)
- 每天坚持“踮脚尖”,时间久了,身体会收获什么?每天踮多久?
- 中国通信服务股份有限公司之广通服的划分!
- DNS知识及域名解析内容深入浅出超详细总结附DNS配置教程
- 线性代数与解析几何——Part1 解析几何
- 2021-08-23 FM24C04写入数据时,跨页会导致指针指向本页的起始地址