PCA(主成分分析法)使用情景及排序企业综合实力示例
我们在研究多个研究变量时往往会出现多个变量具有相关相关性的情况,这个时候,我们就可以将多个具有多个相关性的变量综合为几个代表性的变量,这些变量既能够代表原始变量的绝大数信息又互不相关。
PCA步骤:
(1)对原始数据进行标准化处理
(2)计算样本相关系数矩阵
(3)计算相关系数矩阵R的特征值和相应的特征向量
(4)选择重要的主成分,写出主成分表达式
我们这里用企业排序实例来说明
下面是使用matlab来分析这几家企业
%%导入数据及处理
clc
clear all
A=xlsread('Coporation_evaluation','B2:I16');%数据标准化处理
a=size(A,1);
b=size(A,2);
for i=1:b%将原始数据标准化SA(:,i)=(A(:,i)-mean(A(:,i)))/std(A(:,i));%std用来计算标准差
end
%%计算相关系数的特征值和特征向量
CM=corrcoef(SA);%计算相关系数矩阵
[V,D]=eig(CM);%计算特征值和特征向量
for j=1:bDS(j,1)=D(b+1-j,b+1-j);%将特征值按降序排序
end
for i=1:bDS(i,2)=DS(i,1)/sum(DS(:,1));%贡献率DS(i,3)=sum(DS(1:i,1))/sum(DS(:,1));%累积贡献率
end
T=0.9;%主成分信息保留率
for K=1:bif DS(K,3)>=TCom_num=K;break;end
end
%提取主成分对应的特征向量
for j=1:Com_numPV(:,j)=V(:,b+1-j);
end
%%计算各评价对象的主成分得分
new_score=SA*PV;
for i=1:atotal_score(i,1)=sum(new_score(i,:));total_score(i,2)=i;
end
result_report=[new_score,total_score];%将主成分得分与总分放在同一个矩阵中
result_report=sortrows(result_report,-4);%按第4列进行总分降序排列
%%输出模型及结果报告
disp('特征值及其贡献率、累计贡献率:')
DS
disp('信息保留率T对应的主成分数与特征向量:')
Com_num
PV
disp('主成分得分及排序(按第4列的总分进行及按序排列,前3列为各主成分得分,第5列为企业编号)')
result_report
运行结果如下:
特征值及其贡献率、累计贡献率:DS =5.7361 0.7170 0.71701.0972 0.1372 0.85420.5896 0.0737 0.92790.2858 0.0357 0.96360.1456 0.0182 0.98180.1369 0.0171 0.99890.0060 0.0007 0.99970.0027 0.0003 1.0000信息保留率T对应的主成分数与特征向量:Com_num =3PV =0.3334 0.3788 0.31150.3063 0.5562 0.18710.3900 -0.1148 -0.31820.3780 -0.3508 0.08880.3853 -0.2254 -0.27150.3616 -0.4337 0.06960.3026 0.4147 -0.61890.3596 -0.0031 0.5452主成分得分及排序(按第4列的总分进行及按序排列,前3列为各主成分得分,第5列为企业编号)result_report =5.1936 -0.9793 0.0207 4.2350 9.00000.7662 2.6618 0.5437 3.9717 1.00001.0203 0.9392 0.4081 2.3677 8.00003.3891 -0.6612 -0.7569 1.9710 6.00000.0553 0.9176 0.8255 1.7984 5.00000.3735 0.8378 -0.1081 1.1033 13.00000.4709 -1.5064 1.7882 0.7527 15.00000.3471 -0.0592 -0.1197 0.1682 14.00000.9709 0.4364 -1.6996 -0.2923 2.0000-0.3372 -0.6891 0.0188 -1.0075 10.0000-0.3262 -0.9407 -0.2569 -1.5238 7.0000-2.2020 -0.1181 0.2656 -2.0545 4.0000-2.4132 0.2140 -0.3145 -2.5137 11.0000-2.8818 -0.4350 -0.3267 -3.6435 3.0000-4.4264 -0.6180 -0.2884 -5.3327 12.0000
从结果可以看出,第9家的综合实力最强,第9家的综合实实力最弱,还有各主成分的权重信息(贡献率)及与原始变量的关联关系(特征向量)。
PCA(主成分分析法)使用情景及排序企业综合实力示例相关推荐
- 中国排名前100的IT公司及中国通信企业综合实力50强
中国排名前100的IT公司 排序 单位名称 软件收入(万元) 1 华为技术有限公司 622360 2 中兴通讯股份有限公司 601331 3 海信集团有限公司 448641 4 UT斯达康通讯有限公司 ...
- 中国排名前100的IT公司及中国通信企业综合实力50强【就业参考】
(一)中国排名前100的IT公司 中国排名前100的IT公司 排序 单位名称 软件收入 1 华为技术有限公司 622360 2 中兴通讯股份有限公司 601331 3 海信集团有限公司 44864 ...
- 主成分分析以及应用:企业综合实力排序
这段时间一直在学习数据挖掘的一些算法,今天通过不断查阅资料,学习整理了一下主成分分析这个数据降维算法.并且结合一个实例进行matlab编程实现. 主成分基本原理 在数据挖掘中,经常会遇到一个问题就是一 ...
- PCA主成分分析法详解
第二次作业:PCA主成分分析(2021.03.18) 主成分分析(Principal Component Analysis,PCA)是一种常见的线性降维方法,广泛应用于图像处理.人脸识别.数据压缩.信 ...
- 机器学习:(PCA)主成分分析法及应用(spss)
目录 1.1.主成分分析法简介 1.2.主成分分析法的意义 1.3.主成分分析法的思想 1.4.主成分分析法的步骤 2.1.导入数据 2.2.生成图表 3.1.PCA算法梯度求解 3.1.1. 梯度上 ...
- PCA主成分分析法浅理解
ML课刚学,发现更多是对线性代数的回顾.更进一步说,统计机器学习方法就是以高数.线代和概率论为基石构筑的"一栋大厦".下面主要沿着老师ppt的思路讲讲对PCA方法的个人理解. 这里 ...
- 机器学习(4):PCA主成分分析法实例
一.简介 1.Principal Component Analysis 2.用途:降维中最常用的一种手段,可用于数据压缩.提取重要信息等领域. 3.目标:基于方差提取最有价值的信息 二.PCA求解原理 ...
- 数据分析案例-基于PCA主成分分析法对葡萄酒数据进行分析
- 中国互联网企业综合实力研究报告(2020)
更多报告内容,可加微信:chanpin628 领取.
- 机器学习经典算法之PCA主成分分析
PCA主成分分析法简介 主成分分析算法(PCA)是最常用的线性降维方法,它的目标是通过某种线性投影,将高维的数据映射到低维的空间中,并期望在所投影的维度上数据的信息量最大(方差最大),以此使用较少的数 ...
最新文章
- WMI技术介绍和应用——查询系统信息和补丁包信息
- linux引导程序切换
- AtCoder Grand Contest 013 题解
- 结合eShopOnWeb全面认识领域模型架构
- shell for循环命令行_24 道 shell 脚本面试题
- 电影票房预测问题:如何使用Python生成词云
- arduino 实现时钟和计算器
- 天轰穿视频非知识点总结
- 电容式麦克风和动圈式麦克风的工作原理
- 防火墙基础之华为防火墙分支与分支IPSec 对接
- 站长还应该发布外链吗?
- iOS代码覆盖率(二)-增量覆盖率自动化实践
- 白月黑羽教python_其他 | 白月黑羽教Python
- 指标详解(1)-- 轨道线指标(ENE)详解
- CentOS7系统下将多个磁盘合并到根目录
- python可以用于工业机器人编程语言_你知道工业机器人是用什么语言编程的吗?...
- GIC , SPI , PPI (窝窝科技的文章题目改了下)【转】
- 2022-2027年中国导航电子地图行业市场深度分析及投资战略规划报告
- 3D飞机动画网页js特效代码
- 理解javascript中的回调函数(callback)
热门文章
- iphone html复制粘贴,如何在iPhone上复制内容快速粘贴到iPad上?
- Matlab逆向归纳法,逆向归纳法
- 结构光三维重建阶段性总结
- 电脑没有声音,显示“未插入耳机或扬声器”,检测不到Realtek高清晰音频管理器...
- R语言非度量多维标尺排序NMDS及一般加性模型GAM映射教程
- 扩计算机内存,如何增加计算机内存,三种方法来扩展计算机内存
- 项目ITP(一) 二维码
- Centos8安装谷歌浏览器
- ~0 == -1 问题全解
- Three.js入门教程——教不会算我输