目录

一、问题的提出

二、降维的作用

五、PCA的计算步骤

六、例题1讲解

七、例题2的讲解

八、Matlab代码

九、主成分分析的滥用:主成分得分

十、主成分回归


        本讲将介绍主成分分析(Principal Component Analysis,PCA), 主成分分析是一种降维算法,它能将多个指标转换为少数几个主成分,这些主成分是原始变量的线性组合,且彼此之间互不相关,其能反映出原始数据的大部分信息。
        一般来说, 当研究的问题涉及到多变量且变量之间存在很强的相关性时, 我们可考虑使用主成分分析的方法来对数据进行简化。

一、问题的提出

        主成分分析是把原来多个变量划为少数几个综合指标的一种统计分析方法。 从数学角度来看,这是一种降维处理技术。

二、降维的作用

        降维是将高维度的数据(指标太多)保留下最重要的一些 特征,去除噪声和不重要的特征,从而实现提升数据处理速度 的目的。
        在实际的生产和应用中,降维在一定的信息损失范围内, 可以为我们节省大量的时间和成本。降维也成为应用非常广泛的数据预处理方法。
        降维具有如下一些优点:
  1. 使得数据集更易使用;
  2. 降低算法的计算开销;
  3. 去除噪声;
  4. 使得结果容易理解。

三、主成分分析的思想

五、PCA的计算步骤

六、例题1讲解

主成分分析的说明 :

        主成分的解释其含义一般多少带有点模糊性,不像原始变量的含义
那么清楚、确切,这是变量降维过程中不得不付出的代价。

七、例题2的讲解

八、Matlab代码

clear;clcload data1.mat   % 主成分聚类
%  load data2.mat   % 主成分回归% 注意,这里可以对数据先进行描述性统计
% 描述性统计的内容见第5讲.相关系数
[n,p] = size(x);  % n是样本个数,p是指标个数%% 第一步:对数据x标准化为X
X=zscore(x);   % matlab内置的标准化函数(x-mean(x))/std(x)%% 第二步:计算样本协方差矩阵
R = cov(X);%% 注意:以上两步可合并为下面一步:直接计算样本相关系数矩阵
R = corrcoef(x);
disp('样本相关系数矩阵为:')
disp(R)%% 第三步:计算R的特征值和特征向量
% 注意:R是半正定矩阵,所以其特征值不为负数
% R同时是对称矩阵,Matlab计算对称矩阵时,会将特征值按照从小到大排列哦
% eig函数的详解见第一讲层次分析法的视频
[V,D] = eig(R);  % V 特征向量矩阵  D 特征值构成的对角矩阵%% 第四步:计算主成分贡献率和累计贡献率
lambda = diag(D);  % diag函数用于得到一个矩阵的主对角线元素值(返回的是列向量)
lambda = lambda(end:-1:1);  % 因为lambda向量是从小大到排序的,我们将其调个头
contribution_rate = lambda / sum(lambda);  % 计算贡献率
cum_contribution_rate = cumsum(lambda)/ sum(lambda);   % 计算累计贡献率  cumsum是求累加值的函数
disp('特征值为:')
disp(lambda')  % 转置为行向量,方便展示
disp('贡献率为:')
disp(contribution_rate')
disp('累计贡献率为:')
disp(cum_contribution_rate')
disp('与特征值对应的特征向量矩阵为:')
% 注意:这里的特征向量要和特征值一一对应,之前特征值相当于颠倒过来了,因此特征向量的各列需要颠倒过来
%  rot90函数可以使一个矩阵逆时针旋转90度,然后再转置,就可以实现将矩阵的列颠倒的效果
V=rot90(V)';
disp(V)%% 计算我们所需要的主成分的值
m =input('请输入需要保存的主成分的个数:  ');
F = zeros(n,m);  %初始化保存主成分的矩阵(每一列是一个主成分)
for i = 1:mai = V(:,i)';   % 将第i个特征向量取出,并转置为行向量Ai = repmat(ai,n,1);   % 将这个行向量重复n次,构成一个n*p的矩阵F(:, i) = sum(Ai .* X, 2);  % 注意,对标准化的数据求了权重后要计算每一行的和
end%% (1)主成分聚类 : 将主成分指标所在的F矩阵复制到Excel表格,然后再用Spss进行聚类
% 在Excel第一行输入指标名称(F1,F2, ..., Fm)
% 双击Matlab工作区的F,进入变量编辑中,然后复制里面的数据到Excel表格
% 导出数据之后,我们后续的分析就可以在Spss中进行。%%(2)主成分回归:将x使用主成分得到主成分指标,并将y标准化,接着导出到Excel,然后再使用Stata回归
% Y = zscore(y);  % 一定要将y进行标准化哦~
% 在Excel第一行输入指标名称(Y,F1, F2, ..., Fm)
% 分别双击Matlab工作区的Y和F,进入变量编辑中,然后复制里面的数据到Excel表格
% 导出数据之后,我们后续的分析就可以在Stata中进行。

九、主成分分析的滥用:主成分得分

十、主成分回归


另:来自清风数学建模课程,仅作为个人笔记

【数学建模】主成因分析相关推荐

  1. 机器学习实战-65:主成因分析降维算法(Principal Component Analysis)

    机器学习实战-65:主成因分析降维算法(PCA) 深度学习原理与实践(开源图书)-总目录,建议收藏,告别碎片阅读! 机器学习分为监督学习.无监督学习和半监督学习(强化学习).无监督学习最常应用的场景是 ...

  2. 通用优化软件GAMS的数学建模和优化分析

    优化分析是很多领域中都要面临的一个重要问题,求解优化问题的一般做法是:建立模型.编写算法.求解计算.常见的问题类型有线性规划.非线性规划.混合整数规划.混合整数非线性规划.二次规划等,优化算法包括人工 ...

  3. 基于通用优化软件GAMS的数学建模和优化分析实践

    优化分析是很多领域中都要面临的一个重要问题,求解优化问题的一般做法是:建立模型.编写算法.求解计算.常见的问题类型有线性规划.非线性规划.混合整数规划.混合整数非线性规划.二次规划等,优化算法包括人工 ...

  4. 病毒传播数学建模matlab分析,数学建模MATLAB之分析法(一)

    [toc] 本篇分别有主成分分析,层次分析,聚类分析,因子分析的简单介绍以及在MATLAB(2018a)上使用的简单介绍 ( 附源码 ) 主成分分析 主成分分析-百度百科 简单讲:主成分分析就是取出几 ...

  5. 2023年美国大学生数学建模时间、分析及算法代码

    美国大学生数学建模--干货 2023年美赛比赛日期和时间 赛题类型 算法代码 美赛常见数模问题 分类问题 判别分析: 聚类分析: 神经网络分类: 优化问题 线性规划: 非线性规划: 整数规划: 动态规 ...

  6. dna序列分类数学建模matlab,数学建模常用的分析法及其MATLAB实现

    [toc] 介绍 本篇分别有主成分分析,层次分析,聚类分析,因子分析的简单介绍以及在MATLAB(2018a)上使用的简单介绍 ( 附源码 ) 主成分分析 主成分分析-百度百科 简单讲:主成分分析就是 ...

  7. 【数学建模】层次分析法AHP(评价与决策)

    文章目录 一.算法介绍 二.适用问题 三.算法总结 1. 步骤 2. 如何构建层次结构模型 3. 如何构建成对比较矩阵 4. 如何进行一致性检验 四.应用场景举例(旅游问题) 1. 建模 2. 构造成 ...

  8. 数学建模之层次分析法AHP

    层次分析法(Analytic Hierarchy Process,AHP)这是一种定性和定量相结合的.系统的.层次化的分析方法.这种方法的特点就是在对复杂决策问题的本质.影响因素及其内在关系等进行深入 ...

  9. 数学建模之灵敏度分析

    在数学建模的评价类问题中,灵敏度分析是一个重量级的评价方法,尤其是针对规划问题,是一定要在建模后对模型进行灵敏度分析的,用来检验模型的稳定性. 通过阅读历年美赛的O奖论文可以发现,大部分文章最后都会进 ...

最新文章

  1. 对于非技术人员来说,闪电网络和BCH分别意味着什么?
  2. python做马尔科夫模型预测法_隐马尔可夫模型的前向算法和后向算法理解与实现(Python)...
  3. python语言怎么学-怎么学Python语言呢?粤嵌Python学习路线入门
  4. 机器学习系列之神经网络入门基础知识
  5. 视网膜脱落相关知识(持续更新中)
  6. 电脑软件:推荐八款提高工作效率的软件,值得收藏!
  7. php微信小程序获取用户信息,微信小程序获取openid及用户信息的方法
  8. Ext JS 4.1 RC1发布
  9. Nginx 原理和架构 | 原力计划
  10. 学写压缩壳心得系列之一 熟悉概念,未雨绸缪
  11. zepto获取html内容,基于Zepto的内容滑动插件:zepto.hwSlider.js
  12. 盖洛普优势理论自我分析
  13. 苹果App Store 四年历程回顾
  14. 307条互联网交流缩略语(English Abbreviations on Internet)
  15. 关于Palantir——第二部分:本体(Ontology)
  16. 使用UVCCamera拍照后zbar与zxing识别图片中的二维码
  17. win10:谷歌浏览器如何导出扩展程序
  18. 数学在计算机科学中的作用,计算机科学中数学的重要性及其运用
  19. 世界哲学语录100句(句句珠玑,细细品味)
  20. Java中switch的四种用法

热门文章

  1. matlab面元法计算naca翼型的升力系数(关于攻角的曲线)
  2. 将数字字符转换成整型数字
  3. 限制input输入字符数(中文2个字符,英文1个字符)
  4. ipad的文件连接云服务器,ipad原来可以这样用(八):文件共享——也说说云端技术...
  5. 安卓笔记-视频版(还没学完)
  6. 任务调度系统就该这么设计(万能通用),稳的一批!
  7. RichFaces第一例
  8. Hermez官方文档翻译(四)开发者-SDK (有自己测试验证demo)
  9. 2012上半年 系统集成项目管理工程师 下午试卷
  10. android 开发之蓝牙开发