(清风数学建模笔记)(可用python或者matlab实现)

主成分分析是一种降维算法,它能将多个指标转换为少数几个主成分,这些主成分是原始变量的线性组合,且彼此之间互不相关,且能反映出原始数据的大部分信息。

一般来说,当研究的问题涉及到多变量且变量之间存在很强的相关性时,我们可以考虑使用主成分分析的方法对数据进行简化。(用较少的新变量替换原来较多的旧变量,并且使这些较少的新变量尽可能多的保留原来变量所反映的信息)

1.数据降维的作用

降维是将高维度的数据(指标太多)保留下来最重要的一些特征,去除噪声和不重要的特征,从而实现提升数据处理速度的目的

在实际的生产应用中,降维在一定的信息损失范围内,可以为我们节省大量的时间成本。

降维也成为了应用非常广泛的数据预处理方法。

2.主成分分析(PCA)的思想

(详细的证明过程需要参考教材《应用多元统计分析》——王学民)

证明过程需要一定的多元统计基础和较强的线性代数基础

3.主成分分析(PCA)计算步骤

(可以将其写在论文中)

对数据进行标准化—>计算标准化样本的协方差矩阵—>计算R的特征值和特征向量—>计算主成分贡献率以及累计贡献率——>写出主成分——>根据系数分析主成分代表的意义

4.主成分分析的应用一

 通过计算特征值、特征向量以及贡献率:

写出主成分并简要分析:

5.主成分分析的应用二

6.主成分分析的应用三

7.主成分分析的说明

在主成分分析中,我们首先应该保证所提取的前几个主成分的累计贡献率达到一个比较高的水平;

其次应对这些被提取的主成分必须能够给出符合实际背景和意义的解释。

主成分的解释其含义一般带有模糊性,不像原始变量的含义那么确切、清楚,这是变量降维过程中不得不付出的代价。

主成分分析的困难之处主要在于要能够给出主成分较好的解释,所以提取的主成分中如果有一个主成分解释不了,整个主成分分析也就失败了。(主成分分析是变量降维的一个重要、常用的方法,简单的说该方法要想应用成功,一是靠原始变量的合理选取,二是靠“运气”)

数学建模中的补充:

主成分是降维算法,既然已经有数据为什么不把数据的信息全部用上?

主成分只有标准化过程,没有正向化的过程

8.主成分分析的滥用:主成分得分

在作主成分分析时,国内近年来流行一种通过建立综合评价函数来对各样品进行综合排名的方法,这种在综合评价函数中对各种主成分使用的贡献率加权是错误的。

9.主成分分析后用于聚类

10.主成分分析后用于回归

数学建模—降维—主成分分析(PCA)相关推荐

  1. 数学建模-14.主成分分析PCA

    主成分分析(PCA) 一种降维算法,能将多个指标转换为少数几个主成分 这些主成分是原始变量的线性组合,且彼此互不相关.其能反映出原始数据的大部分信息. 一般而言,当研究问题涉及到多变量且变量之间存在很 ...

  2. 数学建模之主成分分析(PCA)

    本文参考的是司守奎,孙兆亮主编的数学建模算法与应用(第二版) 由于在学习数学建模的过程中,复现建模书上的题目代码有点小麻烦,因为我找不着书上的数据,因此得一个个手打,本来已经复现了好几个模型,结果因为 ...

  3. 数学建模—降维—因子分析

    (清风数学建模笔记) 因子分析在某种程度上可以被看成是主成分分析的推广和扩展.可以用主成分分析的问题也可以用因子分析,因子分析的结果更方便分析. 因子分析法通过研究变量间的相关系数矩阵,把这些变量间的 ...

  4. 数学建模之主成分分析法

    评价方法大体可分为两类,其主要区别在确定权重的方法上.一类是主观赋权法,多数采取综合咨询评分确定权重,如综合指数法,模糊综合评价法,层次分析法,功效系数法等.另一类是客观赋权,根据各指标间相关关系或各 ...

  5. 降维 ---- 主成分分析 (PCA)、奇异值分解 (SVD)

    降维 在机器学习或数据处理中,经常会碰到一些高维数据,而高维数据情形下经常出现样本稀疏.计算困难等问题,称之为"维度灾难". 对于一个高维数据数 D={X1,X2,...,XN}D ...

  6. 数学建模 —— 降维算法

    文章目录 前言 数据降维的作用 一.主成分分析(PCA) 1.介绍 2.算法流程 3.主成分分析的说明 二.因子分析(FA) 1.介绍 2.算法流程 3.因子分析和主成分分析的对比 三.典型相关性分析 ...

  7. Matlab中特征降维主成分分析(PCA)使用方法(整套流程)

    1. PCA简介: PCA(Principal Component Analysis)主成分分析方法是一种常见的数据降维方法.数据维度过高可能会使得模型效果不佳.PCA主要原理是将高维原数据通过一个转 ...

  8. 【数学建模】数据处理问题

    一.插值与拟合 常用于数据的补全以及趋势分析 1.插值 总的思想,就是利用函数f (x)若干已知点的函数值,求出适当的特定函数g(x).这样f(x)其他未知点上的值,就可以用g(x)在这一点的值来近似 ...

  9. 清风数学建模学习笔记——主成分分析(PCA)原理详解及案例分析

    主成分分析   本文将介绍主成分分析(PCA),主成分分析是一种降维算法,它能将多个指标转换为少数几个主成分,这些主成分是原始变量的线性组合,且彼此之间互不相关,其能反映出原始数据的大部分信息. 一般 ...

最新文章

  1. 由一个Quiz想到的
  2. 3、4TP之url和路由
  3. 教您怎么给移动硬盘加密
  4. CentOS-6.3安装配置SVN
  5. 最长公共子序列问题LCS
  6. Apache+php+tomcat+mysqlon linxu
  7. gcc编译python可执行_如何运行Nuitka编译的Python可执行文件
  8. oh-my-zsh upgrade problem
  9. leetocde1129. 颜色交替的最短路径(bfs)
  10. python 收发邮件_python发送各类邮件的主要基本方法
  11. winfrom 从网页中通过源代码截取文章
  12. GRE over IPSec 隧道配置案例
  13. 20200117:(leetcode)最长回文子串(暴力法)
  14. 在AD中安装元件和封装库
  15. 计算机网络实训室建设设备,网络综合布线实训室建设方案
  16. Git 三款经典可视化管理工具-对比分享
  17. Android Edittext设置软键盘输入法Enter回车键为完成按钮
  18. 一种绘制有向图的方法<TSE93> - 1. 引言
  19. matlab的颜色映射colormap
  20. h5 实现微信支付以及易宝银行卡支付

热门文章

  1. java线程通信的三种方式
  2. 长沙学院2022暑假训练赛(一)六级阅读
  3. 大型门户网站建设需要那些技术和注意事项 [ZT]
  4. 3D和texture素材国外常用网站
  5. 以《荷塘月色》编写教案
  6. 单身潜逃戴佩妮 and 亲爱的徐若瑄
  7. 系统用了一段时间后 硬盘上好几个磁盘里都显示有 FOUND.000 等文件夹
  8. 濉溪海潮计算机学校校长是谁,“青春,谢谢你,再见!”——濉溪中学隆重举行2020届毕业典礼...
  9. U牌红枣浓缩液,含有丰富的维生素B、B2、C,能促进血液循环,增加体内抗氧化物质,促进对铁的吸收促成生成血红蛋白,提升补气血功效
  10. 适合高温应用的密封材料