主成分分析

基本概念:主成分分析是一种降维算法,它能将多个指标转换为少数几个主成分,这些主成分是原始变量的线性组合,且彼此之间互不相关,其能反映出原始数据的大部分信息。一般来说,当研究的问题涉及到多变量且变量之间存在很强的相关性时,我们可考虑使用主成分分析的方法来对数据进行简化。
数据降维及其作用
降维是将高维度的数据(指标太多)保留下最重要的一些特征,去除噪声和不重要的特征,从而实现提升数据处理速度的目的。
在实际的生产和应用中,降维在一定的信息损失范围内,可以为我们节省大量的时间和成本。降维也成为应用非常广泛的数据预处理方法。
降维优点
使得数据集更易使用;
降低算法的计算开销;
去除噪声;
使得结果容易理解



严谨的数学符号

PCA的计算步骤






因子分析

因子分析由斯皮尔曼在1904年首次提出,其在某种程度上可以被看成是主成分分析的推广和扩展。
因子分析法通过研究变量间的相关系数矩阵,把这些变量间错综复杂的关系归结成少数几个综合因子,由于归结出的因子个数少于原始变量的个数,但是它们又包含原始变量的信息,所以,这一分析过程也称为降维。由于因子往往比主成分更易得到解释,故因子分析比主成分分析更容易成功,从而有更广泛的应用。










因子分析:统计
统计
•单变量描述:输出参与分析的每个原始变量的均值、标准差和有效取值个数。
•初始解:输出未经过旋转直接计算得到的初始公因子、初始特征值和初始方差贡献率等信息。
相关性矩阵
•系数:输出初始分析变量间的相关系数矩阵。
•显著性水平:输出每个相关系数对于单侧假设检验的显著性水平。
•决定因子:输出相关系数矩阵的行列式。
•逆:输出相关系数的逆矩阵。
•再生:输出因子分析后的相关矩阵,还给出原始相关与再生相关之间的差值,即残差。
•反映像:输出反映像相关矩阵,包括偏相关系数的负数。
• KMO检验和巴特利特球形检验:进行因子分析前要对数据进行KMO检验和巴特利特球形检验。


确定因子的数目
碎石检验(scree test)是根据碎石图来决定因素数的方法。Kaiser提出,可通过直接观察特征值的变化来决定因素数。当某个特征值较前一特征值的值出现较大的下降,而这个特征值较小,其后面的特征值变化不大,说明添加相应于该特征值的因素只能增加很少的信息,所以前几个特征值就是应抽取的公共因子数。
注意:第一次运行因子分析的结果一般作为参考,下面我们需要根据第一次运行的结果来确定公共因子的个数。

数学建模之主成分分析相关推荐

  1. 数学建模之主成分分析法

    评价方法大体可分为两类,其主要区别在确定权重的方法上.一类是主观赋权法,多数采取综合咨询评分确定权重,如综合指数法,模糊综合评价法,层次分析法,功效系数法等.另一类是客观赋权,根据各指标间相关关系或各 ...

  2. 数学建模之主成分分析(PCA)

    本文参考的是司守奎,孙兆亮主编的数学建模算法与应用(第二版) 由于在学习数学建模的过程中,复现建模书上的题目代码有点小麻烦,因为我找不着书上的数据,因此得一个个手打,本来已经复现了好几个模型,结果因为 ...

  3. 数学建模—降维—主成分分析(PCA)

    (清风数学建模笔记)(可用python或者matlab实现) 主成分分析是一种降维算法,它能将多个指标转换为少数几个主成分,这些主成分是原始变量的线性组合,且彼此之间互不相关,且能反映出原始数据的大部 ...

  4. 数学建模-14.主成分分析PCA

    主成分分析(PCA) 一种降维算法,能将多个指标转换为少数几个主成分 这些主成分是原始变量的线性组合,且彼此互不相关.其能反映出原始数据的大部分信息. 一般而言,当研究问题涉及到多变量且变量之间存在很 ...

  5. 【数学建模】数据处理问题

    一.插值与拟合 常用于数据的补全以及趋势分析 1.插值 总的思想,就是利用函数f (x)若干已知点的函数值,求出适当的特定函数g(x).这样f(x)其他未知点上的值,就可以用g(x)在这一点的值来近似 ...

  6. 数学建模——主成分分析算法详解Python代码

    数学建模--主成分分析算法详解Python代码 import matplotlib.pyplot as plt #加载matplotlib用于数据的可视化 from sklearn.decomposi ...

  7. 主成分分析法_数学建模 || 葡萄酒的评价(1)主成分分析法

    首先要说一下,这篇文章我在其他的平台发过,也是本人亲自写的,如果大家觉得眼熟的话放弃轻松,没有抄袭,主要是因为与我这 "葡萄酒的评价" 题目成系列了,因此在这里再把这个贴出来. 2 ...

  8. 数学建模笔记-第十四讲-主成分分析

    文章目录 主成分分析 数据降维 主成分分析思想 PCA计算过程 主成分分析的应用 例1 主成分的说明 例2 MATLAB 对结果的解释 主成分分析的滥用:主成分得分 主成分分析用于聚类 主成分回归 说 ...

  9. 主成分分析法(数学建模)教授先生

    通过学习数学建模老哥的视频 主成分分析法是  可以建立一条或多条关系式 将变量个数尽可能减少,但仍然能(差不多,存在一些误差)表示出这样的关系式. 比如上述图中,分布在y1直线两侧的点可以近似看成 y ...

  10. 数学建模算法笔记(2)——主成分分析

    数学建模算法笔记(2)–主成分分析 目的:主成分分析的主要目的是希望用较少的变量去解释原来资料中的大部分变异,将我 们手中许多相关性很高的变量转化成彼此相互独立或不相关的变量,实际上是一种降维方法. ...

最新文章

  1. python跟php如何共用mysql_Python 3 多个函数共用一个mysql连接
  2. 十大互联网公司都在寻找她!她是什么样的?
  3. 内核中的HZ 及延迟等
  4. linux定位so快捷方式_Linux动态库(.so)搜索路径 | 学步园
  5. TP3.2设置URL伪静态满足更好的SEO效果
  6. 【CF1200E】Compress Words【kmp】
  7. ubuntu下安装redis及在php中使用
  8. SSL的作用与目前主流的使用场景介绍
  9. golang echo框架案例
  10. 基于asp.net的在线问卷调查系统
  11. 2021年最值得推荐的29个开源软件,想提升自己的程序员赶快收藏
  12. R语言(三) 你是我唯一的光 | 基于《白夜行》的文本可视化分析
  13. 将已购买的知乎Live课堂图片下载并导出的教程
  14. java dma_Kernel DMA
  15. 指定的文件夹没有包含设备的兼容软件驱动程序...请确认它是为用于基于X64的系统的Windows设计的
  16. React二级路由的实现
  17. ROS naviagtion analysis: costmap_2d--Costmap2DROS
  18. 为什么win10提示没有管理权限
  19. C. Madoka and Childish Pranks #777 div2
  20. RAID磁盘阵列(二)

热门文章

  1. 常用视频播放器插件汇总
  2. win10系统下载文件被windows defender smartscreen 阻止怎么办,但是系统没有筛选器
  3. 使用echarts来显示世界地图和全国地图,并且可以下钻层级
  4. 矩阵理论及其应用课后习题作业:第三章 第四章
  5. 极简fseek()函数讲解,一分钟掌握
  6. 家庭网关斐讯 K3 基础环境篇
  7. 线性代数常用知识点总结
  8. 办公软件 -- Office 365免费下载安装
  9. python 自动化运维小工具——子网掩码计算——随机密码生成
  10. ”win7开机提示由于系统注册表文件丢失或损坏因此无法加载”+制作U盘启动盘+笔记本设置U盘启动