生物统计分析之主成分分析(PCA)
简介
在医学统计中,尤其是在临床实验中,每个观测对象记录的观测结果包含多个反应变量(Respone Variables)。例如,血记录有收缩压、舒张压、脉压等,这种有多个变量的数据称为多变量数据。主成分分析是多变量分析方法中的一种分析方法,常见的多变量分析方法还包括多变量方差分析(Multivariate analysis of variance,MANOVA)、因子分析(Factor analysis)、典型相关(Canonical correlation analysis)、以及聚类分析(Cluster analysis)等。主成分分析(Principal Component Analysis,PCA)是一种掌握事物主要矛盾的统计分析方法,它可以从多元事物中解析出主要影响因素,揭示事物的本质,简化复杂的问题。计算主成分的目的是将高维数据投影到较低维空间。
主成分分析
主成分分析(Principal Component Analysis,PCA)通过将原始变量转换为原始变量的线性组合(主成分),在保留主要信息的基础上,达到简化和降维的目的。主成分与原始变量之间的关系主要有:
- 主成分是原始变量的线性组合。
- 主成分的数量相对于原始数量更少。
- 主成分保留了原始变量的大部分信息。
- 主成分之间相互独立。
主成分分析的优点
- 不要求数据呈正态分布,主成分就是按数据离散程度最大的方向对基组进行旋转,这个特性扩展了其应用范围。
- 通过对原始变量进行综合与简化,可以客观地确定各个指标的权重,避免主观判断的随意性。
分析流程
- 先进行相关性检验,如KMO检验和Bartlett 的检验,判断数据是否适合进行主成分分析。
- 选取初始变量,统一量纲,将数据进行标准化处理。
- 根据初始变量特性选择使用协方差矩阵还是相关矩阵来求主成分。
- 计算协方差矩阵或相关矩阵的特征值和特征向量。
- 确定主成分个数。
- 提取主成分。
- 对主成分做解释,主成分的意义由各线性组合中权重较大的几个指标来确定。
生物统计分析之主成分分析(PCA)相关推荐
- 主成分分析(PCA)简介
主成分分析(Principal Components Analysis, PCA)是一个简单的机器学习算法,可以通过基础的线性代数知识推导. 假设在Rn空间中我们有m个点{x(1),-,x(m)},我 ...
- 223.主成分分析PCA
主成分分析 PCA 本节作者:刘华,中国科学技术大学 版本1.0.3,更新日期:2020年6月18日 什么是PCA(Principal Component Analysis) 相关背景 在许多领域的研 ...
- 【图像融合】主成分分析PCA
基本原理 主成分分析PCA 是采取一种数学降维的方法,找出几个综合变量来代替原来众多的变量,使这些综合变量能尽可能地代表原来变量的信息量,而且彼此之间互不相关.在新的综合变量基础上,可以进一步统计 ...
- 主成分分析|PCA算法大全
主成分分析|PCA算法大全 文章目录 主成分分析|PCA算法大全 1. PCA原理 1.1 最大方差理论 1.2 最小平方误差理论 1.3 高维数据下的特征值分解 2. CCIPCA增量主元分析算法[ ...
- 清风数学建模学习笔记——主成分分析(PCA)原理详解及案例分析
主成分分析 本文将介绍主成分分析(PCA),主成分分析是一种降维算法,它能将多个指标转换为少数几个主成分,这些主成分是原始变量的线性组合,且彼此之间互不相关,其能反映出原始数据的大部分信息. 一般 ...
- R语言主成分分析PCA和因子分析EFA、主成分(因子)个数、主成分(因子)得分、主成分(因子)旋转(正交旋转、斜交旋转)、主成分(因子)解释
R语言主成分分析PCA和因子分析EFA.主成分(因子)个数.主成分(因子)得分.主成分(因子)旋转(正交旋转.斜交旋转).主成分(因子)解释 目录
- Python数据集可视化:抽取数据集的两个特征进行二维可视化、主成分分析PCA对数据集降维进行三维可视化(更好地理解维度之间的相互作用)
Python数据集可视化:抽取数据集的两个特征进行二维可视化.主成分分析PCA对数据集降维进行三维可视化(更好地理解维度之间的相互作用) 目录 Python数据集可视化:抽取数据集的两个特征进行二维可 ...
- R主成分分析PCA示例
R主成分分析PCA示例 目录 R主成分分析PCA示例 主成分分析(Principal components analysis) 加载数据 计算主成分(Principal
- 深度学习入门教程UFLDL学习实验笔记三:主成分分析PCA与白化whitening
深度学习入门教程UFLDL学习实验笔记三:主成分分析PCA与白化whitening 主成分分析与白化是在做深度学习训练时最常见的两种预处理的方法,主成分分析是一种我们用的很多的降维的一种手段,通 ...
- 降维(一)----说说主成分分析(PCA)的源头
降维系列: 降维(一)----说说主成分分析(PCA)的源头 降维(二)----Laplacian Eigenmaps --------------------- 前一篇文章中介绍了主成分分析.PCA ...
最新文章
- 在vs2005中使用Jmail发送邮件问题
- 使用wsimport生成本地调用代码
- 指定动态分区_重点解析!2021湖南中级职称评审动态趋势
- 20165235实验四 Android程序设计
- 第五篇第二节T语言实例开发,百变字符(版本5.3)
- [Python图像处理] 三.获取图像属性、兴趣ROI区域及通道处理
- 男女之间应该保留多少隐私
- linux用vfork创建进程,[Linux进程]使用vfork创建子进程并且执行命令
- 连载 3:利用 matlab计算卷积
- “C 不再是一种编程语言”
- 第3章 文件操作-函数练习题
- 牛逼!用 MySQL 实现一个分布式锁,这也太强了。。。
- 刷新了dns后无法访问到mysql_高效刷新DNS缓存 解决网页无法访问
- css幻灯片样式,纯CSS3全屏响应式幻灯片特效
- 什么是人工智能(AI)数据平台?
- 计算机获取信息的过程是,“获取信息的过程与方法”的教学案例
- 锐文科技发布基于国产FPGA的智能网卡芯片
- 数据库结构与算法基础
- 你好,女神节有个给你的惊喜请查收
- 利用函数进行ip地址转换