【数模】典型相关分析

声明：文章参考数学建模清风的网课编写。

文章目录

简介
基本步骤
SPSS典型相关分析操作
输出结果分析

简介

典型相关分析由Hotelling提出，其基本思想和主成分分析非常相似。用于解决两组变量间的相关性分析问题。

其主要思想为：面对一组变量时我们可能无从下手，于是我们决定从一组变量中“选代表”。那么原问题的两组变量之间的相关性分析问题可以转化为两组变量代表之间的相关性分析。此处的代表就是原组中数据的“综合”，即组内变量的线性组合（注意：一个代表可能不能完全反映组内情况，所以通常有多个代表）。

基本步骤

首先在每组变量中找出变量的线性组合（确定代表），使得两组的线性组合之间具有最大的相关系数（两组代表相关性很大，这是分析的目的和出发点）；然后选取和最初挑选的这对线性组合不相关的线性组合（其它代表不能和第一个代表所代表的信息冗余了），使其配对，并选取相关系数最大的一对；如此继续下去，直到两组变量之间的相关性被提取完毕为止（选出所有代表）。

被选出的线性组合配对称为典型变量，它们的相关系数称为典型相关系数。典型相关系数度量了这两组变量之间联系的强度。

SPSS典型相关分析操作

SPSS依次点击：分析->相关->典型相关：
选择要分析的两组变量：
点击第二步中的确定开始分析。

输出结果分析

进行典型相关分析前要假设两组数据服从联合正态分布（论文中说明即可，算是一个小点）。
确定典型相关变量数（代表个数）。对两组变量进行相关性检验（参照典型相关性表进行分析）：

根据P值确定显著性α\alphaα，进一步选择要保留的相关变量数。如表：变量1的P值为0.064 < 0.1（α\alphaα此时取0.1。因为取0.05或0.01都会无法拒绝原假设，也就说明相关性不显著，那么就没有数据可以选了！），拒绝原假设，我们可以称典型相关变量1的相关性在90%（1 - α\alphaα）的置信水平上显著。根据此表，变量2、3都不能满足常选用的置信水平（90%、95%和99%）故舍弃。
对保留的典型相关变量进行分析：

表格解释：表格中的第i列表示对应集合的第i个典型相关变量线性组合系数。

分析：根据第二步，我们确定出只选择变量1，查第二步表知：两表变量1的相关系数为0.796。相关性较强，且为正相关。查标准化典型相关系数表1知：集合1的体重和腰围对变量1的贡献很大；查标准化典型相关系数表2知：集合2的起坐次数和跳跃次数对变量1的贡献很大。
最终结果说明：
首先注意：变量1的相关系数为0.796。相关性较强，且为正相关。
以第三步表一中的腰围为例：由于变量1是正相关，且典型相关系数度量了这两组变量之间联系的强度。腰围的减少会对应着表二中系数值为正的变量（引体向上次数，起坐次数）值增加，会对应着表二中系数值为负的变量（跳跃次数）值减少，具体变化量由系数决定。

【数模】典型相关分析相关推荐

【清风数模】相关系数（理论知识+代码实操保姆级笔记)
相关系数前言我们将学习两种给最为常用的相关系数:pearson相关系数和spearman等级相关系数.它们可用来衡量两个变量之间的相关性的大小,根据数据满足的不同条件,我们要选择不同的相关系数进行 ...
R语言典型相关分析：NBA球员身体素质与统计数据关联性
昨天万众瞩目的2017NBA总决赛G1,想必各位JRs们都看了吧?不是骑士不尽力,奈何对面有高达,比赛结果是书包杜和打卡库双星闪耀先下一城.恰好前两天的数模课上的是多元统计,于是便复习了下主成分分析与 ...
Python数模笔记-Sklearn（3）主成分分析
主成分分析(Principal Components Analysis,PCA)是一种数据降维技术,通过正交变换将一组相关性高的变量转换为较少的彼此独立.互不相关的变量,从而减少数据的维数. 1.数据 ...
Fib数模n的循环节
我们知道Fibonacci数列,现在我们来求一个Fib数模n的循环节的长度. 对于一个正整数n,我们求Fib数模n的循环节的长度的方法如下: (1)把n素因子分解,即 (2)分别计算Fib数模每个的循 ...
Python数模笔记-NetworkX（4）最小生成树
1.生成树和最小生成树 1.1 生成树连通的无圈图称为树,就是不包含循环的回路的连通图. 对于无向连通图,生成树(Spanning tree)是原图的极小连通子图,它包含原图中的所有 n 个顶点,并 ...
Python数模笔记-NetworkX（3）条件最短路径
1.带有条件约束的最短路径问题最短路径问题是图论中求两个顶点之间的最短路径问题,通常是求最短加权路径. 条件最短路径,指带有约束条件.限制条件的最短路径.例如,顶点约束,包括必经点或禁止点的限制:边 ...
Python数模笔记-NetworkX（1）图的操作
1.NetworkX 图论与网络工具包 NetworkX 是基于 Python 语言的图论与复杂网络工具包,用于创建.操作和研究复杂网络的结构.动力学和功能. NetworkX 可以以标准和非标准的数 ...
Python数模笔记-Sklearn （1）介绍
1.SKlearn 是什么 Sklearn(全称 SciKit-Learn),是基于 Python 语言的机器学习工具包. Sklearn 主要用Python编写,建立在 Numpy.Scipy.Pa ...
Python数模笔记-StatsModels 统计回归（1）简介
1.关于 StatsModels statsmodels(http://www.statsmodels.org)是一个Python库,用于拟合多种统计模型,执行统计测试以及数据探索和可视化. 欢迎关注 ...