2019独角兽企业重金招聘Python工程师标准>>>

例21-1  为了探讨小学生的生长发育指标与身体素质的相互关系,某市对小学生的体质进行了调查。现仅对84例10岁男孩的四项生长发育指标(x1~x4):肺活量、身高、体重、胸围与四项反映身体素质的指标(y1~y4):50m跑、跳高、跳远、实心球掷远

> can=read.csv('d:/can.csv')
> can=as.matrix(can)
> canx=can[,1:4] #将前4列提取作为生长发育矩阵
> cany=can[,5:8] #将后4列提取作为身体素质矩阵
> zcanx=scale(canx) # 对生长发育矩阵进行预处理(标准化)
> zcany=scale(cany) # 身体素质矩阵进行预处理(标准化)
# 对生长发育矩阵和身体素质矩阵进行预处理(标准化)
> rcan=cor(zcanx,zcany) #求两个矩阵的相关矩阵          [,1]      [,2]      [,3]      [,4]
[1,] -0.2517700 0.6190052 0.5034716 0.6118385
[2,] -0.2002181 0.7669638 0.6395279 0.6539121
[3,] -0.2588718 0.7342691 0.6436623 0.6920838
[4,] -0.3246189 0.7471478 0.7168594 0.6995147
> svd(rcan) #求相关矩阵的奇异值分解
$d
[1] 2.38563882 0.09572188 0.07063975 0.01184736 #考虑只取第一个奇异值2.38563882,因为$u[,1]        [,2]       [,3]       [,4]
[1,] -0.4337134  0.29001402 -0.7789772 -0.3478204
[2,] -0.5063352 -0.78981273  0.1309404 -0.3204296
[3,] -0.5132588 -0.03386998 -0.1067725  0.8508924
[4,] -0.5404468  0.53938905  0.6038615 -0.2287530
$v[,1]        [,2]        [,3]       [,4]
[1,]  0.2175019 -0.84839441  0.02154499  0.4821366
[2,] -0.6025536 -0.50253877 -0.12727051 -0.6067834
[3,] -0.5281468  0.06029828  0.78858601  0.3091232
[4,] -0.5573894  0.15506718 -0.60122387  0.5511815
> canlx=zcanx %*% cansvd$u #求生长发育的潜变量矩阵
> canly=zcany %*% cansvd$v #求身体素质的潜变量矩阵
> cov(canlx,canly) #求生长发育和身体素质两个潜变量的协方差矩阵,验证对角线上元素即为奇异值。  协方差矩阵的两种情况:
(一):设有m个变量xi(i=1,2,...,m),则其协方差矩阵为每个变量xi的方差,以及不同xi之间的协方差组成的矩阵形式,对角线上为各自的方差,其余位置协方差。
(二):设有两组变量xi(i=1,2,...,m)和yj(i=1,2,...,k),两组变量的协方差矩阵为对角线上为xi与yi的协方差(i=j),其余为(i≠j)的xi与yi的协方差
在进行主成分分,因子分析等之前,都要对原始变量进行中心化,原因很简单,因为协方差是离均差积和的平均,用矩阵的形式表示为,中心化的x的转置矩阵乘以中心化的x的矩阵再除以n-1。
R中,相应命令为:第一种情况cov(x),第二种情况cov(x,y)            [,1]         [,2]          [,3]          [,4]
[1,]  2.385639e+00 4.449148e-16  9.621968e-17  2.924995e-17
[2,] -2.065497e-16 9.572188e-02 -7.068998e-17  5.064008e-17
[3,]  1.538078e-16 5.390705e-17  7.063975e-02 -6.007721e-17
[4,]  2.342269e-16 5.908771e-17 -1.204754e-17  1.184736e-02
> cor(canlx,canly) #求生长发育和身体素质两个潜变量的相关矩阵,第一对潜变量的相关系数为0.8634,
第二对潜变量的相关系数为0.172,这与教科书上的调整后的典型相关系数相似(0.878和0.167)。这样可以
最终选择第一对潜变量的相关性来反应生长发育和身体素质的相关性,即相关程度为0.8634。             [,1]         [,2]          [,3]          [,4]
[1,]  8.634332e-01 3.007953e-16  1.103569e-16  2.823501e-17
[2,] -1.991940e-16 1.724381e-01 -2.160334e-16  1.302522e-16
[3,]  1.486870e-16 9.734429e-17  2.163990e-01 -1.548971e-16
[4,]  2.798550e-16 1.318754e-16 -4.561485e-17  3.775345e-02

转载于:https://my.oschina.net/u/1272414/blog/190573

PLSC(Partial Least Square Correlation)偏最小二乘相关相关推荐

  1. 偏最小二乘回归分析PLS

    Partial least squares regression 偏最小二乘回归–潘登同学的Machine Learning笔记 文章目录 Partial least squares regressi ...

  2. ESL第三章 回归的线性方法 系数近似置信集/高斯-马尔可夫定理/正交化、最优子集/向前向后逐步选择/向前分段回归、参数有效数量/最小角回归、主成分/偏最小二乘、多输出收缩、其他L1和路径相关算法

    (ESL把线性回归讲的非常丰富,真的开阔视野) 目录 3.2 线性回归模型的最小二乘法 3.2.2 高斯-马尔可夫定理 3.2.3 从简单单变量回归到多重回归 3.2.4 多输出 3.3 子集选择 3 ...

  3. 偏最小二乘法 Partial Least square

    最小二乘法:http://baike.so.com/doc/723226.html 偏最小二乘法(Partial Least square) http://blog.sciencenet.cn/blo ...

  4. 交叉分解(Cross decomposition)、典型关联分析(Canonical Correlation Analysis,CCA)、偏最小二乘回归PLS

    交叉分解(Cross decomposition).典型关联分析(Canonical Correlation Analysis,CCA).偏最小二乘回归PLS 目录 交叉分解.典型关联分析(Canon ...

  5. 基于相关性变量筛选偏最小二乘回归的多维相关时间序列建模方法

    摘要: 针对许多领域中的时间序列存在维数过高以及变量间多重相关性严重等问题,提出一种相关性变量筛选偏最小二乘回归(CVS-PLSR)建模算法.该算法通过引入基于相关性的特征选择(CFS)来获取最优特征 ...

  6. R语言实现偏最小二乘回归法 partial least squares (PLS)回归

    偏最小二乘回归是一种回归形式 .  当使用pls时,新的线性组合有助于解释模型中的自变量和因变量. 最近我们被客户要求撰写关于偏最小二乘回归的研究报告,包括一些图形和统计输出. 在本文中,我们将使用p ...

  7. 偏最小二乘回归(partial least squares regression,PLSR)

    参考博客:典型相关分析.偏最小二乘回归 给定数据自变量XXX和因变量YYY, 最小二乘回归:找的是一个线性变换AAA,让∥Y−XA∥F\|Y - XA\|_F∥Y−XA∥F​最小 典型相关分析:找的是 ...

  8. ESL3.5 学习笔记(主成分回归,偏最小二乘回归步骤详解)

    3.5 运用派生输入方向的方法 这是一篇有关<统计学习基础>,原书名The Elements of Statistical Learning的学习笔记,该书学习难度较高,有很棒的学者将其翻 ...

  9. 多元线性回归算法: 线性回归Linear Regression、岭回归Ridge regression、Lasso回归、主成分回归PCR、偏最小二乘PLS

    0. 问题描述 输入数据:X=(x1,x2,....,xm)\mathbf{X} = (x_1, x_2,...., x_m)X=(x1​,x2​,....,xm​), 相应标签 Y=(y1,y2,. ...

  10. 偏最小二乘,主成分分析,主成分回归,奇异值之间的关系

    在统计中,主成分回归(PCR)是一种基于主成分分析(PCA)的回归分析技术. 在PCR中,不是直接对解释变量进行因变量回归,而是将解释变量的主要成分用作回归变量. 基于奇异值分解(SVD)的偏最小二乘 ...

最新文章

  1. 阿里云推荐引擎使用教程
  2. css3动画,监控动画执行完毕
  3. native关键字(本地方法)、 java调用so动态链接库
  4. JAVA Fork Join Demo 1
  5. 摩托面试续2-终于得到Offer了
  6. [Flags]标识的Enum不能使用Html.GetEnumSelectList方法
  7. H.264的码率控制算法
  8. linux 重读环境变量,关于linux中使用source /etc/profile重新读取配置后,新的环境变量只能在当前终端里面有效,新开的终端提示 command not found...
  9. Double得有效位
  10. Android项目实战之高仿网易云音乐创建项目和配置
  11. Hadoop2.4.1(QJM HA)+HBASE0.98 双MASTER问题分析
  12. access身份证号掩码_access输入掩码
  13. 开发者API资源(接口整理)
  14. 图解三层交换机:局域网都用它来组网
  15. html页面实现pdf打印预览,利用pdfjs在线预览、打印pdf
  16. 开机直接进入键盘布局_Winodws10系统出现“选择键盘布局”界面如何解决
  17. vscode 创建Express框架 目录 坏境
  18. 树莓派入门:树莓派的初始设置
  19. 三星android q,三星Galaxy S11再被爆料 系统将基于Android Q
  20. 用Chrome浏览器模拟手机,android,iphone,ipad访问网站

热门文章

  1. 排序算法1:最快最简单的排序——桶排序(C++版本)
  2. 【ArcGIS|空间分析|网络分析】3 使用网络数据集查找最佳路径
  3. ENVI图像纹理提取
  4. FFA 2021 专场解读 - 实时数据湖
  5. 基于 Flink 构建 CEP 引擎的挑战和实践
  6. 你是否真的适合搞NDK开发?
  7. 服务器接收不到信号,信号(SIGTERM)不被Windows上的subprocess接收
  8. 11年瑞纳手动挡值多少钱_1个本科学历,值多少钱?
  9. gwr模型用什么做_Science:几万人的马拉松,起跑为什么不乱?用流体力学模型来解释!...
  10. java数字后面加f_java 数字后面 f 和 l