R语言实战多元统计分析Day10——

典型相关分析

01

前言

典型相关分析是用于分析两组随机变量之间的相关性程度的一种统计方法,它能够有效的揭示两组随机变量之间的相互线性依赖关系,这种方法是由Hotelling(霍特林,1935)首先提出来的。

基本原理:为了从总体上把握两组指标之间的相关关系,分别在两组变量中提取有代表性的两个综合变量U1和V1(分别为两个变量组中各变量的线性组合),利用这两个综合变量之间的相关关系来反映两组指标之间的整体相关性。

02

函数介绍

cancor()函数

使用格式:

cancor(x,y,xcenter=TRUE,ycenter=TRUE)

参数解释:

x,y:两个随机变量样本构成的矩阵

xcenter,ycenter:数据中心化

03案例分析

数据

x1:销售增长  x2:销售利润  x3:新客户销售额

y1:创造力  y2:机械推理  y3:抽象推理  y4:数学能力

销售人员数据

[数据来源:R语言使用教程]

以上是部分数据,共有样本50条。

在R中实战:

#导入数据

data_sale

#查看前5行,检验导入的数据是否正确

head(data_sale)

#将数据进行标准化处理以消除量纲影响

data_sale

#调用cancor()函数进行计算

ca

corf分别为3个典型相关系数,xcoef,ycoef分别为对应与X与Y的系数,也称为关于数据X,Y的典型载荷。$xcenter,$ycenter分别为数据X,Y的中心,也是数据X,Y的样本均值。由于两数据已做了标准化处理,所以计算出的样本均值为0.

对于销售人员数据,与计算结果相对应的数学意义:

对应的相关系数为:

可以进行典型相关系数的显著性检验。

#下面计算样本数据在典型变量下的得分:

>#计算样本数据在典型变量下的得分

>U

[,1]               [,2]                [,3]

[1,] -0.154877382 -1.780856e-02 -0.042759566

[2,] -0.208652267  2.557594e-02  0.029918910

[3,] -0.100700687 -5.626020e-02 -0.023672681

[4,]  0.015101920  2.915695e-01 -0.067885806

[5,]  0.016321766 -1.388300e-02 -0.093686336

[6,] -0.123078225  3.101614e-02 -0.099039788

[7,] -0.107622711 -3.556522e-02 -0.057416644

[8,]  0.278883640  3.168357e-01  0.034280596

[9,]  0.029692110  1.852597e-02 -0.101773397

...          ...                    ...                   ...

> V

[,1]         [,2]         [,3]         [,4]

[1,] -0.135482644 -0.029308700  0.023646728 -0.006924380

[2,] -0.215334112  0.065935573 -0.074900513  0.008690701

[3,] -0.080512926 -0.112188492  0.003565494  0.074321902

[4,]  0.005120678  0.164175789 -0.023317834 -0.019486770

[5,]  0.023086324  0.004164059 -0.114910710 -0.029255048

[6,] -0.099696252  0.060585702 -0.069351206 -0.117058099

[7,] -0.083879631 -0.069261333  0.030966782  0.061240134

[8,]  0.318307871  0.163799056 -0.059941001 -0.050324613

[9,]  0.029887202  0.012398482 -0.187427353 -0.154060411

[10,]  0.145352329 -0.068418254  0.034906140 -0.065515633

[11,]  0.052725190  0.011576820 -0.075958133 -0.126179940

...         ...                ...                   ...                ...

> #调整图形

>opar

>#画出以相关变量U1、V1和U2、V2为坐标的数据散点图

>plot(U[,1],V[,1],xlab = "U1",ylab = "V1")

>plot(U[,2],V[,2],xlab = "U2",ylab = "V2")

>#调整图形

>par(opar)

从以上两个图中可以看出第一典型相关变量数据分布哎一条直线附近;第二典型相关变量数据相对有些分散。

#典型相关系数的显著性检验

#典型相关系数的显著性检验

corcoef.test

#r为相关系数n为样本个数且n>p+q

m

for (k in m:1){

#检验统计量

lambda

#检验统计量取对数

Q[k]

}

s

for (k in 1:m){

#统计量

Q[k]

chi

if (chi>alpha){

i

}

s

}

#线束输出结果,选用第几对典型变量

i

}

>#输入相关系数r,样本个数n,两个随机向量的维数p和q,置信水平alpha为0.1

>corcoef.test(r=ca$cor,n=50,p=3,q=4)

[1] 2

最终输出序号2

今天就到这里结束啦,马上我们就要迎来可以与国庆媲美的五一小长假了~祝大家玩的开心,出行注意安全哦~

spss典型相关分析_R语言实战 多元统计分析Day10— —典型相关分析相关推荐

  1. python实现典型相关分析_R语言典型相关分析

    1 关键点:典型相关分析 典型相关分析是用于分析两组随机变量之间的相关程度的一种统计方法,它能够有效地揭示两组随机变量之间的相互(线性依赖)关系 例如 研究生入学考试成绩与本科阶段一些主要课程成绩的相 ...

  2. r语言electricity数据集_R语言实战学习

    <R语言实战>中文电子版 提取码:lx35 已经学习打卡R语言22天了,可以说是初窥真容--基本了解R的数据和函数:作为程序语言,就是要多练习,多领悟,在实战中发现问题并解决问题. 所以, ...

  3. r语言 新增一列数字类型_R语言实战之R语言基础语法精讲(一)

    R是用于统计分析.绘图的语言和操作环境.R是属于GNU系统的一个自由.免费.源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具.在学习R数据科学之前,我们首先要对R语言的基础语法有一个良好的了 ...

  4. r语言 悲观剪枝_R语言实战(5) ——高级数据管理

    往期回顾: R语言实战(1)--R语言介绍 R语言实战(2)--创建数据集 R语言实战(3)--图形初阶 R语言实战(4) --数据管理 本期是我们推出<R语言实战>赠书活动的最后一天啦! ...

  5. readxmls r语言_R语言实战(一)介绍、数据集与图形初阶

    本文对应<R语言实战>前3章,因为里面大部分内容已经比较熟悉,所以在这里只是起一个索引的作用. 第1章       R语言介绍 获取帮助函数 help(), ? 查看函数帮助 exampl ...

  6. r语言 新增一列数字类型_R语言实战(2)——创建数据集【学习分享】

    往期回顾: R语言实战(1)--R语言介绍[学习分享] 引言:上一章我们通过简单的例子了解了R语言及R语言能实现的一些功能,本期我们将一起学习R中的数据结构,以及向R中导入数据的方法. 2.1 数据结 ...

  7. R plot图片背景设置为透明_R语言实战 牛国庆

    [toc] 第一章 1.3.2 R中帮助函数 R中用于管理R工作空间的函数 函数setwd()不会自动创建一个不存在的目录.如果必要的话,可以使用函数dir.create()来创建新目录,然后使用se ...

  8. r语言 图形一览_R语言实战—图形篇(图形初阶)

    最近沉迷学习R语言,不得不说<R语言实战>真的太详细了,详细的阅读完这本书后,我的收获不小.为了方便自己复习,将这本书的内容整理归纳为两个部分:统计篇(数据分析)和图形篇(数据可视化). ...

  9. R语言实战(统计分析1)

    基本内容 描述型统计分析 频数表和列联表 卡方检验 相关系数和协方差 t检验 描述型统计量 首先我们以mtcars数据集为例,先看一下这个数据集前几行的内容 ,主要有英里数(mpg),马力(hp),车 ...

最新文章

  1. SharedPreferences源码解析
  2. igmpproxy_Linux IGMP PROXY 学习笔记 之二 igmp proxy的处理流程分析
  3. 【PM模块】操作功能概览
  4. 网际协议:数据报格式和分片以及IPv4编址
  5. [css] 请你解释下什么是浮动和它的工作原理是什么?同时浮动会引起什么问题?
  6. gatsby_如何在Gatsby.js中使用本地状态保持页面之间的状态
  7. python glob用法_glob模块使用教程
  8. 2016 年开发者应该掌握的十个 Postgres 技巧
  9. mysql 重复了更新_MYSql id相同就更新
  10. @sql 单元测试_10个最常见SQL单元测试错误
  11. oracle 数据加密
  12. 编程c语言中文图形代码,C语言图形编程代码
  13. SCT2650,4.5V-60V电压,芯洲降压DCDC转换器,参数
  14. 怎样允许计算机远程桌面连接,win10允许远程桌面连接如何设置_win10怎样设置允许远程桌面连接...
  15. 打印九行菱形php,c语言打印菱形
  16. mysql 如何去掉毫秒_mysql 如何去掉毫秒值
  17. android 百度地图语音播报,百度地图APP中的语音播报如何打开或关闭
  18. 算法分析中的小o符号
  19. 带求和符号的函数求导
  20. 词频统计以及分析(词云制作)

热门文章

  1. java 获取项目下的webapp_Spring Boot2 系列教程(一)纯 Java 搭建 SSM 项目
  2. 【数据分析】Python-NumPy模块的使用
  3. php页面引用公共文件,WeiPHP插件模板中快速引入公共模板文件
  4. nginx ---- Nginx服务器基础配置实例
  5. 雷达的正交波形设计matlab源码,雷达系统设计MATLAB仿真
  6. epoll哪些触发模式_epoll的内部实现 百万级别句柄监听 lt和et模式非常好的解释...
  7. vscode git使用_vscode中使用git
  8. JasperReport生成PDF中文不显示处理
  9. Zookeeper 3.6.0启动时 8080端口被占用
  10. Android开发笔记(一百六十三)高仿京东的沉浸式状态栏