开贴举例说明相关系数、复相关系数及半偏相关系数之间的联系。

比如,我们要预测学生在高中的表现(学生成绩),一种方法是测量学习速度和难易程度的能力测验来衡量学生的学习能力。那么,假设一个学生已经做了这样的测验,在这个样本中学习能力(X1)与学习成绩(Y)的相关系数r1=.4,这就表明能力可以解释学习成绩方差的.42=.16,即16%。不过,还有84%的方差尚未得到解释(参考:已解释和未解释的方差)。

与大多数的学生表现一致,能力并不是唯一重要的因素。努力程度或学习动机等也可能很有效预测实际表现。假设我们可以准确的调查学生在同一学期的学习时间(单位:h)。在这个例子中,学习时间(X2)和学习成绩的相关系数r2=.3。尽管这不如学习能力的相关程度高,但学习时间仍然可以解释.32=.09(9%)的学习成绩方差。但是这9%的方差和被学习能力解释的16%的方差是否不同呢?我们是不是能够简单地把两个百分数加起来,然后说能力和学习时间总共解释了9%+16%=25%的学习成绩方差呢?如果学习能力和时间的相关为0,那么我们就可以这样下结论。

如图 1fig1.cdr所示,如果学习成绩的总方差以一个长方形表示,那么学习能力和学习时间可用长方形内两个独立的圆圈表示。圆圈的面积就对应于每个预测变量能解释的方差百分比。在这样的图中,图形重叠表示变量相关,而不重叠表示变量不相关。我们称这样的图为韦恩图(Venn Diagram)。在图 1的韦恩图中,两个圆圈没有重叠,说明他们代表的预测变量是相互独立的(两者的相关系数为0)。两个圆圈加起来就表示两个预测变量加在一起可以解释因变量(效标变量)的方差比例。如果我们用R2表示被解释的总方差,我们就可以看出,在这个例子中,R2=r12+r22=.42+.32=.25。与r2称为决定系数一致,R2称为复决定系数(Coefficient of multiple determination)。

图 1

如果不平方,则R称为复相关系数(Multiple Correlation Coefficient),它是(基于两个及其以上预测变量)对因变量(效标变量、被解释变量)做的预测值和因变量的实际值之间的相关。在本例中,R=.5,比简单把两个相关系数加起来要小,但比他们其中任何一个都大(只要当两个为正且相互独立的r合并,都会有这种情况)。

不过,你很快就会发现,在真实世界里,就连只有两个预测变量的情况,预测变量之间的相关系数r也往往并不等于0,换句话说,预测变量之间也不是完全独立的,而是相互作用的。还是回到上文的例子中,假设高学习能力的学生稍微倾向于花更多的学习时间,因此学习能力与学习时间的相关系数r12=.2。此时,两个预测变量之间的相关在韦恩图中就被表示为两个圆圈之间的重叠部分,如图 2fig2.cdr所示。一个预测变量所解释方差的一部分仍可以被另一个预测变量来解释(请注意,为了强调其中有趣的关系,图 2中的各个面积并没有按相应的比例成图)。

图 2

在图 2中,复决定系数R2是两个圆圈所覆盖的面积。由于两个圆圈有重叠,因此R2比我们上次那样简单地把两个圆圈加起来的要小。如果仍然简单相加,重叠部分就被重复计算了。所以,R2实际上是A、B和C面积之和,因此R2=.21。

那么,问题又来了。学习能力(X1)可以解释学习成绩的方差比例为16%,其中有4%又可以被学习时间(X2)所解释,那么剩余的12%就是学习能力“唯一”可以解释的方差比重,我们对A面积开平方得到(sqrt(.12)=).3464,这就是学习能力(X1)与学习成绩(Y)的半偏相关系数。这个半偏相关系数告诉我们学习时间(X2)保持不变时,学习能力(X1)与学习成绩(Y)之间关系的强度。同样地,B面积开平方得到学习时间与学习成绩的半偏相关系数(sqrt(.05)=)0.2236,或者R2减去学习能力相关系数的平方r12再开方。

互补现象

还是上文这个例子,假设聪明学生都不怎么爱学习,r12就为负数。这群学生中,聪明学生比较懒,而不聪明学生却很努力弥补能力上的不足,r12=-.2(在韦恩图中没办法表示这种负相关)。但是,这种负的重叠会增加R2,使得R2r12+r22要大,用下式直接计算R2

式中:在符号ry(1.2)中,圆点之后的数字表示被排除在外的变量,括号表示这种排除只局限于在括号内的变量。Y不在括号里告诉我们这是半偏相关系数而不是偏相关系数。代入上式,得到此时R2=.307,X1X2的半偏相关(半偏相关系数)为.4695和.3878,高于各自的效度(相关系数).4和.3。这就是互补现象。

抑制现象

参考文献

[1] Cohen BH. Explaining psychological statistics[M]. New York, US:John Wiley & Sons, 2008. 中译本: 高定国等译, 心理统计学(第三版)[M]. 上海:华东师范大学出版社, 2011.

R2: 相关系数、复相关系数及半偏相关系数之间的联系相关推荐

  1. python相关系数_python怎么计算偏相关系数?

    Qarcher:python怎么计算相关系数.偏相关系数?​zhuanlan.zhihu.com import pandas as pd import numpy as np from scipy i ...

  2. 变量之间的相关性:协方差、相关系数

    协方差 方差和标准差衡量的是一个变量(一组数据)的离散程度,也就是变量和均值之间的偏离程度. 协方差衡量的是两个变量之间的相关性,如: 正相关:两个变量具有相同的变化趋势(也称同方向),要么同时变大, ...

  3. correl函数相关系数大小意义_相关系数越大,说明两个变量之间的关系就越强吗...

    展开全部 相关系数越大,说明两个变量之间的关系就越强.当相关系数为1时,两个变量其e68a84e8a2ad3231313335323631343130323136353331333431353431实 ...

  4. 【R语言】典型相关分析,自写函数计算相关系数

    简单相关系数 简单相关系数的代码实现 1.XY都是随机变量,地位对称 2.相关系数只反映两变量之间线性相关的程度,不能说明其非线性相关关系. 3.虽能度量相关关系,但是不能度量变量间的因果关系 公式 ...

  5. 相关系数R-判定系数R方的matlab实现

    相关系数-判定系数 相关系数是最早由统计学家卡尔·皮尔逊设计的统计指标,是研究变量之间线性相关程度的量,一般用字母 r 表示.由于研究对象的不同,相关系数有多种定义方式,较为常用的是皮尔逊相关系数. ...

  6. 相关系数评价标准的相关知识

    作者:niaocu 链接:https://www.zhihu.com/question/51784983/answer/127640857 来源:知乎 著作权归作者所有.商业转载请联系作者获得授权,非 ...

  7. 最小二乘法、相关系数、决定系数的区别与联系

    目录 1.最小二乘法 2.相关系数与决定系数 1)相关系数 2)决定系数 3)相关系数与决定系数的区别 4)相关系数平方r2r^{2}r2与决定系数R2R^{2}R2相等    yyy和 xxx之间是 ...

  8. 筛数方法相关系数_相关系数怎么计算

    展开全部 若Y=a+bX,则有: 令E(X) = μ,D(X) = σ 则E(Y) = bμ + a,D(Y) = bσ E(XY) = E(aX + bX) = aμ + b(σ + μ) Cov( ...

  9. 海瑟矩阵和函数凹凸性之间的关系

    以下阐述以2维的凸函数(convex function)为例 注释:可以推广到多维的凸函数和凹函数(concave function) 我们定义2维的函数为 f(x),x=[x1,x2]T∈R2f(\ ...

最新文章

  1. 圆环,扇形控件基本算法一种实现 - 代码库 - CocoaChina_让移动开发更简单
  2. Spring Cloud【Finchley】-11Feign项目整合Hystrix监控
  3. go语言中的闭包结构
  4. 一场疫情,炸出了退休的COBOL程序员
  5. 最全面 Nginx 入门教程 + 常用配置解析
  6. 利用Quartz2D-contex绘制三角形
  7. docker启动nginx后挂了_Docker容器部署 Nginx服务
  8. Linux基础系列:常用命令(5)_samba服务与nginx服务
  9. “约见”面试官系列之常见面试题之第七十八篇之fetch(建议收藏)
  10. 浏览器内核之WebKit 架构与模块
  11. 董事长亲自“翻墙偷拍”后,身价暴涨3000万
  12. windows10下anaconda安装、tensorflow安装以及pythonchar配置的使用
  13. Okhttp 向服务器发送请求(请求头,表单,post json数据)...
  14. centos7部署两个mysql_基于Canal和Kafka实现MySQL的Binlog近实时同步
  15. python文本交换_有没有办法用python交换文本文件中的两行文本?
  16. 电脑录音软件如何录制YY语音
  17. 体检预约系统软件测试计划书,体检中心-管理软件需求分析.doc
  18. 3D人体姿态估计笔记
  19. PICKIT3 programmer下载地址
  20. 2022高频经典前端面试题(html+css+js上篇,含答案)

热门文章

  1. 口译务实——unit10 II
  2. ie6,ie7兼容性总结
  3. 读《卓有成效的管理者》笔记(二)
  4. 如何调整mysql严谨度_如何管理 MySQL 的 binlog 收藏
  5. java filesearcher_Java Object Searcher | java内存对象搜索辅助工具
  6. c语言全排列库函数,几种全排列的算法(C语言实现)
  7. android 标题栏进度圈使用方法,Android 标题栏显示进度条
  8. dubbo 自定义路由_高性能可扩展分布式RPC框架Dubbo内核原理揭秘
  9. 软件测试面试题小结(一)
  10. 《深入理解Java虚拟机》第1,2章