r语言kendall协和系数_关于Kendall协和系数的理解
1. 引言
变量之间相关程度的度量,在参数统计中最常用的是Pearson矩相关系数。在非参数统计 [1] 中,Spearman秩相关系数和Kendall-τ相关系数是常用的方法。但是它们只适用于两个变量的情形,在实际中常常需要处理多个变量之间的相关性,或多个评价的一致性,如凭手感评定毛织物的紧密程度,评论员的检验结果是否一致 [2]。对这类问题,可采用Kendall协和系数(Kendall’s coefficient of concordance) [3] 来解决。Kendall协和系数也称为Kendall W系数,由M.G. Kendall和B. Babington Smith于1939年引入,用于检验多个变量之间的相关性。它以多变量秩和检验为基础,主要用于双因素设计或区组设计问题的检验。在非参数统计教学中学生常常对Kendall协和系数的理解存在困难,本文旨在提供一种简洁易懂的方法,帮助学生加强理解。
2. Kendall协和系数的基本原理
由于一致性检验问题常可以转化成区组问题,如裁判的评分是否一致,每个裁判即可看成一个区组,因此检验一致性也可理解成检验区组之间有无差异。为此我们引入区组设计的一些相关概念。设有b个区组,k个处理,第
j
(
j
=
1
,
2
,
⋯
,
b
) 个区组内的k个观测值分别为
x
1
j
,
x
2
j
,
⋯
,
x
k
j,其分布函数为
F
j
(
x
−
θ
i
)。要检验处理之间有无差异,原假设和备择假设分别为
H
0
:
θ
1
=
θ
2
=
⋯
=
θ
k,
H
1
:
θ
1
,
θ
2
,
⋯
,
θ
k 不全相等。
其中
θ
i 为第i个处理的位置参数。当然,若处理间有某种趋势时,如上升趋势,备择假设为
H
1
:
θ
1
≤
θ
2
≤
⋯
≤
θ
k
,
θ
1
<
θ
k。
为了解决这一问题,在非参数统计中,我们先要对同一区组内的观测值由小到大进行排序,再求出观测值的秩在同一处理内的平均。如表1所示。
Table 1. The case of k treatments and b blocks
表1. k个处理b个区组的情况
R
i
j 为第i个处理第j个区组内的观测值
x
i
j 在区组j内的排序,当同一区组内有相同的观测值(即有结)时,此时要对秩取平均。
R
i
+ 为第i个处理的秩和,
R
i 为第i个处理的秩平均。
其次,计算处理间的方差
S
S
B
=
b
∑
i
=
1
k
(
R
i
¯
−
R
¯
),再计算同一处理内的方差
S
S
E
=
∑
i
=
1
k
∑
j
=
1
b
(
R
i
j
−
R
¯
i
)
2 以及总方差
S
S
T
=
∑
i
=
1
k
∑
j
=
1
b
(
R
i
j
−
R
¯
)
2。特别强调的是,此处组间的方差是处理间的方差,组内的方差为同一处理内的方差。
我们将对总方差(SST)进行分解,得到SST = SSB + SSE,当同一区组内没有相同的观测值时,总方差
S
S
T
=
b
k
(
k
2
−
1
)
12, (1)
为常数。若处理间的方差SSB增大,处理内的方差SSE会减小。当处理内的方差SSE减小到一定程度时,即可认为评论员对同一处理的打分具有一致性,显然,此时处理间的方差足够大。可借用Friedman所提出的Friedman检验统计量 [2],即
Q
=
12
k
(
k
+
1
)
S
S
B (2)
来判断原假设是否成立。当Q比较大时,拒绝原假设,认为
θ
1
,
θ
2
,
⋯
,
θ
k 不全相等。由以上的分析我们知道,拒绝原假设时,处理间的方差足够大,意味着处理内的方差足够小,即评论员的打分一致,所以在一致性检验中,原假设和备择假设转变为
H
0 :评价不一致;
H
1 :评价具有一致性。
这是在教学中学生最容易混淆的。类似于相关系数的值规范在[−1, 1]之间,我们也对Q进行规范,将(1)和(2)带入下列式子中,得到
W
=
S
S
B
S
S
T
=
Q
b
(
k
−
1
),(3)
即为M.G. Kendall和B. Babington Smith提出的Kendall协和系数。W的取值范围为[0, 1],越接近1说明相关性越大,评价越一致,在实际中我们可以借助软件计算p值,也可以直接采用SPSS进行判断。
3. 案例分析
案例:请6位电影评家对4部电影打分,评分结果见表2:试问三个评家的评价结果是否具有一致性?
α
=
0.05。
Table 2. The scores by the 6 film critics
表2. 6个影评家的评分结果
此时,区组为影评家,处理为电影,参数k = 4, b = 6。检验步骤为:
1) 原假设H0:看法不一致;备择假设H1:看法一致,
2) 用kenddal-W检验计算Q = 12*SSB/4 * 5 = 8.4,或W = 8.4/6 * 3 = 0.467,
3) 查Friedman检验统计量表,k = 4, b = 6得到
α
=
0.05 时的临界值为7.6,或计算
p
=
P
(
W
≥
0.467
)
=
0.038,
4) 拒绝原假设,认为看法一致。
采用SPSS进行操作,步骤如下:
1) 输入变量为电影1,电影2,电影3,电影4,
2) 接下来在个案中录入各影评家的评分,共6行,
3) 统计–非参数检验–k个相关样本–检验变量–检验类型:kendall W检验,
结果见表3,与手算结果一致。
Table 3. Test statistics
表3. 检验统计量
a. Kendall协同系数。
4. 总结
本文针对学生在课堂上对Kendall协和系数理解较为困难,从方差分析的角度解释Kendall协和系数,帮助学生理解Kendall协和系数的来源,由此知道为何看法一致放在备择假设中。并从实例出发,帮助学生解答有关一致性检验的问题。
基金项目
本项目由国家自然科学基金(基金号:11961035,11661076)支持。
r语言kendall协和系数_关于Kendall协和系数的理解相关推荐
- r语言 协整_《量化金融R语言初级教程》一1.3 协整
本节书摘来异步社区<量化金融R语言初级教程>一书中的第1章,第1.3节,作者: [匈牙利]Gergely Daróczi(盖尔盖伊) , 等 译者: 高蓉 , 李茂 责编: 胡俊英,更多章 ...
- R语言对数线性模型loglm函数_使用R语言进行混合线性模型(mixed linear model) 分析代码及详解...
1.混合线性模型简介 混合线性模型,又名多层线性模型(Hierarchical linear model).它比较适合处理嵌套设计(nested)的实验和调查研究数据.此外,它还特别适合处理带有被试内 ...
- R语言对数线性模型loglm函数_用R语言进行数据分析:常规和广义线性模型
用R语言进行数据分析:常规和广义线性模型 线性模型 对于常规的多重模型(multiple model)拟合,最基本的函数是lm(). 下面是调用它的方式的一种改进版: >fitted.model ...
- r语言重复向量变矩阵_游戏如何使重复变得有趣
r语言重复向量变矩阵 Have you ever stopped to consider that in most video games, you're doing variations of th ...
- r语言中矩阵QR分解_从零开始学R语言Day4|向量、矩阵和数组
从零开始学R语言Day4|向量.矩阵和数组 1.1向量 1.1.1向量 在Day2中我们提及过用和c()函数来构建向量,具体实例如下. 我们还可以采用vector("类型",长度) ...
- r语言t检验输出检验统计量_数据统计的理解和运用(四)列联表之卡方检验
前面几期我们介绍了参数检验,t检验和方差分析: 临度科研:数据统计的理解和运用(三)方差分析zhuanlan.zhihu.com 临度科研:数据统计的理解和运用(二)t检验的应用zhuanlan. ...
- r语言 rgl 强制过程中_一个R语言中操纵矢量空间数据的标准化工具—sf
注: 本文是R语言sf包的核心开发者和维护者--来自德国明斯特大学的地理信息学教授:Edzer Pebesma 的一篇关于sf包的简介,发表于2018年7月的R语言期刊,主要讲述了sf的定位.功能. ...
- R语言多层桑基图_桑基图的绘制核心微生物组分类学及丰度展示
为什么要用桑基图 桑基图 (Sankey diagram)是一种展现数据之间流动和相互关系的图像,类似于一种网络图,通过不同层级节点之间的连接以及连接边的宽度,展示数据之间的流动关系. 在微生物群落分 ...
- r语言查找是否存在空值_关于R包安装你知道多少?
在R语言的学习过程中离不了各种R包的安装与使用,要使用某个R包首先得学会如何安装该R包.对于R包的安装你知道的有多少?你知道如何指定安装路径吗?为何你每次重新打开R绘画都需要重新安装R包?今天小编带你 ...
最新文章
- java 行为模式_java – 模式匹配行为
- 架构设计中服务层的简单理解
- python语言核心技术_python核心技术
- javafx 剪切板_JavaFX技巧18:路径剪切
- 带有Spring的JavaFX 2
- 如何使用用window.open()
- flutter的按钮如何变为不可选中_Flutter 61: 图解基本 Button 按钮小结 (一)
- python with关键字_python中用with关键字来实现上下文管理器.
- GO语言打包ICO图标
- go和python组合开发_Go+Python双语言混合开发
- RequestBody Ajax写法
- 台风怎么看内存颗粒_使用300多元的D4 16G内存是种什么体验
- liunux 查看系统参数、网络参数的命令
- 用php表单写出梯形的面积,梯形面积
- Scrapy框架爬取新闻!
- 请设计输出实数的格式,包括:(1)一行输出一个实数;(2)一行输出两个实数;(3)一行输出三个实数。实数用%6.2f格式输出。
- CSDN代码黑色背景设置
- 山重水复疑无路,柳暗花明又一村 。
- 【数据分析与可视化】Pandas-Dataframe-IO操作
- 【Idea】Process finished with exit code 0 是什么意思?
热门文章
- 2023-01-18 ClickHouse之聚合功能源码分析
- Ae:文本图层 - 动画制作工具属性
- 软件设计师——操作系统基本原理 [ 笔记 ]
- 区分与检测null,undefined 与 undeclared
- SAP 财务 KP26 计划作业价格维护
- R语言导入数据文件(数据导入、加载、读取)、haven包的read_spss函数导入SPSS中的sav格式文件
- Jetson Nano 卡在开机的nvidia界面,无法开机
- 江西计算机奥赛试题初赛小学组,STEAM教育丨江西省第十八届中小学电脑制作技能提升活动创客竞赛圆满落幕!...
- ios蓝牙开发 ------ CoreBluetooth 教程lt;转gt;
- 【重学数据结构】栈与队列