前言

在看论文时,常看到Kruskal-Wallis检验,却不知道它具体是一个什么样的检验,这篇文章主要介绍Kruskal-Wallis检验的检验方法,和检验目的,不涉及Kruskal-Wallis检验的证明。详情请看博客原文

原理介绍

Kruskal-Wallis检验是基于wilcox秩和检验发展而来的,其目的是检验不同分组之间中位数是否均相同。其原假设为H0:M1=M2=⋅⋅⋅=MkH_0: M_1=M_2=\cdot \cdot \cdot =M_kH0​:M1​=M2​=⋅⋅⋅=Mk​ 。其中, k 为分组数,MiM_iMi​为第 i 组样本总体的中位数。若拒绝原假设,则说明这k组之间的中位数不全相同,即这k组样本不全来自一个总体。Kruskal-Wallis检验是基于秩的非参数性检验对于样本的原分布没有要求。

Kruskal-Wallis构造的统计量为:

H=12N(N−1)∑i=0kRi2ni−3(N+1),v=k−1H = \frac{12}{N(N-1)}\sum_{i=0}^{k} \frac{R_i^2}{n_i} - 3(N+1),\ v=k-1 H=N(N−1)12​i=0∑k​ni​Ri2​​−3(N+1), v=k−1

H服从自由度为 v 的χ2\chi^2χ2分布,下表是变量解释:

ni:第i组中所含有的样本数,N:∑i=0kni,Ri:第i组中所有样本排秩的和,v:自由度\begin{align} n_i : 第i组中所含有的样本数, \ N : \sum_{i=0}^{k} n_i \ , \ R_i: 第i组中所有样本排秩的和, \ v: 自由度 \end{align} ni​:第i组中所含有的样本数, N:i=0∑k​ni​ , Ri​:第i组中所有样本排秩的和, v:自由度​​

这里,简单解释一下什么是排秩的和。Kruskal-Wallis检验是不关注原样本的实际测量值,而是同Wlicox秩和检验一样关注每个样本的实际测量值在所有样本中的排名情况,然后根据排名进行检验。而RiR_iRi​表示的是所有i组的样本的排名进行相加得到的值。注意,在赋排名时遇到同样的观测值,一般是将这几个同样观测值先排名,然后根据他们的排秩求均值,最后算出的均值作为他们新的排秩。

案例分析

下表是一项动物研究,研究者欲探究A,B两种菌对小鼠巨噬细胞吞噬功能的激活作用,将59只小鼠随机分为三组,其中一组为生理盐水对照,最后检测这59只小鼠的吞噬率。

在对实验各结果进行正态性检验以及方差齐性检验后,发现A,B菌组不服从正态分布。因此,可以采用Kruskal-Wallis进行检验。下面是检验步骤:

1. 检验假设

H0:三个总体的分布相同,即三个处理组的吞噬率相同H1:三个总体的分布不相同或不全相同,即三个处理组的吞噬率不相同或不全相同α=0.005\begin{align} & H_0: 三个总体的分布相同,即三个处理组的吞噬率相同 \\\\ & H_1: 三个总体的分布不相同或不全相同,即三个处理组的吞噬率不相同或不全相同 \\\\ & \alpha = 0.005 \end{align} ​H0​:三个总体的分布相同,即三个处理组的吞噬率相同H1​:三个总体的分布不相同或不全相同,即三个处理组的吞噬率不相同或不全相同α=0.005​​

2.编秩

将各组样本混合,由小到大排序并编秩,如遇有相等数值则取平均秩次,如吞噬率为65的有3个,他们的秩次为32、33和34,取平均秩次为(32+33+34)/3=33(32+33+34)/3 = 33(32+33+34)/3=33。

3. 求秩和

分别求将各组秩次相加求得秩和R1,R2和R3R_1,R_2和R_3R1​,R2​和R3​。

4. 计算统计量

H=1259(59+1)(924224+701219+145216)−3(59+1)=32.72H = \frac{12}{59(59+1)}(\frac{924^2}{24}+\frac{701^2}{19}+\frac{145^2}{16})-3(59+1)=32.72 H=59(59+1)12​(249242​+197012​+161452​)−3(59+1)=32.72

5.确定拒绝域与p值

  1. 当k=3,每组例数ni≤5n_i \le 5ni​≤5 ,则可通过查表来获得P值和拒绝域
  2. 当k>3,或每组例数ni≥5n_i \ge 5ni​≥5,则 H 服从以 k-1 为自由度的卡方分布。可通过卡方分布确定P值和拒绝域

若相同秩次较多(如超过25%),则需考虑矫正H统计量,矫正公式如下:

Hc=Hcc=1−∑(tj3−tj)N3−N\begin{align} & H_c = \frac{H}{c} \\\\ & c= 1 - \frac{\sum (t_j^3-t_j)}{N^3-N} \end{align} ​Hc​=cH​c=1−N3−N∑(tj3​−tj​)​​​

其中,tjt_jtj​表示第 j 次相持时相同秩次的个数。本例中

c=1−(33−3)+(44−4)+(77−7)+(33−3)+(53−3)+(23−2)593−59=0.997Hc=32.72/0.997=32.818\begin{align} & c = 1-\frac{(3^3-3)+(4^4-4)+(7^7-7)+(3^3-3)+(5^3-3)+(2^3-2)}{59^3-59} = 0.997 \\\\ & H_c = 32.72/0.997 = 32.818 \end{align} ​c=1−593−59(33−3)+(44−4)+(77−7)+(33−3)+(53−3)+(23−2)​=0.997Hc​=32.72/0.997=32.818​​

计算自由度,v = k - 1 = 3 - 1 = 2 。因此χ0.005,22=10.60<Hc=32.818\chi ^2_{0.005,2} = 10.60 < H_c = 32.818χ0.005,22​=10.60<Hc​=32.818,故拒绝原假设,P < 0.005。可以认为,不同菌种对小鼠巨噬细胞的吞噬率有所不同。


参考链接

[1] 理论介绍

[[2] 医学统计学8年制 颜虹编 第2版: 174-177]

[3] 博客原文

Kruskal-Wallis检验相关推荐

  1. R语言非独立多分组非参数检验、Kruskal–Wallis检验进行非独立多分组非参数检验(Nonparametric multiple comparisons)、当ANOVA不满足条件的情况下

    R语言非独立多分组非参数检验.Kruskal–Wallis检验进行非独立多分组非参数检验(Nonparametric multiple comparisons).当ANOVA不满足条件的情况下.R语言 ...

  2. Environ. Microbiol. | 土壤pH和温度调节农业生态系统中丰富和稀有细菌群落的构建过程...

    点击蓝字 关注我们 编译:陈春宏   校稿:黄昕瑜 论文ID 原名:Soil pH and temperature regulate assembly processes of abundant an ...

  3. 《R语言实战》第7章

    # 第七章 基本统计分析 # 本章内容 # 描述性统计分析 # 频数表和列联表 # 相关系数和协方差 # t检验 # 非参数统计# 7.1 描述性统计分析 # 本节中,我们将关注分析连续型变量的中心趋 ...

  4. 区间比较_表观健康儿童 HLAB27 的参考值区间建立和验证

    作者来自:南京医科大学附属儿童医院 人白细胞抗原 B27(human leukocyte antigen B27,HLA-B27)与强直性脊柱炎(Ankylosing spondylitis,AS)密 ...

  5. 《R Cookbook》中文笔记

    <R Cookbook>中文笔记 目录 @在linux系统中安装R ............................................................ ...

  6. imputation-文献:False signals induced by single-cell imputation(scRNA-seq插补引入的假阳性问题)

    文章题目 False signals induced by single-cell imputation 中文名: 单细胞插补引起的假信号 文章地址: https://f1000research.co ...

  7. R语言实战之基本统计分析

    原文出处:https://www.jianshu.com/p/90ed27810474 第7章 基本统计分析 在数据被组织成合适的形式后,可以使用图形探索数据,接下来是使用数值描述每个变量的分布,然后 ...

  8. 代谢评分打分 甘油三酯

    SCI:预后文章层出不穷,纯生信如何脱颖而出 https://www.jianshu.com/p/f93c7cb4fd2d 预后一直是癌症研究中的一个经典方向,各种预后模型层出不穷,那么如何让我们的预 ...

  9. iMeta | 深圳先进院马迎飞组开发基于神经网络分析肠道菌群的方法

    点击蓝字 关注我们 一种用于理解人类肠道微生物组在二型糖尿病中相关变化的神经网络框架 https://doi.org/10.1002/imt2.20 5.5 iMeta RESEARCH ARTICL ...

  10. ISME | 根内生真菌与来自拟南芥和大麦微生物群落协同有益作用

    题目:The fungal root endophyte Serendipita vermifera displays inter-kingdom synergistic beneficial eff ...

最新文章

  1. Linux中设置ip
  2. ZooKeeper入门(一)
  3. “” '' ``区别 初学者自用
  4. rxjs为什么用的人少_工伤为什么公司不怕打官司
  5. 通过SD卡来安装Linux系统
  6. Linux 文件IO管理 - POSIX
  7. [OpenGL] opengl常见问题汇总
  8. 二十一天学通JavaScript:cookie的安全性
  9. vue 下载本地文件
  10. C++——Minimum——最短路、最小生成树
  11. 八位数字后加逗号_【PTE干货】英文数字的读法
  12. Android 文件管理器 文件缩略图标显示流程
  13. MAC OS X mountain lion强制关机
  14. apt-get安装包失败提示The following packages have unmet dependencies
  15. 【LTspice】【使用.step命令对LTspice电路进行对比分析】
  16. [CTFSHOW]中期测评WP(差512和514)
  17. Largenbsp;Scalenbsp;Dist…
  18. VUE实现PDF在线阅读
  19. 读《小王子三部曲-夜间飞行》有感
  20. IOS开发系列(一) - Xcode

热门文章

  1. js循环nodelist_js循环nodelist
  2. PDF去水印资源索引
  3. 如何让少儿篮球馆盈利?
  4. mysql存储过程中文乱码_mysql存储过程中文乱码
  5. SwiftUI——界面间的“闪转腾挪”(页面跳转的各种方法)
  6. 水箱建模最小二乘法_高位消防水箱,你一定要知道的
  7. VS终于拿Breeze's MH 开刀了,花了两个多小时搞定了最新版
  8. eu指什么_EU是什么意思_EU怎么读_EU翻译_用法_发音_词组_同反义词_European Union 欧盟-新东方在线英语词典...
  9. 36个Excel实用技巧
  10. 肖 sir_就业课__009ui自动化讲解