x2检验(chi-square test)或称卡方检验,是一种用途较广的假设检验方法。可以分为成组比较(不配对资料)和个别比较(配对,或同一对象两种处理的比较)两类。

四格表资料的x2检验

例1:某医院分别用化学疗法和化疗结合放射治疗卵巢癌肿患者,结果如表1,问两种疗法有无差别?

组别 有效 无效 合计 有效率(%)
化疗组 19 24 43 44.2
化疗加放疗组 34 10 44 77.3
合计 53 34 87 60.9

表1 两种疗法治疗卵巢癌的疗效比较

表中间的四个数据是整个表中的基本资料,其余数据均由此推算出来;这四格资料表就专称四格表(fourfold table),或称2行2列表(2×2 contingency table)从该资料算出的两种疗法有效率分别为44.2%和77.3%,两者的差别可能是抽样误差所致,亦可能是两种治疗有效率(总体率)确有所不同。这里可通过x2检验来区别其差异有无统计学意义,检验的基本公式为:

x2=∑(A−T)2T

x^2=\sum \frac{(A-T)^2}{T} or

x2=∑(observed−expected)2expected

x^2=\sum \frac{(observed-expected)^2}{expected}

式中A为实际数,以上四格表的四个数据就是实际数。T为理论数,是根据检验假设推断出来的;即假设这两种卵巢癌治疗的有效率本无不同,差别仅是由抽样误差所致。这里可将两种疗法合计有效率作为理论上的有效率,即53/87=60.9%,以此为依据便可推算出四格表中相应的四格的理论数。兹以表1资料为例检验如下。

检验步骤:

1.建立检验假设:
H0:π1=π2
H1:π1≠π2
α=0.05

2.计算理论数(expected),计算公式为:

expected=nR×nCn

expected=n_R \times \frac{n_C}{n}

式中expected是表示第R行C列格子的理论数, nR n_R为理论数同行的合计数, nC n_C为与理论数同列的合计数,n为总例数。

第1行1列: 43×53/87=26.2
第1行2列: 43×34/87=16.8
第2行1列: 44×53/87=26.8
第2行2列: 4×34/87=17.2

以推算结果,可与原四项实际数并列成表2:

组别 有效 无效 合计
化疗组 19(26.2) 24(16.8) 43
化疗加放疗组 34(26.8) 10(17.2) 44
合计 53 34 87

表2 两种疗法治疗卵巢癌的疗效比较

因为上表每行和每列合计数都是固定的,所以只要求得其中一项理论数(例如T1.1=26.2),则其余三项理论数都可用同行或同列合计数相减,直接求出,示范如下:

T1.1=26.2
T1.2=43-26.2=16.8
T2.1=53-26.2=26.8
T2.2=44-26.2=17.2

3.计算x2值 按公式一代入

x2=∑(A−T)2T=(19−26.2)226.2+(24−16.8)216.8+(34−26.8)226.8+(10−17.2)217.2=10.01

x^2=\sum \frac{(A-T)^2}{T}=\frac{(19-26.2)^2}{26.2}+\frac{(24-16.8)^2}{16.8}+\frac{(34-26.8)^2}{26.8}+\frac{(10-17.2)^2}{17.2}=10.01

4.查x2值表求P值

在查表之前应知本题自由度。按x2检验的自由度v=(行数-1)x(列数-1),则该题的自由度v=(2-1)x(2-1)=1,查x2界值表(附表),找到x2(0.01,1)=6.63,而本题x2=10.01>6.63,P<0.01,差异有高度统计学意义,按α=0.05水准,拒绝H0,可以认为采用化疗加放疗治疗卵巢癌的疗效比单用化疗佳。

通过实例计算,读者对卡方的基本公式有如下理解:若各理论数与相应实际数相差越小,x2值越小;如两者相同,则x2值必为零,而x2永远为正值。又因为每一对理论数和实际数都加入x2值中,分组越多,即格子数越多,x2值也会越大,因而每考虑x2值大小的意义时同时要考虑到格子数。因此自由度大时,x2的界值也相应增大。

四格表x2值的校正

x2值表是数理统计根据正态分布中 x2=∑(A−T)2T x^2=\sum \frac{(A-T)^2}{T}的定义计算出来的,用此公式算出的值只能说近似于 x2 x^2分布,在自由度大于1、理论数皆大于5时,这种近似很好;当自由度为1时,尤其当1<T<5,而n>40时,应用以下校正公式:

x2=∑(∣A−T∣−0.5)2T

x^2=\sum \frac{(\lvert A-T\rvert -0.5)^2}{T}

例2:某医师用甲、乙两疗法治疗小儿单纯性消化不良,结果如表3。试比较两种疗法效果有无差异?

疗法 痊愈数 未愈数 合计
26(28.82) 7(4.18) 33
36(33.18) 2(4.82) 38
合计 62 9 71

表3 两种疗法效果比较的卡方较正计算

从表3可见,T1.2和T2.2数值都<5,且总例数大于40,故宜用校正公式检验。步骤如下:

1.检验假设:
H0:π1=π2
H1:π1≠π2
α=0.05

2.计算理论数:(已完成列入四格表括弧中)

3.计算x2值:应用校正公式运算如下:

x2=∑(∣A−T∣−0.5)2T=(∣26−28.82∣−0.5)228.82+(∣7−4.18∣−0.5)24.18+(∣36−33.18∣−0.5)233.18+(∣2−4.82∣−0.5)24.82=2.75

x^2=\sum \frac{(\lvert A-T\rvert -0.5)^2}{T}=\frac{(\lvert 26-28.82\rvert -0.5)^2}{28.82}+\frac{(\lvert 7-4.18\rvert -0.5)^2}{4.18}+\frac{(\lvert 36-33.18\rvert -0.5)^2}{33.18}+\frac{(\lvert 2-4.82\rvert -0.5)^2}{4.82}=2.75

查x2界值表,x2(0.05,1)=3.84,故P>0.05.

按α=0.05水准,接受H0,两种疗效差异无统计学意义。

如果不采用校正公式,而用原基本公式,算得的结果x2=4.068,则结论就不同了。

如果观察资料的T<1或n<40时,四格表资料用上述校正法也不行,可参考预防医学专业用的医学统计学教材中的精确检验法直接计算概率以作判断。

行×列表的卡方检验(x2 test for R×C table)

适用于两个组以上的率或百分比差别的显著性检验。其检验步骤与上述相同,简单计算公式如下:

x2=n(∑A2nRnC−1)

x^2=n(\sum \frac{A^2}{n_Rn_C}-1)

式中n为总例数;A为各观察值; nR n_R和 nC n_C为与各A值相应的行和列合计的总数。

例3:北方冬季日照短而南移,居宅设计如何适应以获得最大日照量,增强居民体质,减少小儿佝偻病,实属重要。胡氏等1986年在北京进行住宅建筑日照卫生标准的研究,对214幢楼房居民的婴幼儿712人体检,检出轻度佝偻病333例,比较了居室朝向与患病的关系。现将该资料归纳如表4作行×列检验。

检查结果 西、西南 东、东南 北、东北、西北 合计
患病 180 14 120 65 379
无病 200 16 84 33 333
合计 380 30 204 98 712
患病率(%) 47.4 46.7 58.8 66.3 53.2

表4 居室朝向与室内婴幼儿佝偻病患病率比较

该表资料由2行4列组成,称2×4表。

(一)检验步骤

1.检验假设
H0:四类朝向居民婴幼儿佝偻病患病率相同。
H1:四类朝向居民婴幼儿佝偻病患率不同。
α=0.05

2.计算x2值

x2=n(∑A2nRnC−1)=712(1802379×380+142379×30+1202379×204+652379×98+2002333×380+162333×30+1802333×204+1802333×98−1)=15.08

x^2=n(\sum \frac{A^2}{n_Rn_C}-1)=712(\frac{180^2}{379 \times 380}+\frac{14^2}{379 \times 30}+\frac{120^2}{379 \times 204}+\frac{65^2}{379 \times 98}+\frac{200^2}{333 \times 380}+\frac{16^2}{333 \times 30}+\frac{180^2}{333 \times 204}+\frac{180^2}{333 \times 98}-1)=15.08

3.确定P值和分析

本题v=(2-1)(4-3)=3,据此查附表:

x2(0.01,3)=11.34,本题x2=15.08>x2(0.01,3),P<0.01,按α=0.05水准,拒绝H0,可以认为居室朝向不同的居民,婴幼儿佝偻病患病率有差异。

(二)行×列表x2检验注意事项

1.一般认为行×列表中不宜有1/5以上格子的理论数小于5,或有小于1的理论数。当理论数太小可采取下列方法处理:①增加样本含量以增大理论数;②删去上述理论数太小的行和列;③将太小理论数所在行或列与性质相近的邻行邻列中的实际数合并,使重新计算的理论数增大。由于后两法可能会损失信息,损害样本的随机性,不同的合并方式有可能影响推断结论,故不宜作常规方法。另外,不能把不同性质的实际数合并,如研究血型时,不能把不同的血型资料合并。

2.如检验结果拒绝检验假设,只能认为各总体率或总体构成比之间总的来说有差别,但不能说明它们彼此之间都有差别,或某两者间有差别。

配对计数资料x2检验(x2 test of paired comparison of enumeration data)

在计量资料方面,同一对象实验前后差别或配对资料的比较与两样本均数比较方法有所不同;在计数资料方面亦如此。例如表5是28份咽喉涂抹标本,每份按同样条件分别接种在甲、乙两种白喉杆菌培养基中,观察白喉杆菌生长情况,试比较两种培养基的效果。

培养基 乙培养基+ 乙培养基- 合计
甲培养基+ 11(a) 9(b) 20
甲培养基- 1(c) 7(d) 8
合计 12 16 28

表5两种白喉杆菌培养基培养结果比较

从表中资料可见有四种结果:(a)甲+乙+,(b)甲+乙-(c)甲-乙+,(d)甲-乙-;如果我们目的是比较两种培养基的培养结果有无差异,则(a)、(d)两种结果是一致的,对差异比较毫无意义,可以不计,我们只考虑结果不同的(b)和(c),看其差异有无意义,可以应用以下简易公式计算:

x2=(∣b−c∣−1)2b+c

x^2=\frac{(\lvert b-c\rvert -1)^2}{b+c}

检验步骤:

1.检验假设
H0:π1=π2
H1:π1≠π2
α=0.05

2.计算x2值

x2=(∣b−c∣−1)2b+c=(∣9−1∣−1)29+1=4.90

x^2=\frac{(\lvert b-c\rvert -1)^2}{b+c}=\frac{(\lvert 9-1\rvert -1)^2}{9+1}=4.90

3.确定P值和分析。配对资料v=1,查附表得知x2(0.05,1)=3.84,故P<0.05,按α=0.05水准,拒绝H0,可以认为甲培养基的白喉杆菌生长效率较高。

如果b+c>40,则可采用:

x2=(b−c)2b+c

x^2=\frac{(b-c)^2}{b+c}

此外还有两种以上处理方法的比较,可参阅预防医学专业的医学统计方法有关章节。

附表:x2界值表

v P(0.05) P(0.01) P(0.001) V P(0.05) P(0.01) P(0.001)
1 3.84 6.63 10.83 16 26.30 32.00 39.25
2 5.99 9.21 13.81 17 27.59 33.14 40.79
3 7.81 11.34 16.27 18 28.87 34.18 42.31
4 9.49 13.28 18.47 19 30.14 36.19 43.82
5 11.07 15.09 20.52 20 31.41 37.57 45.32
6 12.59 16.81 22.46 21 32.67 38.93 46.80
7 14.07 18.48 24.32 22 33.92 40.29 48.27
8 15.51 20.09 26.12 23 35.17 41.64 49.73
9 16.92 21.67 27.88 24 36.42 42.98 51.18
10 18.31 23.21 29.59 25 37.65 44.31 52.62
11 19.68 24.72 31.26 26 38.89 45.64 54.05
12 21.03 26.22 32.91 27 40.11 46.96 55.48
13 22.36 27.69 34.53 28 41.34 48.28 56.89
14 23.68 29.14 36.12 29 42.56 49.59 58.30
15 25.00 30.58 37.70 30 43.77 50.89 59.70

x2检验(chi-square test)/ 卡方检验相关推荐

  1. 卡方检验x2检验(chi-square test)

    x2检验(chi-square test)或称卡方检验,是一种用途较广的假设检验方法.可以分为成组比较(不配对资料)和个别比较(配对,或同一对象两种处理的比较)两类. 一.四格表资料的x2检验 例20 ...

  2. 卡方检验检验水准矫正_卡方检验x2检验(chi-square test)

    x2检验(chi-square test)或称卡方检验,是一种用途较广的假设检验方法.可以分为成组比较(不配对资料)和个别比较(配对,或同一对象两种处理的比较)两类. 一.四格表资料的x2检验 例20 ...

  3. 寻根究底,探讨 chi -square特征词选择方法后面的数学支持

    寻根究底,探讨 chi -square特征词选择方法后面的数学支持 最近研究特征词选择算法,主要在研究chi方统计量的方法. Christopher D Manning的书<信息检索导论> ...

  4. u检验、t检验、F检验、X2检验 (转)

    http://blog.renren.com/share/223170925/14708690013 常用显著性检验 1.t检验 适用于计量资料.正态分布.方差具有齐性的两组间小样本比较.包括配对资料 ...

  5. 卡方检验(Chi square statistic)

    卡方检验是一种检验两个变量独立性的方法.本文将介绍其理论并给出其应用在LBP特征匹配中的例子. 卡方检验最基本的思想就是通过观察实际值与理论值的偏差来确定理论的正确与否.具体做的时候常常先假设两个变量 ...

  6. R语言 多个变量进行 卡方检验 循环 fisher检验 chi test 循环

    多变量循环卡方检验+检测理论频数+<1 进行fisher 单个卡方检验流程 table(data$smoke,data$sex) s=chisq.test(data$smoke,data$age ...

  7. t检验、方差分析、卡方检验统计量的构造

    一.t检验 1.应用条件:正态分布.方差齐性(当两总体方差不等时,t检验不适用,需要用Cochran&Cox检验等) 2.t检验的理解:t检验的目的是比较两个样本的均值是否有差异,那么构造t统 ...

  8. 卡方检验检验水准矫正_卡方检验在实际工作中的应用

    卡方检验是以χ2分布为基础的一种常用假设检验方法,统计样本的实际观测值与理论推断值之间的偏离程度,主要在分类数据资料统计推断中应用. 在电商平台中,广告图到处可见,引起用户兴趣,为商品或者店铺带去流量 ...

  9. 如何选择Z检验、T检验和卡方检验?

    如何选择采用哪种假设检验? Z检验: 一般用于大样本(即样本容量大于30)平均值差异性检验的方法.它是用标准正态分布的理论来推断差异发生的概率,从而比较两个平均数的差异是否显著.在国内也被称作u检验. ...

最新文章

  1. 微软MVP社区活动(西宁站)
  2. 国家一级计算机考试模拟题2012版,2012年计算机等级考试一级上机Word模拟题2
  3. matlab中如何做连乘循环,如何利用for循环实现矩阵连乘
  4. 戏说云计算之PaaS,IaaS,SaaS
  5. 常用的正则表达式大全(数字、字符、固定格式)
  6. 移远百科 | LTE-A关键技术分析
  7. Petalinux配置
  8. 大数据技术架构_大数据架构流程图
  9. ASO|几个ASO优化方案解析(下)
  10. PTA:7-120 新浪微博热门话题 (30分)--(map方法,加解析)
  11. NTL的安装、连接与使用(基于CentOS、Clion)
  12. 4G时代 运营商的经营模式变化
  13. linux下使用磁带备份
  14. matlab实现手绘风格(简笔画风格、漫画风格)的曲线绘图
  15. 计算机计算公式单组数据求乘法,(excel表格全部数据怎么乘以一个数啊)
  16. speedoffice(PPT)插入的图片如何裁剪呢?
  17. JAVA网络爬爬学习之HttpClient+Jsoup
  18. word中将一种颜色的突出显示批量替换为另一种
  19. python3爬虫实战(一)爬取创业邦创投库
  20. 国企,可能会怎么改革?

热门文章

  1. 浅谈AI在智慧交通行业的应用
  2. 编写shell脚本,要求输入一个数字,然后计算出从1到输入数字的和,要求,如果输入的数字小于1,则重新输入,直到输入正确的数字为止;
  3. 图解Kafka分区副本同步限流机制三部曲(源码原理篇+测试用例 )
  4. USACO 1.1.4Broken Necklace 破碎的项链
  5. BNET技术更新 Weekly 1
  6. (试除法+unordered_map+因式分解)acwing 870. 约数个数
  7. Docker网络原则入门:EXPOSE,-p,-P,-link
  8. BZOJ1202 狡猾的商人 (Floyd)
  9. 【智力题】:毒酒问题
  10. SpringBoot入门第二天