x2检验(chi-square test)或称卡方检验

x2检验(chi-square test)或称卡方检验,是一种用途较广的假设检验方法。可以分为成组比较(不配对资料)和个别比较(配对,或同一对象两种处理的比较)两类。

一、四格表资料的x2检验

例20.7某医院分别用化学疗法和化疗结合放射治疗卵巢癌肿患者,结果如表20-11,问两种疗法有无差别?

表20-11 两种疗法治疗卵巢癌的疗效比较

组别 有效 无效 合计 有效率(%)
化疗组 19 24 43 44.2
化疗加放疗组 34 10 44 77.3
合计 53 34 87 60.9

表内用虚线隔开的这四个数据是整个表中的基本资料,其余数据均由此推算出来;这四格资料表就专称四格表(fourfold table),或称2行2列表(2×2 contingency table)从该资料算出的两种疗法有效率分别为44.2%和77.3%,两者的差别可能是抽样误差所致,亦可能是两种治疗有效率(总体率)确有所不同。这里可通过x2检验来区别其差异有无统计学意义,检验的基本公式为:

式中A为实际数,以上四格表的四个数据就是实际数。T为理论数,是根据检验假设推断出来的;即假设这两种卵巢癌治疗的有效率本无不同,差别仅是由抽样误差所致。这里可将两种疗法合计有效率作为理论上的有效率,即53/87=60.9%,以此为依据便可推算出四格表中相应的四格的理论数。兹以表20-11资料为例检验如下。

检验步骤:

1.建立检验假设:

H0:π1=π2

H1:π1≠π2

α=0.05

2.计算理论数(TRC),计算公式为:

TRC=nR.nc/n 公式(20.13)

式中TRC是表示第R行C列格子的理论数,nR为理论数同行的合计数,nC为与理论数同列的合计数,n为总例数。

第1行1列: 43×53/87=26.2

第1行2列: 43×34/87=16.8

第2行1列: 44×53/87=26.8

第2行2列: 4×34/87=17.2

以推算结果,可与原四项实际数并列成表20-12:

表20-12 两种疗法治疗卵巢癌的疗效比较

组别 有效 无效 合计
化疗组 19(26.2) 24(16.8) 43
化疗加放疗组 34(26.8) 10(17.2) 44
合计 53 34 87 

因为上表每行和每列合计数都是固定的,所以只要用TRC式求得其中一项理论数(例如T1.1=26.2),则其余三项理论数都可用同行或同列合计数相减,直接求出,示范如下:

T1.1=26.2

T1.2=43-26.2=16.8

T2.1=53-26.2=26.8

T2.2=44-26.2=17.2

3.计算x2值 按公式20.12代入

4.查x2值表求P值

在查表之前应知本题自由度。按x2检验的自由度v=(行数-1)(列数-1),则该题的自由度v=(2-1)(2-1)=1,查x2界值表(附表20-1),找到x20.001(1)=6.63,而本题x2=10.01即x2>x20.001(1),P<0.01,差异有高度统计学意义,按α=0.05水准,拒绝H0,可以认为采用化疗加放疗治疗卵巢癌的疗效比单用化疗佳。

通过实例计算,读者对卡方的基本公式有如下理解:若各理论数与相应实际数相差越小,x2值越小;如两者相同,则x2值必为零,而x2永远为正值。又因为每一对理论数和实际数都加入x2值中,分组越多,即格子数越多,x2值也会越大,因而每考虑x2值大小的意义时同时要考虑到格子数。因此自由度大时,x2的界值也相应增大。

二、四格表的专用公式

对于四格表资料,还可用以下专用公式求x2值。

式中a、b、c、d各代表四格表中四个实际数,现仍以表20-12为例,将上式符号标记如下(表20-13),并示范计算。

表20-13 两种疗法治疗卵巢肿瘤患者的疗效

组别 有效 无效 合计
化疗组 19(a) 24(b) 43(a+b)
化疗加放疗组 34(c) 10(d) 44(c+d)
  53(a+c) 34(b+d) 87(n)

计算结果与前述用基本公式一致,相差0.01用换算时小数点后四舍五入所致。

三、四格表x2值的校正

x2值表是数理统计根据正态分布中的定义计算出来的。    是一种近似,在自由度大于1、理论数皆大于5时,这种近似很好;当自由度为1时,尤其当1<T<5,而n>40时,应用以下校正公式:

如果用四格表专用公式,亦应用下式校正:

例20.8某医师用甲、乙两疗法治疗小儿单纯性消化不良,结果如表20-14.试比较两种疗法效果有无差异?

表20-14 两种疗法效果比较的卡方较正计算

疗法 痊愈数 未愈数 合计
26(28.82) 7(4.18) 33
36(33.18) 2(4.82) 38
合计 62 9 71

从表20-14可见,T1.2和T2.2数值都<5,且总例数大于40,故宜用校正公式(20.15)检验。步骤如下:

1.检验假设:

H0:π1=π2

H1:π1≠π2

α=0.05

2.计算理论数:(已完成列入四格表括弧中)

3.计算x2值:应用公式(20.15)运算如下:

查x2界值表,x20.05(1)=3.84,故x2<x20.05(1),P>0.05.

按α=0.05水准,接受H0,两种疗效差异无统计学意义。

如果不采用校正公式,而用原基本公式,算得的结果x2=4.068,则结论就不同了。

如果观察资料的T<1或n<40时,四格表资料用上述校正法也不行,可参考预防医学专业用的医学统计学教材中的精确检验法直接计算概率以作判断。

四、行×列表的卡方检验(x2test for R×C table)

适用于两个组以上的率或百分比差别的显著性检验。其检验步骤与上述相同,简单计算公式如下:

式中n为总例数;A为各观察值;nR和nC为与各A值相应的行和列合计的总数。

例20.9北方冬季日照短而南移,居宅设计如何适应以获得最大日照量,增强居民体质,减少小儿佝偻病,实属重要。胡氏等1986年在北京进行住宅建筑日照卫生标准的研究,对214幢楼房居民的婴幼儿712人体检,检出轻度佝偻病333例,比较了居室朝向与患病的关系。现将该资料归纳如表20-15作行×列检验。

表20-15居室朝向与室内婴幼儿佝偻病患病率比较

检查结果 居室朝向 合计
西、西南 东、东南 北、东北、西北
患病 180 14 120 65 379
无病 200 16 84 33 333
合计 380 30 204 98 712
患病率(%) 47.4 46.7 58.8 66.3 53.2

/P>

该表资料由2行4列组成,称2×4表,可用公式(20.17)检验。

(一)检验步骤

1.检验假设

H0:四类朝向居民婴幼儿佝偻病患病率相同。

H1:四类朝向居民婴幼儿佝偻病患率不同。

α=0.05

2.计算x2值

3.确定P值和分析

本题v=(2-1)(4-3)=3,据此查附表20-1:

x20.01(3)=11.34,本题x2=15.08,x2>x20.01(3),P<0.01,按α=0.05水准,拒绝H0,可以认为居室朝向不同的居民,婴幼儿佝偻病患病率有差异。

(二)行×列表x2检验注意事项

1.一般认为行×列表中不宜有1/5以上格子的理论数小于5,或有小于1的理论数。当理论数太小可采取下列方法处理:①增加样本含量以增大理论数;②删去上述理论数太小的行和列;③将太小理论数所在行或列与性质相近的邻行邻列中的实际数合并,使重新计算的理论数增大。由于后两法可能会损失信息,损害样本的随机性,不同的合并方式有可能影响推断结论,故不宜作常规方法。另外,不能把不同性质的实际数合并,如研究血型时,不能把不同的血型资料合并。

2.如检验结果拒绝检验假设,只能认为各总体率或总体构成比之间总的来说有差别,但不能说明它们彼此之间都有差别,或某两者间有差别。

五、配对计数资料x2检验(x2test of paired comparison of enumeration data)

在计量资料方面,同一对象实验前后差别或配对资料的比较与两样本均数比较方法有所不同;在计数资料方面亦如此。例如表20-16是28份咽喉涂抹标本,每份按同样条件分别接种在甲、乙两种白喉杆菌培养基中,观察白喉杆菌生长情况,试比较两种培养基的效果。

表20-16 两种白喉杆菌培养基培养结果比较

甲培养基 乙培养基 合计
+ -
+ 11(a) 9(b) 20
- 1(c) 7(d) 8
合计 12 16 28

从表中资料可见有四种结果:(a)甲+乙+,(b)甲+乙-(c)甲-乙+,(d)甲-乙-;如果我们目的是比较两种培养基的培养结果有无差异,则(a)、(d)两种结果是一致的,对差异比较毫无意义,可以不计,我们只考虑结果不同的(b)和(c),看其差异有无意义,可以应用以下简易公式计算:

检验步骤:

1.检验假设

H0:π1=π2

H1:π1≠π2

α=0.05

2.计算x2值

3.确定P值和分析 配对资料v=1,查附表20-1得知x20.05(1)=3.84,x2>x0.05(1),P<0.05,按α=0.05水准,拒绝H0,可以认为甲培养基的白喉杆菌生长效率较高。

如果b+c>40,则可采用:

此外还有两种以上处理方法的比较,可参阅预防医学专业的医学统计方法有关章节。

附表20-1 x2界值表

v P V P
0.05 0.01 0.001 0.05 0.01 0.001
1 3.84 6.63 10.83 16 26.30 32.00 39.25
2 5.99 9.21 13.81 17 27.59 33.14 40.79
3 7.81 11.34 16.27 18 28.87 34.18 42.31
4 9.49 13.28 18.47 19 30.14 36.19 43.82
5 11.07 15.09 20.52 20 31.41 37.57 45.32
6 12.59 16.81 22.46 21 32.67 38.93 46.80
7 14.07 18.48 24.32 22 33.92 40.29 48.27
8 15.51 20.09 26.12 23 35.17 41.64 49.73
9 16.92 21.67 27.88 24 36.42 42.98 51.18
10 18.31 23.21 29.59 25 37.65 44.31 52.62
11 19.68 24.72 31.26 26 38.89 45.64 54.05
12 21.03 26.22 32.91 27 40.11 46.96 55.48
13 22.36 27.69 34.53 28 41.34 48.28 56.89
14 23.68 29.14 36.12 29 42.56 49.59 58.30
15 25.00 30.58 37.70 30 43.77 50.89 59.70

如何计算case control之间的卡方值相关推荐

  1. python 卡方分箱算法_python实现二分类的卡方分箱示例

    解决的问题: 1.实现了二分类的卡方分箱: 2.实现了最大分组限定停止条件,和最小阈值限定停止条件: 问题,还不太清楚,后续补充. 1.自由度k,如何来确定,卡方阈值的自由度为 分箱数-1,显著性水平 ...

  2. python分箱代码_python实现二分类的卡方分箱示例

    解决的问题: 1.实现了二分类的卡方分箱: 2.实现了最大分组限定停止条件,和最小阈值限定停止条件: 问题,还不太清楚,后续补充. 1.自由度k,如何来确定,卡方阈值的自由度为 分箱数-1,显著性水平 ...

  3. 机器学习对回归模型的评价指标:均方误差、可解释方差和R方值

    学习过概率与统计的同学们都知道,对于线性回归及其他的回归模型来说,评价连续性可拟合的数据就不能使用离散二分类器的评价指标对回归模型进行评价.因此我们引入了均方误差(mean squared error ...

  4. 卡方值c 语言编程,amos的操作步骤与程序

    Step 1. 建立路径模型图 注释:在amos模型分析当中,内因变量(因变量)均需增加一列误差项,此误差变量的参数设定起始值内定为1. Step 2. 读取数据 Step 3. 设定观察变量 如图所 ...

  5. python时区转换_在python 不同时区之间的差值与转换方法

    之前有个程序,里面有个时间部分是按照国内时区,也就是东八区,来写的,程序中定义了北京时间2点到八点进行检查:后面程序在国外机器上,例如说韩国,欧美等,执行的时候发现会有时间上的问题,因为获取的是机器的 ...

  6. case 关键字后面的的值有什么要求吗?

    case 关键字后面的的值有什么要求吗? Value1 的值为0.1 行吗?-0.1 呢?-1 呢?0.1+0.9 呢? 1+2 呢?3/2 呢?'A'呢?"A"呢? 变量i(假设 ...

  7. AbilitySlice之间的传递值

    今天我们介绍一下AbilitySlice之间的传递值,也是在开发过程中非常重要的概念之一,同学们带好小本本开始今天的笔记. AbilitySlice之间的传递值 我们都知道Page由多个Ability ...

  8. 获取数组中元素值为偶数的累加和与元素值为奇数的累加和,并计算他们之间的差值

    /*** 1.获取数组中元素值为偶数的累加和与元素值为奇数的累加和,并计算他们之间的差值* 1.定义int getNum(int[] arr)静态方法,该方法要求完成* 1.1 获取指定数组arr中元 ...

  9. 计算SharePoint两个日期和时间字段之间的时间差值

    计算SharePoint两个日期和时间字段之间的时间差值 在SharePoint中,有一个"日期和时间(Date and Time)"类型的字段,使用此字段不仅可以只存储日期值,还 ...

最新文章

  1. Git 忽略一些文件不加入版本控制
  2. J2EE开发之常用开源框架介绍
  3. 利用 Docker 在不同宿主机做 CentOS 系统容器 | 原力计划
  4. python中的多线程求值串行和并行_python多线程和多进程——python并行编程实验
  5. python笔记03_IO编程
  6. 手机编程环境初尝试-用AIDE开发Android应用
  7. 计算机超级终端 串口设置,win10系统超级终端软件连接串口设备的处理技巧
  8. <数据结构> 顺序表
  9. Opencv颜色空间最全
  10. 黑马程序员—因为感恩,所以我也来深圳黑马当班主任
  11. 夏普科学计算机标准差,疯狂期货夏普比率公式里面标准差实际应该怎么算
  12. 《蜗居》100句台词 血淋淋的经典
  13. python基础ppt_Python入门之你必须了解的基础知识
  14. k8s1.18 StorageClass 使用rbd-provisioner提供ceph rbd持久化存储
  15. c语言新手编程因式分解,c++/c语言因式分解
  16. 怎样查看服务器操作系统密码,IIS提示:您未被授权查看该页 并弹出输入用户名密码Windows服务器操作系统 -电脑资料...
  17. 大创项目部分笔记(1)
  18. 孙子兵法与管理演讲全文
  19. 《HTML5 Canvas学习笔记(10)》数钱数到手抽筋
  20. 计算机软件相关参考文献,计算机软件论文参考文献范文.doc

热门文章

  1. 【BZOJ】2160拉拉队排练-回文自动机
  2. 掌握绘画素描线条技巧的方法有哪些
  3. 程序员B站项目分享:啪一下子回到了10年前的B站,要泪目了
  4. tar -xzvf  *.tar.gz  简单说明
  5. MATLAB算法实战应用案例精讲-【深度学习】多尺度特征融合-工程应用(论文篇四)
  6. DG日志断档解决方法
  7. vue 组件递归方法
  8. css获取同类名下的第二个开始
  9. 调用外接摄像头每隔0.05秒拍一次照的MATLAB程序
  10. 电脑重装系统怎么设置U盘启动?