x2检验(chi-square test)或称卡方检验

x2检验(chi-square test)或称卡方检验,是一种用途较广的假设检验方法。可以分为成组比较(不配对资料)和个别比较(配对,或同一对象两种处理的比较)两类。

一、四格表资料的x2检验

例20.7某医院分别用化学疗法和化疗结合放射治疗卵巢癌肿患者,结果如表20-11,问两种疗法有无差别?

表20-11 两种疗法治疗卵巢癌的疗效比较

组别

有效

无效

合计

有效率(%)

化疗组

19

24

43

44.2

化疗加放疗组

34

10

44

77.3

合计

53

34

87

60.9

表内用虚线隔开的这四个数据是整个表中的基本资料,其余数据均由此推算出来;这四格资料表就专称四格表(fourfold table),或称2行2列表(2×2 contingency table)从该资料算出的两种疗法有效率分别为44.2%和77.3%,两者的差别可能是抽样误差所致,亦可能是两种治疗有效率(总体率)确有所不同。这里可通过x2检验来区别其差异有无统计学意义,检验的基本公式为:

式中A为实际数,以上四格表的四个数据就是实际数。T为理论数,是根据检验假设推断出来的;即假设这两种卵巢癌治疗的有效率本无不同,差别仅是由抽样误差所致。这里可将两种疗法合计有效率作为理论上的有效率,即53/87=60.9%,以此为依据便可推算出四格表中相应的四格的理论数。兹以表20-11资料为例检验如下。

检验步骤:

1.建立检验假设:

H0:π1=π2

H1:π1≠π2

α=0.05

2.计算理论数(TRC),计算公式为:

TRC=nR.nc/n 公式(20.13)

式中TRC是表示第R行C列格子的理论数,nR为理论数同行的合计数,nC为与理论数同列的合计数,n为总例数。

第1行1列: 43×53/87=26.2

第1行2列: 43×34/87=16.8

第2行1列: 44×53/87=26.8

第2行2列: 4×34/87=17.2

以推算结果,可与原四项实际数并列成表20-12:

表20-12 两种疗法治疗卵巢癌的疗效比较

组别

有效

无效

合计

化疗组

19(26.2)

24(16.8)

43

化疗加放疗组

34(26.8)

10(17.2)

44

合计

53

34

87

因为上表每行和每列合计数都是固定的,所以只要用TRC式求得其中一项理论数(例如T1.1=26.2),则其余三项理论数都可用同行或同列合计数相减,直接求出,示范如下:

T1.1=26.2

T1.2=43-26.2=16.8

T2.1=53-26.2=26.8

T2.2=44-26.2=17.2

3.计算x2值 按公式20.12代入

4.查x2值表求P值

在查表之前应知本题自由度。按x2检验的自由度v=(行数-1)(列数-1),则该题的自由度v=(2-1)(2-1)=1,查x2界值表(附表20-1),找到x20.001(1)=6.63,而本题x2=10.01即x2>x20.001(1),P<0.01,差异有高度统计学意义,按α=0.05水准,拒绝H0,可以认为采用化疗加放疗治疗卵巢癌的疗效比单用化疗佳。

通过实例计算,读者对卡方的基本公式有如下理解:若各理论数与相应实际数相差越小,x2值越小;如两者相同,则x2值必为零,而x2永远为正值。又因为每一对理论数和实际数都加入x2值中,分组越多,即格子数越多,x2值也会越大,因而每考虑x2值大小的意义时同时要考虑到格子数。因此自由度大时,x2的界值也相应增大。

二、四格表的专用公式

对于四格表资料,还可用以下专用公式求x2值。

式中a、b、c、d各代表四格表中四个实际数,现仍以表20-12为例,将上式符号标记如下(表20-13),并示范计算。

表20-13 两种疗法治疗卵巢肿瘤患者的疗效

组别

有效

无效

合计

化疗组

19(a)

24(b)

43(a+b)

化疗加放疗组

34(c)

10(d)

44(c+d)

53(a+c)

34(b+d)

87(n)

计算结果与前述用基本公式一致,相差0.01用换算时小数点后四舍五入所致。

三、四格表x2值的校正

x2值表是数理统计根据正态分布中

的定义计算出来的。

    是一种近似,在自由度大于1、理论数皆大于5时,这种近似很好;当自由度为1时,尤其当1<T<5,而n>40时,应用以下校正公式:

如果用四格表专用公式,亦应用下式校正:

例20.8某医师用甲、乙两疗法治疗小儿单纯性消化不良,结果如表20-14.试比较两种疗法效果有无差异?

表20-14 两种疗法效果比较的卡方较正计算

疗法

痊愈数

未愈数

合计

26(28.82)

7(4.18)

33

36(33.18)

2(4.82)

38

合计

62

9

71

从表20-14可见,T1.2和T2.2数值都<5,且总例数大于40,故宜用校正公式(20.15)检验。步骤如下:

1.检验假设:

H0:π1=π2

H1:π1≠π2

α=0.05

2.计算理论数:(已完成列入四格表括弧中)

3.计算x2值:应用公式(20.15)运算如下:

查x2界值表,x20.05(1)=3.84,故x2<x20.05(1),P>0.05.

按α=0.05水准,接受H0,两种疗效差异无统计学意义。

如果不采用校正公式,而用原基本公式,算得的结果x2=4.068,则结论就不同了。

如果观察资料的T<1或n<40时,四格表资料用上述校正法也不行,可参考预防医学专业用的医学统计学教材中的精确检验法直接计算概率以作判断。

四、行×列表的卡方检验(x2test for R×C table)

适用于两个组以上的率或百分比差别的显著性检验。其检验步骤与上述相同,简单计算公式如下:

式中n为总例数;A为各观察值;nR和nC为与各A值相应的行和列合计的总数。

例20.9北方冬季日照短而南移,居宅设计如何适应以获得最大日照量,增强居民体质,减少小儿佝偻病,实属重要。胡氏等1986年在北京进行住宅建筑日照卫生标准的研究,对214幢楼房居民的婴幼儿712人体检,检出轻度佝偻病333例,比较了居室朝向与患病的关系。现将该资料归纳如表20-15作行×列检验。

表20-15居室朝向与室内婴幼儿佝偻病患病率比较

检查结果

居室朝向

合计

西、西南

东、东南

北、东北、西北

患病

180

14

120

65

379

无病

200

16

84

33

333

合计

380

30

204

98

712

患病率(%)

47.4

46.7

58.8

66.3

53.2

/P>

该表资料由2行4列组成,称2×4表,可用公式(20.17)检验。

(一)检验步骤

1.检验假设

H0:四类朝向居民婴幼儿佝偻病患病率相同。

H1:四类朝向居民婴幼儿佝偻病患率不同。

α=0.05

2.计算x2值

3.确定P值和分析

本题v=(2-1)(4-3)=3,据此查附表20-1:

x20.01(3)=11.34,本题x2=15.08,x2>x20.01(3),P<0.01,按α=0.05水准,拒绝H0,可以认为居室朝向不同的居民,婴幼儿佝偻病患病率有差异。

(二)行×列表x2检验注意事项

1.一般认为行×列表中不宜有1/5以上格子的理论数小于5,或有小于1的理论数。当理论数太小可采取下列方法处理:①增加样本含量以增大理论数;②删去上述理论数太小的行和列;③将太小理论数所在行或列与性质相近的邻行邻列中的实际数合并,使重新计算的理论数增大。由于后两法可能会损失信息,损害样本的随机性,不同的合并方式有可能影响推断结论,故不宜作常规方法。另外,不能把不同性质的实际数合并,如研究血型时,不能把不同的血型资料合并。

2.如检验结果拒绝检验假设,只能认为各总体率或总体构成比之间总的来说有差别,但不能说明它们彼此之间都有差别,或某两者间有差别。

五、配对计数资料x2检验(x2test of paired comparison of enumeration data)

在计量资料方面,同一对象实验前后差别或配对资料的比较与两样本均数比较方法有所不同;在计数资料方面亦如此。例如表20-16是28份咽喉涂抹标本,每份按同样条件分别接种在甲、乙两种白喉杆菌培养基中,观察白喉杆菌生长情况,试比较两种培养基的效果。

表20-16 两种白喉杆菌培养基培养结果比较

甲培养基

乙培养基

合计

+

-

+

11(a)

9(b)

20

-

1(c)

7(d)

8

合计

12

16

28

从表中资料可见有四种结果:(a)甲+乙+,(b)甲+乙-(c)甲-乙+,(d)甲-乙-;如果我们目的是比较两种培养基的培养结果有无差异,则(a)、(d)两种结果是一致的,对差异比较毫无意义,可以不计,我们只考虑结果不同的(b)和(c),看其差异有无意义,可以应用以下简易公式计算:

检验步骤:

1.检验假设

H0:π1=π2

H1:π1≠π2

α=0.05

2.计算x2值

3.确定P值和分析 配对资料v=1,查附表20-1得知x20.05(1)=3.84,x2>x0.05(1),P<0.05,按α=0.05水准,拒绝H0,可以认为甲培养基的白喉杆菌生长效率较高。

如果b+c>40,则可采用:

此外还有两种以上处理方法的比较,可参阅预防医学专业的医学统计方法有关章节。

附表20-1 x2界值表

v

P

V

P

0.05

0.01

0.001

0.05

0.01

0.001

1

3.84

6.63

10.83

16

26.30

32.00

39.25

2

5.99

9.21

13.81

17

27.59

33.14

40.79

3

7.81

11.34

16.27

18

28.87

34.18

42.31

4

9.49

13.28

18.47

19

30.14

36.19

43.82

5

11.07

15.09

20.52

20

31.41

37.57

45.32

6

12.59

16.81

22.46

21

32.67

38.93

46.80

7

14.07

18.48

24.32

22

33.92

40.29

48.27

8

15.51

20.09

26.12

23

35.17

41.64

49.73

9

16.92

21.67

27.88

24

36.42

42.98

51.18

10

18.31

23.21

29.59

25

37.65

44.31

52.62

11

19.68

24.72

31.26

26

38.89

45.64

54.05

12

21.03

26.22

32.91

27

40.11

46.96

55.48

13

22.36

27.69

34.53

28

41.34

48.28

56.89

14

23.68

29.14

36.12

29

42.56

49.59

58.30

15

25.00

30.58

37.70

30

43.77

50.89

59.70

x平方检验计算_x2检验(chi-square test)或称卡方检验相关推荐

  1. x平方检验计算_x2检验或卡方检验和校正卡方检验的计算

    x2检验(chi-square test)或称卡方检验 x2检验(chi-square test)或称卡方检验,是一种用途较广的假设检验方法.可以分为成组比较(不配对资料)和个别比较(配对,或同一对象 ...

  2. 寻根究底,探讨 chi -square特征词选择方法后面的数学支持

    寻根究底,探讨 chi -square特征词选择方法后面的数学支持 最近研究特征词选择算法,主要在研究chi方统计量的方法. Christopher D Manning的书<信息检索导论> ...

  3. x平方检验计算_卡方检验具体怎么计算

    展开全部 四格表资料检验 四格表资料的卡方检验用于进行两个率或两个构成比的比较.e69da5e6ba903231313335323631343130323136353331333366303136 1 ...

  4. T检验,方差分析,非参数检验,卡方检验,方差分析总结

    T检验,方差分析,非参数检验,卡方检验 一.T检验 1.T检验分类 2.T检验的使用前提 3.T检验的适用类型 二.非参数检验 1.非参数检验介绍 2.非参数检验适用类型 三.卡方检验 1.卡方检验介 ...

  5. 生物医学中常用的假设检验总结——正态性检验、t检验、方差分析、秩和检验、卡方检验

    医学中常用的假设检验总结 1 医学中常用的假设检验总结 1.1 正态性检验 1.2 方差齐性检验 1.3 t 检验 1.4 方差分析 1.5 卡方检验 1.6 秩和检验 1 医学中常用的假设检验总结 ...

  6. R语言 多个变量进行 卡方检验 循环 fisher检验 chi test 循环

    多变量循环卡方检验+检测理论频数+<1 进行fisher 单个卡方检验流程 table(data$smoke,data$sex) s=chisq.test(data$smoke,data$age ...

  7. 卡方检验(Chi square statistic)

    卡方检验是一种检验两个变量独立性的方法.本文将介绍其理论并给出其应用在LBP特征匹配中的例子. 卡方检验最基本的思想就是通过观察实际值与理论值的偏差来确定理论的正确与否.具体做的时候常常先假设两个变量 ...

  8. 633.平方数之和(Sum of Square Numbers)

    题目描述 给定一个非负整数 c ,你要判断是否存在两个整数 a 和 b,使得 a2 + b2 = c. 示例1: 输入: 5 输出: True 解释: 1 * 1 + 2 * 2 = 5 示例2: 输 ...

  9. python实现卡方(Chi-Squared Test)相关性检验

    python实现卡方(Chi-Squared Test)相关性检验 独立性检验是统计学的一种检验方式,与适合性检验同属于X2检验,即卡方检验(英文名:chi square test),它是根据次数资料 ...

最新文章

  1. bzoj 1207: [HNOI2004]打鼹鼠
  2. 借助码云快速安装 golang.org/x/lint/golint 和 golang.org/x/tools/ 等依赖
  3. android开发分页查询,Android开发中实现分页效果的简单步骤
  4. javascript中的'this'
  5. Deepin在matlab的安装
  6. 光伏发电最大功率点(MPPT)跟踪技术
  7. python的spider如何让鼠标不_python wooyun爬虫模拟鼠标等
  8. 华为模拟器eNSP直连路由静态路由配置实验
  9. linux解压rar.gz,Linux tar.gz 、zip、rar 解压 压缩命令
  10. 发现贝叶斯的乐高积木
  11. Pygame小游戏:无敌斗牛士
  12. 大学c语言第三章作业,第三章_C语言标准课件_ppt_大学课件预览_高等教育资讯网...
  13. 复数加减java_用java实现复数的加减乘除运算
  14. 从网页复制内容到富文本、或者富文本里自己加样式,当ajax传参时候,总是莫名其妙丢失变成无意义的html,究竟是为什么呢
  15. bsdiff算法c语言实现,iOS 使用bsdiff进行资源文件增量更新(bsdiff / bspatch)
  16. 个人基因组测序降到 500 元以内后基因组学将有哪些大的改变?
  17. 何谓”透传“? UART串口WIFI模块做”透传“的目的及其局限性
  18. 【进阶版】 机器学习之K均值聚类、层次聚类、密度聚类、实战项目含代码(15)
  19. dlib.get_frontal_face_datector()人脸位置检测
  20. 利用树莓派搭建家庭NAS简要

热门文章

  1. ROS之xacro语法
  2. 043-推箱子游戏源代码3
  3. c语言万年历流程图加程序,基于C语言的万年历(内附程序).pdf
  4. 散列表(上):Word文档中的单词拼写检查功能是如何实现的?
  5. 【Pytorch基础教程35】引入非线性的激活函数
  6. 批量修改文件名部分字段
  7. 批量重命名工作簿中的工作表名
  8. 网站专题页SEO优化来抢占海量长尾词排名
  9. Transition飞行汽车来了,采用电力驱动且可陆空两用
  10. 【三维激光扫描】实验05:点云数据预处理操作