【数理统计】卡方检验
上回说到,卡方检验、t检验、F检验都是显著性检验的具体方法。这次好好说说卡方检验是个啥。
先来个例子,看看卡方检验能干啥事儿。
卡方检验的例子
例子1:某医院分别用化学疗法和化疗结合放射治疗卵巢癌肿患者,结果如下表,问两种疗法有无差别?
组别 | 有效 | 无效 | 合计 |
---|---|---|---|
化疗组 | 19 | 24 | 43 |
化疗加放疗组 | 34 | 10 | 44 |
合计 | 53 | 34 | 87 |
例子2:男人和女人对沙滩度假和邮轮度假的偏爱有区别吗?
组别 | 沙滩 | 游轮 | 合计 |
---|---|---|---|
男 | 209 | 280 | 489 |
女 | 225 | 248 | 473 |
合计 | 434 | 528 | 962 |
例子3:不用药和吃药对感冒的好转程度有区别吗?
组别 | 无效 | 好转 | 痊愈 | 合计 |
---|---|---|---|---|
不吃药 | 10 | 20 | 40 | 70 |
吃药 | 25 | 30 | 60 | 115 |
合计 | 35 | 50 | 100 | 185 |
例子4:不用婚姻状态的人对华为、苹果、三星这三类手机的喜欢程度有差异吗?
组别 | 华为 | 三星 | 苹果 | 合计 |
---|---|---|---|---|
单身 | 10 | 20 | 40 | 70 |
结婚 | 25 | 30 | 60 | 115 |
离异 | 20 | 23 | 50 | 93 |
合计 | 55 | 73 | 150 | 278 |
上面这些例子都可以用卡方检验来判断显著性差异。
卡方检验的应用场景
1、卡方检验只适用于分类数据(分成不同类别的数据),像性别 {Men, Women} 或颜色 {Red, Yellow, Green, Blue} 等等,而不适用于数值数据,例如身高、体重等等。
2、数据的值需要是相当大的,每个数值需要是 5 或更大。在以上的例子里,数值是 209、282 等,所以是合适的。
卡方检验的具体过程
卡方检验也是显著性检验的方法,所以还是三步走。以例4为例。
1、提出假设
原假设:这三类人对这三类品牌的手机的喜好程度没区别,都一样。
2、做卡方检验,求对应的统计量
既然我认为这三类人对这三类品牌的手机的喜好程度没区别的,也就是说这个人的婚姻状态和喜欢哪类手机是相互独立(无关的)。
所以,从理论上(前提是咱们的假设是正确的)来讲,根据当前样本,随便挑一个人,喜欢华为的概率是:55/278=0.1978,而我调查的人数中有70个单身,那么理论上单身的人中有70*0.1978=13.8个人喜欢华为。
注意注意,上面这一段算的是在我假设是正确的的前提下的理论值,同理所有的理论值都能算出来,理论值的表如下表所示。
组别 | 华为 | 三星 | 苹果 | 合计 |
---|---|---|---|---|
单身 | 13.8 | 18.4 | 37.8 | 70 |
结婚 | 22.8 | 30.2 | 62 | 115 |
离异 | 13.4 | 24.4 | 50.2 | 93 |
合计 | 55 | 73 | 150 | 278 |
那么,理论值和真实值差异越小,说明咱们的假设越正确。这时候咱们卡方值出现了。
这里的A就是真实数,T就是理论值,咱们这里是3类对3类的差异,所以一共是3*3=9类的数据,自由度为(自变量类别-1)×(因变量类别-1)=4
使用SPSS进行卡方检验(过程不赘述了,也可以用其他的工具和编程语言),得到卡方值为1.858,对应的P值为0.762.
3、查表得到P值,得出结论
使用SPSS直接把P求出来了0.762,明显大于0.05,所以不拒绝原假设,也就是说,没统计学意义,无差异。
原来是需要手动查卡方表的,卡方表长这样。
n是自由度,p就是那个p值(取0.05),这个p代表啥来着?代表原假设成立的概率,这里的9.49就是自由度为4,显著性水平为0.05的临界卡方值,这个值标识啥意思呢?表示如果算出来的卡方值大于9.49,那么恰好落在拒绝域中,拒绝原假设,如果小于9.49,则接受原假设。
当然,也可以根据卡方值推测P值,咱们的卡方值等于1.858,自由度是4,对应的p值在0.75和0.9之间,和SPSS算出来的一样0.762,比0.05大,所以接受原假设,也就是无统计学意义。
【数理统计】卡方检验相关推荐
- matlab概率及数理统计学习-T检验、卡方检验、直方图分布检验
%norm:Normal正态分布 %t:T分布 %chi2:卡方分布 %f:F分布 %weib:Weibull分布 %--------- %cdf:cumulative distribution fu ...
- 数据挖掘之数理统计与常见分布与假设检验
1 一般随机变量 1.1 随机变量的两种类型 根据随机变量可能取值的个数分为离散型(取值有限)和连续型(取值无限)两类. 1.2 离散型随机变量 对于离散型随机变量,使用概率质量函数(probabil ...
- 【概率论与数理统计】小结8 - 三大抽样分布
注:抽样分布就是统计量的分布,其特点是不包含未知参数且尽可能多的概括了样本信息.除了常见的正态分布之外,还有卡方分布.t分布和F分布为最常见的描述抽样分布的分布函数.这几个分布函数在数理统计中也非常有 ...
- 视频课程更新,机器学习、数理统计、矩阵分析、运筹视频教程
如果各位读者朋友读到了这里,不妨移步到B zhan(五道口纳什),那里我将进行每周至少一次的更新,更多视频课程等待各位的阅读和反馈. 导览传送门如下: 1. 数据&算法 [手推公式]指数族分布 ...
- 卡方检验(Chi-square test/Chi-Square Goodness-of-Fit Test)
什么是卡方检验 卡方检验是一种用途很广的计数资料的假设检验方法.它属于非参数检验的范畴,主要是比较两个及两个以上样本率( 构成比)以及两个分类变量的关联性分析.其根本思想就是在于比较理论频数和实际频数 ...
- 卡方检验x2检验(chi-square test)
x2检验(chi-square test)或称卡方检验,是一种用途较广的假设检验方法.可以分为成组比较(不配对资料)和个别比较(配对,或同一对象两种处理的比较)两类. 一.四格表资料的x2检验 例20 ...
- 变异系数在线计算机,数理统计在线计算器
样本标准偏差在线计算器相关系数计算器变异系数计算器几何平均值在线计算器线性回归方程计算器算术平均值计算器效应量计算器信噪比计算器阶乘计算器在线标准误差计算器调和平均数在线计算器加权平均值计算器均方根计 ...
- x2检验(chi-square test)/ 卡方检验
x2检验(chi-square test)或称卡方检验,是一种用途较广的假设检验方法.可以分为成组比较(不配对资料)和个别比较(配对,或同一对象两种处理的比较)两类. 四格表资料的x2检验 例1:某医 ...
- 数理统计笔记7:分类数据分析-拟合优度检验和列联分析
引言 数理统计笔记的第7篇介绍了分类数据分析的方法,包括拟合优度检验和列联分析,给出了两者的卡方检验量的表达式,并且用例子进行了说明,最后谈了列联分析需要注意的问题. 引言 什么是分类型数据 拟合优度 ...
- 卡方检验--离散变量相关性分析--机器学习特征选择
一.卡方检验理论 这部分来自<概率论与数理统计>.先从理论角度介绍卡方检验是什么. 卡方检验起始就是一种假设检验. 假定一个总体可以分成r类,从该总体获得了样本数据集.从该样本数据集出发, ...
最新文章
- 三十九、文件的逻辑结构
- android studio 怎么做屏幕适配?
- python hook技术,python hook监听事件详解
- 使用Zookeeper实现leader选举
- qt 一个线程接收数据 主线程更新界面 会造成界面退出 怎么解决_打造一个好产品...
- C#设计模式(7)-Singleton Pattern
- C#中释放数据库连接资源
- 【模型压缩】通道剪枝《Pruning Filters For Efficient ConvNets》论文翻译
- echarts中x轴文件消失_实测实例:labview中波形图X轴刻度任意刻度设置
- L1-024. 后天-PAT团体程序设计天梯赛GPLT
- java api大全网站
- Windows命令行工具cmder配置
- PHP开发Paypal支付,支付流程和接口实现方案
- PLC温室大棚自动控制系统
- Python 安装pyinstaller失败的解决方法
- 计算机窗口是什么意思解释,界面(概念用语)_百度百科
- java笔试 https://blog.csdn.net/zhugewendu/article/details/72852033
- 移动通讯技术的发展历史
- pg数据库插件timescale时序库使用记录
- 2021教育企业邮箱怎么注册?如何申请学校邮箱?