4月27 统计学——卡方检验和卡方分布
什么是卡方检验
卡方检验是一种用途很广的计数资料的假设检验方法。它属于非参数检验的范畴,主要是比较两个及两个以上样本率( 构成比)以及两个分类变量的关联性分析。其根本思想就是在于比较理论频数和实际频数的吻合程度或拟合优度问题。
它在分类资料统计推断中的应用,包括:两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料的相关分析等。
例子1:四格卡方检验
通过简单的统计我们得出喝牛奶组和不喝牛奶组的感冒率为30.94%和25.00%,两者的差别可能是抽样误差导致,也有可能是牛奶对感冒率真的有影响。
为了确定真实原因,我们先假设喝牛奶对感冒发病率是没有影响的,即喝牛奶喝感冒时独立无关的,所以我们可以得出感冒的发病率实际是(43+28)/(43+28+96+84)= 28.29%
所以,理论的四格表应该如下表所示:
如果喝牛奶和感冒真的是独立无关的,那么四格表里的理论值和实际值差别应该会很小。
卡方检验
卡方检验的计算公式为:
其中,A为实际值,T为理论值。
x^2用于衡量实际值与理论值的差异程度(也就是卡方检验的核心思想),包含了以下两个信息:
- 实际值与理论值偏差的绝对大小(由于平方的存在,差异是被放大的)
- 差异程度与理论值的相对大小
例1卡方检验
根据卡方检验公式我们可以得出例1的卡方值为:
卡方=(43−39.3231)2/39.3231+(28−31.6848)2/31.6848+(96−99.6769)2/99.6769+(84−80.3152)2/80.3152=1.077卡方 = (43 - 39.3231)^2 / 39.3231 + (28 - 31.6848)^2 / 31.6848 + (96 - 99.6769)^2 / 99.6769 + (84 - 80.3152)^2 / 80.3152 = 1.077卡方=(43−39.3231)2/39.3231+(28−31.6848)2/31.6848+(96−99.6769)2/99.6769+(84−80.3152)2/80.3152=1.077
卡方分布的临界值:
上一步我们得到了卡方的值,但是如何通过卡方的值来判断喝牛奶和感冒是否真的是独立无关的?也就是说,怎么知道无关性假设是否可靠?
答案是,通过查询卡方分布的临界值表。
这里需要用到一个自由度的概念,自由度等于V = (行数 - 1) * (列数 - 1),
对四格表,自由度V = 1。
对V = 1,喝牛奶和感冒95%概率不相关的卡方分布的临界概率是:3.84,显然1.077<3.84,没有达到卡方分布的临界值,所以喝牛奶和感冒是独立不相关的。
上面通过一个小例子让大家对卡方检验有一个简单的认识,下面是卡方检验的标准做法:
例子2. 四格卡方检验的标准做法
我们想知道不吃晚饭对体重下降有没有影响:
1. 建立假设检验:
H0:r1=r2,不吃晚饭对体重下降没有影响,即吃不吃晚饭的体重下降率相等;
H1:r1≠r2,不吃晚饭对体重下降有显著影响,即吃不吃晚饭的体重下降率不相等。α=0.05
2. 计算理论值
3. 计算卡方值
根据公式,计算出卡方值为5.498
4. 查卡方表求P值
在查表之前应知本题自由度。按卡方检验的自由度v=(行数-1)(列数-1),则该题的自由度v=(2-1)(2-1)=1,查卡方界值表,找到3.84,而本题卡方=5.498即卡方>3.84,P<0.05,差异有显著统计学意义,按α=0.05水准,拒绝H0,可以认为两组的体重下降率有明显差别。
通过实例计算,对卡方的基本公式有如下理解:若各理论数与相应实际数相差越小,卡方值越小;如两者相同,则卡方值必为零。
什么是卡方分布
若n个相互独立的随机变量ξ₁,ξ₂,…,ξn ,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布(chi-square distribution)。
x1 = rnorm(1000000)
x2 = rnorm(1000000)
x3 = rnorm(1000000)
x4 = rnorm(1000000)
x5 = rnorm(1000000)
x6 = rnorm(1000000)Q1 = x1^2
Q2 = x1^2 + x2^2
Q3 = x1^2 + x2^2 + x3^2
Q4 = x1^2 + x2^2 + x3^2 + x4^2
Q5 = x1^2 + x2^2 + x3^2 + x4^2 + x5^2
Q6 = x1^2 + x2^2 + x3^2 + x4^2 + x5^2 + x6^2par(mfrow=c(1,1))
plot(density(Q1),xlim=c(0.23,6),ylim = c(0,1),breaks = 200,col = 'blue',lwd=2,main='chi-square',xlab = '',ylab='')
lines(density(Q2),col='black',lwd=2)
lines(density(Q3),col='red',lwd=2)
lines(density(Q4),col='green',lwd=2)
lines(density(Q5),col='gray',lwd=2)
lines(density(Q6),col='orange',lwd=2)
legend('topright',c('k=1','k=2','k=3','k=4','k=5','k=6'),fill = c('blue','black','red','green','gray','orange'))
链接:https://blog.csdn.net/snowdroptulip/article/details/78770088
4月27 统计学——卡方检验和卡方分布相关推荐
- AI一分钟 | 小米MIX 2S将于3月27号发布,搭载骁龙845;张朝阳:在研究区块链 但相信AI的力量
一分钟AI 华为确认P20系列即将登陆巴黎,AI加成拍照功能更出色 张朝阳:在研究区块链,但相信AI的力量 Waymo无人车新专利,根据乘客身体状况选择合适的路线,可为易晕车乘客选择平坦路线 新款 A ...
- 英国JIC院士3.8万英镑招博后-植物代谢物与微生物组-截止6月27日
博士后招聘(Osbourn实验室) 链接:https://www.jic.ac.uk/vacancies/postdoctoral-researcher-osbourn-lab/ 截止日期:2019年 ...
- 英国JIC院士组3.8万英镑招博后-植物代谢物与微生物组-截止6月27日
文章目录 博士后招聘(Osbourn实验室) 项目研究内容 理想的候选人 附加信息 Anne Osbourn简介 Postdoctoral Researcher (Osbourn Lab) The r ...
- 2021年4月27日 华为Cloud AI 通用软件开发实习面试(一面)
title: 2021年4月27日 华为Cloud AI 通用软件开发实习面试(一面) tags: 面经 2021年4月27日 华为Cloud AI 通用软件开发实习面试(一面) 自我介绍(这个地方由 ...
- 线上会议丨中国中文信息学会2020学术年会将于12月27日举行
会议时间 2020年12月27日 北京 会议官网 http://www.cipsc.org.cn/annual2020 扫码进入会议官网 扫码观看直播 特邀报告 按报告时间排序 专题研讨
- CCNA10月27日战报
青岛 10月27号 812 988 pass<?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:offi ...
- 薛老师软考高项学员:2016年4月27日作业
薛老师软考高项学员:2016年4月27日作业 1.写全文:论信息系统项目的范围管理 2.写架构:论项目的计划与监控:论项目的进度管理. 转载于:https://blog.51cto.com/xueda ...
- 御剑情缘服务器维护,御剑情缘7月27日更新维护内容及活动详解介绍
导 读 御剑情缘7月27日更新维护了什么内容?御剑情缘目前在7月27日为玩家们进行了游戏更新,不少小伙伴们还不清楚有哪些玩法吧!下面是御剑情缘7月27日更新维护内容及活动详解介绍,一起来看下吧! ▲燕 ...
- 盘丝洞服务器维护,9月27日“盘丝洞”等服务器停机更新
作者本篇文章获得: 积分登陆17173通行证投稿才能获得积分! 17173全新作家积分兑换系统上线 点卡周边等你拿 >>>详情点击 尊敬的<西游记>玩家: <西游记 ...
- 1载波把32个信道按_「防疫」截至8月27日,单日确诊新增32例,张文宏带来1个坏消息...
文/嵩姨热点谈 国内疫情每日都处于一个新增的状态,更可怕的是海外的疫情依旧是一个不断爆发蔓延的趋势情况,截至8月27日,海外疫情累计确诊超过2423万例以上,累计死亡82.4万例,单日新增25.8万例 ...
最新文章
- iOS键盘弹出时动画时长失效问题
- 《Android开发艺术探索》自定义View中关于“HorizontalScrollViewEx”的改进
- PowerDesigner使用教程 —— 概念数据模型详解
- 【JAVA基础篇】注解
- 【实用工具】windows/linux下时间统计函数
- 面试官,你为什么老是问我”闭包“
- C++自己实现一个String类
- 希望能够在这条路上走下去
- 保留正常工作的环境,等自己的搞好后再替换
- 美团杀熟?背后到底利用大数据做了些什么?
- ds1302时钟芯片工作原理引脚电路图及功能
- java 去系统运行时间_java 如何获取应用的运行时间
- Ubuntu Linux 15.04安装 nginx + passenger
- 英语语法笔记——特殊句型(六)
- HM-GNN:基于分子-基序异构图神经网络的分子表示学习模型
- vue 快速入门、常用指令(1)
- python项目的QQ机器人使用及部署在腾讯云服务器
- 网神保障中国中化集团公司核心业务安全
- JavaScript节流函数, 防止大量函数触发解决办法
- SpringBoot Cloud必须掌握的常用注解
热门文章
- %%%%%%%%123564
- mysql查询最接近的记录
- 利用Docker学习Redis笔记(一)
- 从开发到生产上线,如何确定集群大小?
- Java8 中的真的 Optional 很强大,你用对了吗?
- 公布中秋福利中奖名单
- 如何在程序中不用加号实现加法_python不用加号实现加法
- mockito 外部接口_原创 |使用JUnit、AssertJ和Mockito编写单元测试和实践TDD (五)第一个单元测试...
- mysql 总分区表限制_MySQL分区表的局限和限制详解
- java 写文件 速度_关于java:哪个文件写入速度更快?