UA MATH566 统计理论 推导卡方拟合优度检验
UA MATH566 统计理论 推导卡方拟合优度检验
卡方拟合优度检验主要是检验categorical data的,假设一共有ddd种category,每一种理论比例为pip_ipi,满足
∑i=1dpi=1,pi≥0\sum_{i=1}^d p_i = 1,p_i \ge 0i=1∑dpi=1,pi≥0
假设我们想要检验的问题是:
H0:πi=pi,i=1,⋯,dHa:πi≠pi,∃iH_0:\pi_i = p_i,i = 1,\cdots,d \\ H_a:\pi_i \ne p_i,\exists iH0:πi=pi,i=1,⋯,dHa:πi=pi,∃i
假设每一种category的频数为n1,⋯,ndn_1,\cdots,n_dn1,⋯,nd,则category data的似然为
L(p1,⋯,pd)=∏i=1dpinilnL(p1,⋯,pd)=∑i=1dnilnpiL(p_1,\cdots,p_d) = \prod_{i=1}^d p_i^{n_i} \\ \ln L(p_1,\cdots,p_d) = \sum_{i=1}^dn_i\ln p_iL(p1,⋯,pd)=i=1∏dpinilnL(p1,⋯,pd)=i=1∑dnilnpi
考虑pip_ipi的MLE,
maxpilnL(p1,⋯,pd)=∑i=1dnilnpis.t.∑i=1dpi=1,pi≥0\max_{p_i} \ln L(p_1,\cdots,p_d) = \sum_{i=1}^dn_i\ln p_i \\ s.t.\ \sum_{i=1}^d p_i = 1,p_i \ge 0pimaxlnL(p1,⋯,pd)=i=1∑dnilnpis.t. i=1∑dpi=1,pi≥0
定义
g(p1,⋯,pd,λ)=∑i=1dnilnpi−λ(∑i=1dpi−1)∂g∂pi=nipi−λ=0⇒pi=niλ⇒∑i=1dniλ=nλ=1g(p_1,\cdots,p_d,\lambda) = \sum_{i=1}^dn_i\ln p_i - \lambda(\sum_{i=1}^d p_i - 1) \\ \frac{\partial g}{\partial p_i} = \frac{n_i}{p_i} - \lambda = 0 \Rightarrow p_i = \frac{n_i}{\lambda}\Rightarrow \sum_{i=1}^d \frac{n_i}{\lambda} = \frac{n}{\lambda} = 1g(p1,⋯,pd,λ)=i=1∑dnilnpi−λ(i=1∑dpi−1)∂pi∂g=pini−λ=0⇒pi=λni⇒i=1∑dλni=λn=1
所以MLE为
p^i=nin\hat p_i = \frac{n_i}{n}p^i=nni
这个检验的似然比为
Λ(n)=∏i=1dπini∏i=1dp^ini=∏i=1d(nπini)ni\Lambda(n) = \frac{\prod_{i=1}^d \pi_i^{n_i}}{\prod_{i=1}^d \hat p_i^{n_i}} = \prod_{i=1}^d \left(\frac{ n\pi_i}{n_i} \right)^{n_i}Λ(n)=∏i=1dp^ini∏i=1dπini=i=1∏d(ninπi)ni
根据似然比检验的原理,当Λ(n)\Lambda(n)Λ(n)比较小的时候应该拒绝原假设。考虑统计量
−2lnΛ(n)→dχd−12,asn→∞-2\ln \Lambda(n) \to_d \chi^2_{d-1},\ as\ n \to \infty−2lnΛ(n)→dχd−12, as n→∞
实际计算的时候会用近似:
−2lnΛ(n)=2∑i=1dnilnninπi-2\ln \Lambda(n) = 2\sum_{i=1}^d n_i \ln \frac{n_i}{n\pi_i}−2lnΛ(n)=2i=1∑dnilnnπini
定义Oi=ni,Ei=nπiO_i = n_i, E_i = n\pi_iOi=ni,Ei=nπi,OiO_iOi是观测值,EiE_iEi是理论值
−2lnΛ(n)=2∑i=1dOilnOiEi=∑i=1dln(OiEi)2Oi=∑i=1dln(1−Ei−OiEi)2Oi≈∑i=1d(Ei−OiEi)2-2\ln \Lambda(n) = 2\sum_{i=1}^d O_i \ln \frac{O_i}{E_i} = \sum_{i=1}^d \ln \left( \frac{O_i}{E_i} \right)^{2O_i} \\= \sum_{i=1}^d \ln \left(1- \frac{E_i-O_i}{E_i} \right)^{2O_i} \approx \sum_{i=1}^d \left( \frac{E_i-O_i}{E_i} \right)^2−2lnΛ(n)=2i=1∑dOilnEiOi=i=1∑dln(EiOi)2Oi=i=1∑dln(1−EiEi−Oi)2Oi≈i=1∑d(EiEi−Oi)2
因此卡方检验的统计量为
χ2=∑i=1d(Ei−OiEi)2∼χd−12\chi^2 = \sum_{i=1}^d \left( \frac{E_i-O_i}{E_i} \right)^2 \sim \chi^2_{d-1}χ2=i=1∑d(EiEi−Oi)2∼χd−12
UA MATH566 统计理论 推导卡方拟合优度检验相关推荐
- UA MATH566 统计理论7 还有一个例子:推导卡方检验
UA MATH566 统计理论7 还有一个例子:推导卡方检验 均值已知 均值未知 前面的文章中我们已经推导了Z检验和T检验,Z检验是方差已知时比较单个或两个正态总体均值的方法:T检验是方差未知时比较单 ...
- UA MATH566 统计理论7 一个例子:推导T检验
UA MATH566 统计理论7 一个例子:推导T检验 T检验在math 571A和math 571B中已经用的很多了,这里按前两讲介绍的假设检验的理论回顾一下T检验,看一下T检验是怎么用似然比检验的 ...
- UA MATH566 统计理论7: Multiple Test
UA MATH566 统计理论7: Multiple Test Bonferroni调整 Benjamini-Hochberg方法 Fisher方法 False Discovery Rate Mult ...
- UA MATH566 统计理论 Bayes统计基础
UA MATH566 统计理论 Bayes统计基础 共轭分布 基于后验概率预测新的观测值 Bayes统计思想的基础是Bayes公式 P(Ci∣A)=P(A,Ci)P(A)=P(A∣Ci)P(Ci)∑i ...
- UA MATH566 统计理论 Fisher信息论的性质下
UA MATH566 统计理论 Fisher信息量的性质下 辅助统计量的Fisher信息为0 分布族参数变换后的Fisher信息 统计量的Fisher信息的有界性 下面介绍一些Fisher信息量的常用 ...
- UA MATH566 统计理论 Fisher信息量的性质上
UA MATH566 统计理论 Fisher信息量的性质上 Fisher信息量的定义 Fisher信息量的数学意义 C-R下界是由Fisher统计量定义的,在推导C-R下界的时候,我们只是把下界的逆定 ...
- UA MATH566 统计理论 Cramer-Rao不等式与Delta方法的联系
UA MATH566 统计理论 Cramer-Rao不等式与Delta方法的联系 Delta方法与C-R不等式基本概念回顾 Delta方法近似 C-R不等式近似 推导Delta方法与C-R不等式近似相 ...
- UA MATH566 统计理论 位置-尺度参数族
UA MATH566 统计理论 位置-尺度参数族 对位置-尺度参数族做位置-尺度变换 对正态分布做位置-尺度变换 对Gamma分布做位置-尺度变换 对指数分布做位置尺度变换 对均匀分布做位置-尺度变换 ...
- UA MATH566 统计理论2 C-R不等式简介
UA MATH566 统计理论2 C-R不等式 单个参数的情形 多个参数的情形 点估计基础那一篇讨论到UMVUE了,这一讲试图给出无偏估计方差的一个下界.在统计理论1中推导的Fisher信息其实就是一 ...
最新文章
- dsoframer控件注册,解注册和检查注册情况
- 108-学习如何格式化字符串
- KMP算法~看的清楚~
- jconsole工具检测堆内存变化
- 第三次学JAVA再学不好就吃翔(part104)--flush和close
- rails mysql查询_rails 对数据库的一些操作:新增,查询等
- IntelliJ IDEA中创建MyBatis.xml模板
- Proteus仿真错误解决方法:No power supply specified for net 5V in Power Rail Configuration.
- Android系统信息获取 之十二:获取屏幕分辨率及密度
- 单台服务器百万并发实现 C10K, C1000K, C10M
- win10输入法变成繁体字怎么办 - 如何关闭繁体,简体切换功能
- 计算机无法查看隐藏文件夹,电脑里的隐藏文件夹怎么显示不出来啊?
- 芭蕉树上第十六根芭蕉-- Qt中Ui名字空间以及setupUi函数的原理和实现
- 图像处理详解之图像透明度
- ACM大量习题题库及建议培养计划
- 分享一个颜色渐变的网站
- 免费下载国内各大音乐平台歌曲
- 星环科技:坚持国产自主路线,突破大数据的细分应用场景
- 汇编原理自我总结(一)
- 图片处理自带缓存的Picasso
热门文章
- Java实现算法导论中反复平方法模取幂
- Eureka 服务注册与发现01——单机版
- 函数的使用——未完待续
- 开关二极管的导通和截止条件
- 联合体在单片机中的应用
- CTFshow php特性 web126
- 【VS Code】更改默认的单击打开文档模式
- php el表达式,JSP EL表达式学习
- mysql conflicts with_安装MYSQL错误“conflicts with file from package mysql-libs-*” 解决方法...
- 【解决方案】“‘javac’不是内部或外部命令,也不是可运行的程序或批处理文件”