UA MATH566 统计理论 推导卡方拟合优度检验

卡方拟合优度检验主要是检验categorical data的,假设一共有ddd种category,每一种理论比例为pip_ipi​,满足
∑i=1dpi=1,pi≥0\sum_{i=1}^d p_i = 1,p_i \ge 0i=1∑d​pi​=1,pi​≥0

假设我们想要检验的问题是:
H0:πi=pi,i=1,⋯,dHa:πi≠pi,∃iH_0:\pi_i = p_i,i = 1,\cdots,d \\ H_a:\pi_i \ne p_i,\exists iH0​:πi​=pi​,i=1,⋯,dHa​:πi​​=pi​,∃i

假设每一种category的频数为n1,⋯,ndn_1,\cdots,n_dn1​,⋯,nd​,则category data的似然为
L(p1,⋯,pd)=∏i=1dpiniln⁡L(p1,⋯,pd)=∑i=1dniln⁡piL(p_1,\cdots,p_d) = \prod_{i=1}^d p_i^{n_i} \\ \ln L(p_1,\cdots,p_d) = \sum_{i=1}^dn_i\ln p_iL(p1​,⋯,pd​)=i=1∏d​pini​​lnL(p1​,⋯,pd​)=i=1∑d​ni​lnpi​

考虑pip_ipi​的MLE,
max⁡piln⁡L(p1,⋯,pd)=∑i=1dniln⁡pis.t.∑i=1dpi=1,pi≥0\max_{p_i} \ln L(p_1,\cdots,p_d) = \sum_{i=1}^dn_i\ln p_i \\ s.t.\ \sum_{i=1}^d p_i = 1,p_i \ge 0pi​max​lnL(p1​,⋯,pd​)=i=1∑d​ni​lnpi​s.t. i=1∑d​pi​=1,pi​≥0

定义
g(p1,⋯,pd,λ)=∑i=1dniln⁡pi−λ(∑i=1dpi−1)∂g∂pi=nipi−λ=0⇒pi=niλ⇒∑i=1dniλ=nλ=1g(p_1,\cdots,p_d,\lambda) = \sum_{i=1}^dn_i\ln p_i - \lambda(\sum_{i=1}^d p_i - 1) \\ \frac{\partial g}{\partial p_i} = \frac{n_i}{p_i} - \lambda = 0 \Rightarrow p_i = \frac{n_i}{\lambda}\Rightarrow \sum_{i=1}^d \frac{n_i}{\lambda} = \frac{n}{\lambda} = 1g(p1​,⋯,pd​,λ)=i=1∑d​ni​lnpi​−λ(i=1∑d​pi​−1)∂pi​∂g​=pi​ni​​−λ=0⇒pi​=λni​​⇒i=1∑d​λni​​=λn​=1

所以MLE为
p^i=nin\hat p_i = \frac{n_i}{n}p^​i​=nni​​

这个检验的似然比为
Λ(n)=∏i=1dπini∏i=1dp^ini=∏i=1d(nπini)ni\Lambda(n) = \frac{\prod_{i=1}^d \pi_i^{n_i}}{\prod_{i=1}^d \hat p_i^{n_i}} = \prod_{i=1}^d \left(\frac{ n\pi_i}{n_i} \right)^{n_i}Λ(n)=∏i=1d​p^​ini​​∏i=1d​πini​​​=i=1∏d​(ni​nπi​​)ni​

根据似然比检验的原理,当Λ(n)\Lambda(n)Λ(n)比较小的时候应该拒绝原假设。考虑统计量
−2ln⁡Λ(n)→dχd−12,asn→∞-2\ln \Lambda(n) \to_d \chi^2_{d-1},\ as\ n \to \infty−2lnΛ(n)→d​χd−12​, as n→∞

实际计算的时候会用近似:
−2ln⁡Λ(n)=2∑i=1dniln⁡ninπi-2\ln \Lambda(n) = 2\sum_{i=1}^d n_i \ln \frac{n_i}{n\pi_i}−2lnΛ(n)=2i=1∑d​ni​lnnπi​ni​​

定义Oi=ni,Ei=nπiO_i = n_i, E_i = n\pi_iOi​=ni​,Ei​=nπi​,OiO_iOi​是观测值,EiE_iEi​是理论值
−2ln⁡Λ(n)=2∑i=1dOiln⁡OiEi=∑i=1dln⁡(OiEi)2Oi=∑i=1dln⁡(1−Ei−OiEi)2Oi≈∑i=1d(Ei−OiEi)2-2\ln \Lambda(n) = 2\sum_{i=1}^d O_i \ln \frac{O_i}{E_i} = \sum_{i=1}^d \ln \left( \frac{O_i}{E_i} \right)^{2O_i} \\= \sum_{i=1}^d \ln \left(1- \frac{E_i-O_i}{E_i} \right)^{2O_i} \approx \sum_{i=1}^d \left( \frac{E_i-O_i}{E_i} \right)^2−2lnΛ(n)=2i=1∑d​Oi​lnEi​Oi​​=i=1∑d​ln(Ei​Oi​​)2Oi​=i=1∑d​ln(1−Ei​Ei​−Oi​​)2Oi​≈i=1∑d​(Ei​Ei​−Oi​​)2

因此卡方检验的统计量为
χ2=∑i=1d(Ei−OiEi)2∼χd−12\chi^2 = \sum_{i=1}^d \left( \frac{E_i-O_i}{E_i} \right)^2 \sim \chi^2_{d-1}χ2=i=1∑d​(Ei​Ei​−Oi​​)2∼χd−12​

UA MATH566 统计理论 推导卡方拟合优度检验相关推荐

  1. UA MATH566 统计理论7 还有一个例子:推导卡方检验

    UA MATH566 统计理论7 还有一个例子:推导卡方检验 均值已知 均值未知 前面的文章中我们已经推导了Z检验和T检验,Z检验是方差已知时比较单个或两个正态总体均值的方法:T检验是方差未知时比较单 ...

  2. UA MATH566 统计理论7 一个例子:推导T检验

    UA MATH566 统计理论7 一个例子:推导T检验 T检验在math 571A和math 571B中已经用的很多了,这里按前两讲介绍的假设检验的理论回顾一下T检验,看一下T检验是怎么用似然比检验的 ...

  3. UA MATH566 统计理论7: Multiple Test

    UA MATH566 统计理论7: Multiple Test Bonferroni调整 Benjamini-Hochberg方法 Fisher方法 False Discovery Rate Mult ...

  4. UA MATH566 统计理论 Bayes统计基础

    UA MATH566 统计理论 Bayes统计基础 共轭分布 基于后验概率预测新的观测值 Bayes统计思想的基础是Bayes公式 P(Ci∣A)=P(A,Ci)P(A)=P(A∣Ci)P(Ci)∑i ...

  5. UA MATH566 统计理论 Fisher信息论的性质下

    UA MATH566 统计理论 Fisher信息量的性质下 辅助统计量的Fisher信息为0 分布族参数变换后的Fisher信息 统计量的Fisher信息的有界性 下面介绍一些Fisher信息量的常用 ...

  6. UA MATH566 统计理论 Fisher信息量的性质上

    UA MATH566 统计理论 Fisher信息量的性质上 Fisher信息量的定义 Fisher信息量的数学意义 C-R下界是由Fisher统计量定义的,在推导C-R下界的时候,我们只是把下界的逆定 ...

  7. UA MATH566 统计理论 Cramer-Rao不等式与Delta方法的联系

    UA MATH566 统计理论 Cramer-Rao不等式与Delta方法的联系 Delta方法与C-R不等式基本概念回顾 Delta方法近似 C-R不等式近似 推导Delta方法与C-R不等式近似相 ...

  8. UA MATH566 统计理论 位置-尺度参数族

    UA MATH566 统计理论 位置-尺度参数族 对位置-尺度参数族做位置-尺度变换 对正态分布做位置-尺度变换 对Gamma分布做位置-尺度变换 对指数分布做位置尺度变换 对均匀分布做位置-尺度变换 ...

  9. UA MATH566 统计理论2 C-R不等式简介

    UA MATH566 统计理论2 C-R不等式 单个参数的情形 多个参数的情形 点估计基础那一篇讨论到UMVUE了,这一讲试图给出无偏估计方差的一个下界.在统计理论1中推导的Fisher信息其实就是一 ...

最新文章

  1. dsoframer控件注册,解注册和检查注册情况
  2. 108-学习如何格式化字符串
  3. KMP算法~看的清楚~
  4. jconsole工具检测堆内存变化
  5. 第三次学JAVA再学不好就吃翔(part104)--flush和close
  6. rails mysql查询_rails 对数据库的一些操作:新增,查询等
  7. IntelliJ IDEA中创建MyBatis.xml模板
  8. Proteus仿真错误解决方法:No power supply specified for net 5V in Power Rail Configuration.
  9. Android系统信息获取 之十二:获取屏幕分辨率及密度
  10. 单台服务器百万并发实现 C10K, C1000K, C10M
  11. win10输入法变成繁体字怎么办 - 如何关闭繁体,简体切换功能
  12. 计算机无法查看隐藏文件夹,电脑里的隐藏文件夹怎么显示不出来啊?
  13. 芭蕉树上第十六根芭蕉-- Qt中Ui名字空间以及setupUi函数的原理和实现
  14. 图像处理详解之图像透明度
  15. ACM大量习题题库及建议培养计划
  16. 分享一个颜色渐变的网站
  17. 免费下载国内各大音乐平台歌曲
  18. 星环科技:坚持国产自主路线,突破大数据的细分应用场景
  19. 汇编原理自我总结(一)
  20. 图片处理自带缓存的Picasso

热门文章

  1. Java实现算法导论中反复平方法模取幂
  2. Eureka 服务注册与发现01——单机版
  3. 函数的使用——未完待续
  4. 开关二极管的导通和截止条件
  5. 联合体在单片机中的应用
  6. CTFshow php特性 web126
  7. 【VS Code】更改默认的单击打开文档模式
  8. php el表达式,JSP EL表达式学习
  9. mysql conflicts with_安装MYSQL错误“conflicts with file from package mysql-libs-*” 解决方法...
  10. 【解决方案】“‘javac’不是内部或外部命令,也不是可运行的程序或批处理文件”