UA MATH566 统计理论7 另一个例子:二项检验

假设X1,X2,⋯,Xn∼Ber(p)X_1,X_2,\cdots,X_n \sim Ber(p)X1​,X2​,⋯,Xn​∼Ber(p),想根据这组样本做如下检验:
H0:p=p0Ha:p≠p0H_0:p=p_0 \\ H_a:p \ne p_0H0​:p=p0​Ha​:p​=p0​
参数空间为
Θ0={p=p0}Θa={p≠p0}\Theta_0 = \{p=p_0\} \\ \Theta_a = \{p \ne p_0\}Θ0​={p=p0​}Θa​={p​=p0​}
根据Karlin-Rubin定理,这个检验的UMP拒绝域为
C={X:λ(X)≤kα}C = \{X:\lambda(X) \le k_{\alpha}\}C={X:λ(X)≤kα​}
先计算样本的似然函数:
L(p∣X)=∏i=1npXi(1−p)1−Xi=p∑i=1nXi(1−p)n−∑i=1nXiL(p|X) = \prod_{i=1}^n p^{X_i} (1-p)^{1-X_i} = p^{\sum_{i=1}^n X_i} (1-p)^{n-\sum_{i=1}^n X_i}L(p∣X)=i=1∏n​pXi​(1−p)1−Xi​=p∑i=1n​Xi​(1−p)n−∑i=1n​Xi​
根据Neyman-Fisher因子定理,定义T(X)=∑i=1nXi=nXˉT(X)=\sum_{i=1}^n X_i=n\bar{X}T(X)=∑i=1n​Xi​=nXˉ,则T(X)T(X)T(X)是充分统计量。似然函数可以写成
L(p∣X)=∏i=1npXi(1−p)1−Xi=pT(X)(1−p)n−T(X)∂ln⁡L(p∣X)∂p=∂∂p[T(X)ln⁡p+(n−T(X))ln⁡(1−p)]=T(X)p−n−T(X)1−p=0L(p|X) = \prod_{i=1}^n p^{X_i} (1-p)^{1-X_i} = p^{T(X)} (1-p)^{n-T(X)} \\ \frac{\partial \ln L(p|X)}{\partial p} = \frac{\partial }{\partial p} [T(X)\ln p + (n-T(X))\ln(1-p)] \\ = \frac{T(X)}{p} - \frac{n-T(X)}{1-p} = 0L(p∣X)=i=1∏n​pXi​(1−p)1−Xi​=pT(X)(1−p)n−T(X)∂p∂lnL(p∣X)​=∂p∂​[T(X)lnp+(n−T(X))ln(1−p)]=pT(X)​−1−pn−T(X)​=0
因此p^=Xˉ\hat{p}=\bar{X}p^​=Xˉ是ppp的最大似然估计。计算似然比,
L(p0∣X)L(p^∣X)=(np0T(X))T(X)(n−np0n−T(X))n−T(X)\frac{L(p_0|X)}{L(\hat{p}|X)} = \left( \frac{np_0}{T(X)} \right)^{T(X)} \left( \frac{n-np_0}{n-T(X)} \right)^{n-T(X)}L(p^​∣X)L(p0​∣X)​=(T(X)np0​​)T(X)(n−T(X)n−np0​​)n−T(X)
记这个似然比的对数为g(T(X))g(T(X))g(T(X)),则
g(T(X))=T(X)(ln⁡np0−ln⁡T(X))+(n−T(X))(ln⁡(n−np0)−ln⁡(n−T(X)))dg(T(X))dT(X)=(ln⁡np0−ln⁡T(X))−1−(ln⁡(n−np0)−ln⁡(n−T(X)))+1=ln⁡np0(n−T(X))(n−np0)T(X)g(T(X)) = T(X)(\ln np_0 - \ln T(X)) + (n-T(X)) (\ln (n-np_0) - \ln (n-T(X))) \\ \frac{dg(T(X))}{dT(X)} = (\ln np_0 - \ln T(X)) - 1 - (\ln (n-np_0) - \ln (n-T(X))) + 1 \\ = \ln \frac{np_0 (n-T(X))}{(n-np_0)T(X)} g(T(X))=T(X)(lnnp0​−lnT(X))+(n−T(X))(ln(n−np0​)−ln(n−T(X)))dT(X)dg(T(X))​=(lnnp0​−lnT(X))−1−(ln(n−np0​)−ln(n−T(X)))+1=ln(n−np0​)T(X)np0​(n−T(X))​
考虑一个特殊情况,如果这个导数为正,则λ(X)<kα\lambda(X)<k_{\alpha}λ(X)<kα​等价于T(X)<cα,∃cαT(X)<c_{\alpha},\exists c_{\alpha}T(X)<cα​,∃cα​。拒绝域为
C={X:T(X)≤cα}C=\{X:T(X) \le c_{\alpha}\}C={X:T(X)≤cα​}
原假设下T(X)∼Binom(n,p0)T(X) \sim Binom(n,p_0)T(X)∼Binom(n,p0​),因此可以取cαc_{\alpha}cα​为Binom(n,p0)Binom(n,p_0)Binom(n,p0​)的左侧α\alphaα分位点,这个检验也由此得名二项检验(binomial test)。(R语言中可以用binom.test)

在这个特殊情况下,如果样本数量nnn足够大,根据中心极限定理
Z=Xˉ−pp(1−p)/n→dN(0,1)Z = \frac{\bar{X}-p}{\sqrt{p(1-p)/n}} \to_d N(0,1)Z=p(1−p)/n​Xˉ−p​→d​N(0,1)
Xˉ\bar{X}Xˉ是ppp的最大似然估计,也是充分统计量。可以根据ZZZ构造拒绝域:
C={X:∣Xˉ−p0p0(1−p0)/n∣≥zα/2}C = \{X:|\frac{\bar{X}-p_0}{\sqrt{p_0(1-p_0)/n}}| \ge z_{\alpha/2} \}C={X:∣p0​(1−p0​)/n​Xˉ−p0​​∣≥zα/2​}
其中zα/2z_{\alpha/2}zα/2​是标准正态分布的α/2\alpha/2α/2上分位点,这个检验叫做比例检验(proportion test),(R语言中可以用prop.test)。它的势函数为
Power=P(∣Z∣≤zα/2)=P(∣Xˉ−pp(1−p)/n∣≤zα/2)Power = P(|Z| \le z_{\alpha/2}) = P(|\frac{\bar{X}-p}{\sqrt{p(1-p)/n}}| \le z_{\alpha/2}) Power=P(∣Z∣≤zα/2​)=P(∣p(1−p)/n​Xˉ−p​∣≤zα/2​)
考虑
−zα/2≤Xˉ−p0p0(1−p0)/n≤zα/2p0−zα/2p0(1−p0)/n≤Xˉ≤p0+p0(1−p0)/np0−pp0(1−p0)/n−zα/2p0(1−p0)p(1−p)≤Z≤p0−pp0(1−p0)/n+zα/2p0(1−p0)p(1−p)-z_{\alpha/2} \le \frac{\bar{X}-p_0}{\sqrt{p_0(1-p_0)/n}} \le z_{\alpha/2} \\ p_0-z_{\alpha/2}\sqrt{p_0(1-p_0)/n} \le \bar{X} \le p_0 + \sqrt{p_0(1-p_0)/n} \\ \frac{p_0-p}{\sqrt{p_0(1-p_0)/n}} - z_{\alpha/2} \sqrt{\frac{p_0(1-p_0)}{p(1-p)}} \le Z \le \frac{p_0-p}{\sqrt{p_0(1-p_0)/n}} +z_{\alpha/2} \sqrt{\frac{p_0(1-p_0)}{p(1-p)}}−zα/2​≤p0​(1−p0​)/n​Xˉ−p0​​≤zα/2​p0​−zα/2​p0​(1−p0​)/n​≤Xˉ≤p0​+p0​(1−p0​)/n​p0​(1−p0​)/n​p0​−p​−zα/2​p(1−p)p0​(1−p0​)​​≤Z≤p0​(1−p0​)/n​p0​−p​+zα/2​p(1−p)p0​(1−p0​)​​
所以
Power=Φ(p0−pp0(1−p0)/n+zα/2p0(1−p0)p(1−p))−Φ(p0−pp0(1−p0)/n−zα/2p0(1−p0)p(1−p))Power = \Phi(\frac{p_0-p}{\sqrt{p_0(1-p_0)/n}} +z_{\alpha/2} \sqrt{\frac{p_0(1-p_0)}{p(1-p)}}) - \Phi(\frac{p_0-p}{\sqrt{p_0(1-p_0)/n}} - z_{\alpha/2} \sqrt{\frac{p_0(1-p_0)}{p(1-p)}})Power=Φ(p0​(1−p0​)/n​p0​−p​+zα/2​p(1−p)p0​(1−p0​)​​)−Φ(p0​(1−p0​)/n​p0​−p​−zα/2​p(1−p)p0​(1−p0​)​​)

UA MATH566 统计理论7 另一个例子:二项检验相关推荐

  1. UA MATH566 统计理论7 还有一个例子:推导卡方检验

    UA MATH566 统计理论7 还有一个例子:推导卡方检验 均值已知 均值未知 前面的文章中我们已经推导了Z检验和T检验,Z检验是方差已知时比较单个或两个正态总体均值的方法:T检验是方差未知时比较单 ...

  2. UA MATH566 统计理论7 一个例子:推导T检验

    UA MATH566 统计理论7 一个例子:推导T检验 T检验在math 571A和math 571B中已经用的很多了,这里按前两讲介绍的假设检验的理论回顾一下T检验,看一下T检验是怎么用似然比检验的 ...

  3. UA MATH566 统计理论 一个例题 Hierarchical Model的统计性质

    UA MATH566 统计理论 一个例题 Hierarchical Model的统计性质 Y∣X∼Pois(X)Y|X \sim Pois(X)Y∣X∼Pois(X) and X∼Γ(α,β)X \s ...

  4. UA MATH566 统计理论 Bayes统计基础

    UA MATH566 统计理论 Bayes统计基础 共轭分布 基于后验概率预测新的观测值 Bayes统计思想的基础是Bayes公式 P(Ci∣A)=P(A,Ci)P(A)=P(A∣Ci)P(Ci)∑i ...

  5. UA MATH566 统计理论 位置-尺度参数族

    UA MATH566 统计理论 位置-尺度参数族 对位置-尺度参数族做位置-尺度变换 对正态分布做位置-尺度变换 对Gamma分布做位置-尺度变换 对指数分布做位置尺度变换 对均匀分布做位置-尺度变换 ...

  6. UA MATH566 统计理论 截断数据

    UA MATH566 统计理论 截断数据 Truncated Left-Trancated Right-Truncated 一个例子:双截断正态分布 双截断正态分布的完备最小充分统计量 这一讲介绍随机 ...

  7. UA MATH566 统计理论10 Bootstrap简介

    UA MATH566 统计理论10 Bootstrap简介 Bootstrap是用来替代基于CDF的一些统计计算的手段:当真实的CDF(记为F∈FF \in \mathbb{F}F∈F,F\mathb ...

  8. UA MATH566 统计理论8 置信区间简介

    UA MATH566 统计理论8 置信区间简介 例1:单个正态总体均值的置信区间(方差已知) 例2:单个正态总体均值的置信区间(方差未知) 假设检验与置信区间的关系 例3:根据单边检验导出单边置信区间 ...

  9. UA MATH566 统计理论5 假设检验简介

    UA MATH566 统计理论5 假设检验简介 Neyman-Pearson Lemma 一个例子 构造拒绝域 分析检验的势 ROC曲线 这一讲根据最简单的一类假设检验介绍假设检验的思想.假设θ0,θ ...

最新文章

  1. 基础设计模式:单例模式+工厂模式+注册树模式
  2. Oracle 行转列
  3. Eclipse导入项目常见问题----乱码问题03
  4. python面向对象(part2)--封装
  5. Angular gitlab持续集成之runner配置
  6. VMware-workstation-full-8.0.0-471780.exe
  7. CSS3 之 flex
  8. linux 链表头文件,Linux下单链表的实现
  9. Could not mount the media/drive ‘D:\......./VBoxGuestAdditions.iso‘ (VERR_PDM_MEDIA_LOCKED)
  10. 和利时服务器通信协议,和利时网关UDP通信协议.pdf
  11. Go语言web开发学习
  12. U盘修复,写保护,这个必须推荐!安国(Alcor)AU6983 4G U盘写保护修复记
  13. Unity UGUI 屏幕适配
  14. 关于“调包”,职业调包侠在此!
  15. 1167 Cartesian Tree
  16. RegNet: Designing Network Design Spaces
  17. android 头像高斯模糊,Android 高斯模糊头像
  18. 判断内存条参数信息 版本 频率,以及主板最大支持内存
  19. HTML外边框塌陷什么意思,html-margin塌陷 :
  20. SRA Toolkit - prefetch

热门文章

  1. Leetcode 94. 二叉树的中序遍历 解题思路及C++实现
  2. 数据结构源码笔记(C语言):链接队列
  3. 利用KMP算法判断一个树是否是另一个树的子树
  4. Android中BaseAdapter使用总结(imooc笔记)
  5. 电脑的cpu是怎么制作的?
  6. 父类卡子类卡java_Java中关于子类覆盖父类的抛出异常问题
  7. 用javascript伪造太阳系模型系统
  8. boxfilter 函数
  9. android网页无法定位吗,在android中,js 无法定位 html页面的某元素
  10. maven java 目录结构_java – 为maven目录结构生成的源文件的位置