UA MATH566 统计理论7 另一个例子:二项检验
UA MATH566 统计理论7 另一个例子:二项检验
假设X1,X2,⋯,Xn∼Ber(p)X_1,X_2,\cdots,X_n \sim Ber(p)X1,X2,⋯,Xn∼Ber(p),想根据这组样本做如下检验:
H0:p=p0Ha:p≠p0H_0:p=p_0 \\ H_a:p \ne p_0H0:p=p0Ha:p=p0
参数空间为
Θ0={p=p0}Θa={p≠p0}\Theta_0 = \{p=p_0\} \\ \Theta_a = \{p \ne p_0\}Θ0={p=p0}Θa={p=p0}
根据Karlin-Rubin定理,这个检验的UMP拒绝域为
C={X:λ(X)≤kα}C = \{X:\lambda(X) \le k_{\alpha}\}C={X:λ(X)≤kα}
先计算样本的似然函数:
L(p∣X)=∏i=1npXi(1−p)1−Xi=p∑i=1nXi(1−p)n−∑i=1nXiL(p|X) = \prod_{i=1}^n p^{X_i} (1-p)^{1-X_i} = p^{\sum_{i=1}^n X_i} (1-p)^{n-\sum_{i=1}^n X_i}L(p∣X)=i=1∏npXi(1−p)1−Xi=p∑i=1nXi(1−p)n−∑i=1nXi
根据Neyman-Fisher因子定理,定义T(X)=∑i=1nXi=nXˉT(X)=\sum_{i=1}^n X_i=n\bar{X}T(X)=∑i=1nXi=nXˉ,则T(X)T(X)T(X)是充分统计量。似然函数可以写成
L(p∣X)=∏i=1npXi(1−p)1−Xi=pT(X)(1−p)n−T(X)∂lnL(p∣X)∂p=∂∂p[T(X)lnp+(n−T(X))ln(1−p)]=T(X)p−n−T(X)1−p=0L(p|X) = \prod_{i=1}^n p^{X_i} (1-p)^{1-X_i} = p^{T(X)} (1-p)^{n-T(X)} \\ \frac{\partial \ln L(p|X)}{\partial p} = \frac{\partial }{\partial p} [T(X)\ln p + (n-T(X))\ln(1-p)] \\ = \frac{T(X)}{p} - \frac{n-T(X)}{1-p} = 0L(p∣X)=i=1∏npXi(1−p)1−Xi=pT(X)(1−p)n−T(X)∂p∂lnL(p∣X)=∂p∂[T(X)lnp+(n−T(X))ln(1−p)]=pT(X)−1−pn−T(X)=0
因此p^=Xˉ\hat{p}=\bar{X}p^=Xˉ是ppp的最大似然估计。计算似然比,
L(p0∣X)L(p^∣X)=(np0T(X))T(X)(n−np0n−T(X))n−T(X)\frac{L(p_0|X)}{L(\hat{p}|X)} = \left( \frac{np_0}{T(X)} \right)^{T(X)} \left( \frac{n-np_0}{n-T(X)} \right)^{n-T(X)}L(p^∣X)L(p0∣X)=(T(X)np0)T(X)(n−T(X)n−np0)n−T(X)
记这个似然比的对数为g(T(X))g(T(X))g(T(X)),则
g(T(X))=T(X)(lnnp0−lnT(X))+(n−T(X))(ln(n−np0)−ln(n−T(X)))dg(T(X))dT(X)=(lnnp0−lnT(X))−1−(ln(n−np0)−ln(n−T(X)))+1=lnnp0(n−T(X))(n−np0)T(X)g(T(X)) = T(X)(\ln np_0 - \ln T(X)) + (n-T(X)) (\ln (n-np_0) - \ln (n-T(X))) \\ \frac{dg(T(X))}{dT(X)} = (\ln np_0 - \ln T(X)) - 1 - (\ln (n-np_0) - \ln (n-T(X))) + 1 \\ = \ln \frac{np_0 (n-T(X))}{(n-np_0)T(X)} g(T(X))=T(X)(lnnp0−lnT(X))+(n−T(X))(ln(n−np0)−ln(n−T(X)))dT(X)dg(T(X))=(lnnp0−lnT(X))−1−(ln(n−np0)−ln(n−T(X)))+1=ln(n−np0)T(X)np0(n−T(X))
考虑一个特殊情况,如果这个导数为正,则λ(X)<kα\lambda(X)<k_{\alpha}λ(X)<kα等价于T(X)<cα,∃cαT(X)<c_{\alpha},\exists c_{\alpha}T(X)<cα,∃cα。拒绝域为
C={X:T(X)≤cα}C=\{X:T(X) \le c_{\alpha}\}C={X:T(X)≤cα}
原假设下T(X)∼Binom(n,p0)T(X) \sim Binom(n,p_0)T(X)∼Binom(n,p0),因此可以取cαc_{\alpha}cα为Binom(n,p0)Binom(n,p_0)Binom(n,p0)的左侧α\alphaα分位点,这个检验也由此得名二项检验(binomial test)。(R语言中可以用binom.test)
在这个特殊情况下,如果样本数量nnn足够大,根据中心极限定理
Z=Xˉ−pp(1−p)/n→dN(0,1)Z = \frac{\bar{X}-p}{\sqrt{p(1-p)/n}} \to_d N(0,1)Z=p(1−p)/nXˉ−p→dN(0,1)
Xˉ\bar{X}Xˉ是ppp的最大似然估计,也是充分统计量。可以根据ZZZ构造拒绝域:
C={X:∣Xˉ−p0p0(1−p0)/n∣≥zα/2}C = \{X:|\frac{\bar{X}-p_0}{\sqrt{p_0(1-p_0)/n}}| \ge z_{\alpha/2} \}C={X:∣p0(1−p0)/nXˉ−p0∣≥zα/2}
其中zα/2z_{\alpha/2}zα/2是标准正态分布的α/2\alpha/2α/2上分位点,这个检验叫做比例检验(proportion test),(R语言中可以用prop.test)。它的势函数为
Power=P(∣Z∣≤zα/2)=P(∣Xˉ−pp(1−p)/n∣≤zα/2)Power = P(|Z| \le z_{\alpha/2}) = P(|\frac{\bar{X}-p}{\sqrt{p(1-p)/n}}| \le z_{\alpha/2}) Power=P(∣Z∣≤zα/2)=P(∣p(1−p)/nXˉ−p∣≤zα/2)
考虑
−zα/2≤Xˉ−p0p0(1−p0)/n≤zα/2p0−zα/2p0(1−p0)/n≤Xˉ≤p0+p0(1−p0)/np0−pp0(1−p0)/n−zα/2p0(1−p0)p(1−p)≤Z≤p0−pp0(1−p0)/n+zα/2p0(1−p0)p(1−p)-z_{\alpha/2} \le \frac{\bar{X}-p_0}{\sqrt{p_0(1-p_0)/n}} \le z_{\alpha/2} \\ p_0-z_{\alpha/2}\sqrt{p_0(1-p_0)/n} \le \bar{X} \le p_0 + \sqrt{p_0(1-p_0)/n} \\ \frac{p_0-p}{\sqrt{p_0(1-p_0)/n}} - z_{\alpha/2} \sqrt{\frac{p_0(1-p_0)}{p(1-p)}} \le Z \le \frac{p_0-p}{\sqrt{p_0(1-p_0)/n}} +z_{\alpha/2} \sqrt{\frac{p_0(1-p_0)}{p(1-p)}}−zα/2≤p0(1−p0)/nXˉ−p0≤zα/2p0−zα/2p0(1−p0)/n≤Xˉ≤p0+p0(1−p0)/np0(1−p0)/np0−p−zα/2p(1−p)p0(1−p0)≤Z≤p0(1−p0)/np0−p+zα/2p(1−p)p0(1−p0)
所以
Power=Φ(p0−pp0(1−p0)/n+zα/2p0(1−p0)p(1−p))−Φ(p0−pp0(1−p0)/n−zα/2p0(1−p0)p(1−p))Power = \Phi(\frac{p_0-p}{\sqrt{p_0(1-p_0)/n}} +z_{\alpha/2} \sqrt{\frac{p_0(1-p_0)}{p(1-p)}}) - \Phi(\frac{p_0-p}{\sqrt{p_0(1-p_0)/n}} - z_{\alpha/2} \sqrt{\frac{p_0(1-p_0)}{p(1-p)}})Power=Φ(p0(1−p0)/np0−p+zα/2p(1−p)p0(1−p0))−Φ(p0(1−p0)/np0−p−zα/2p(1−p)p0(1−p0))
UA MATH566 统计理论7 另一个例子:二项检验相关推荐
- UA MATH566 统计理论7 还有一个例子:推导卡方检验
UA MATH566 统计理论7 还有一个例子:推导卡方检验 均值已知 均值未知 前面的文章中我们已经推导了Z检验和T检验,Z检验是方差已知时比较单个或两个正态总体均值的方法:T检验是方差未知时比较单 ...
- UA MATH566 统计理论7 一个例子:推导T检验
UA MATH566 统计理论7 一个例子:推导T检验 T检验在math 571A和math 571B中已经用的很多了,这里按前两讲介绍的假设检验的理论回顾一下T检验,看一下T检验是怎么用似然比检验的 ...
- UA MATH566 统计理论 一个例题 Hierarchical Model的统计性质
UA MATH566 统计理论 一个例题 Hierarchical Model的统计性质 Y∣X∼Pois(X)Y|X \sim Pois(X)Y∣X∼Pois(X) and X∼Γ(α,β)X \s ...
- UA MATH566 统计理论 Bayes统计基础
UA MATH566 统计理论 Bayes统计基础 共轭分布 基于后验概率预测新的观测值 Bayes统计思想的基础是Bayes公式 P(Ci∣A)=P(A,Ci)P(A)=P(A∣Ci)P(Ci)∑i ...
- UA MATH566 统计理论 位置-尺度参数族
UA MATH566 统计理论 位置-尺度参数族 对位置-尺度参数族做位置-尺度变换 对正态分布做位置-尺度变换 对Gamma分布做位置-尺度变换 对指数分布做位置尺度变换 对均匀分布做位置-尺度变换 ...
- UA MATH566 统计理论 截断数据
UA MATH566 统计理论 截断数据 Truncated Left-Trancated Right-Truncated 一个例子:双截断正态分布 双截断正态分布的完备最小充分统计量 这一讲介绍随机 ...
- UA MATH566 统计理论10 Bootstrap简介
UA MATH566 统计理论10 Bootstrap简介 Bootstrap是用来替代基于CDF的一些统计计算的手段:当真实的CDF(记为F∈FF \in \mathbb{F}F∈F,F\mathb ...
- UA MATH566 统计理论8 置信区间简介
UA MATH566 统计理论8 置信区间简介 例1:单个正态总体均值的置信区间(方差已知) 例2:单个正态总体均值的置信区间(方差未知) 假设检验与置信区间的关系 例3:根据单边检验导出单边置信区间 ...
- UA MATH566 统计理论5 假设检验简介
UA MATH566 统计理论5 假设检验简介 Neyman-Pearson Lemma 一个例子 构造拒绝域 分析检验的势 ROC曲线 这一讲根据最简单的一类假设检验介绍假设检验的思想.假设θ0,θ ...
最新文章
- 基础设计模式:单例模式+工厂模式+注册树模式
- Oracle 行转列
- Eclipse导入项目常见问题----乱码问题03
- python面向对象(part2)--封装
- Angular gitlab持续集成之runner配置
- VMware-workstation-full-8.0.0-471780.exe
- CSS3 之 flex
- linux 链表头文件,Linux下单链表的实现
- Could not mount the media/drive ‘D:\......./VBoxGuestAdditions.iso‘ (VERR_PDM_MEDIA_LOCKED)
- 和利时服务器通信协议,和利时网关UDP通信协议.pdf
- Go语言web开发学习
- U盘修复,写保护,这个必须推荐!安国(Alcor)AU6983 4G U盘写保护修复记
- Unity UGUI 屏幕适配
- 关于“调包”,职业调包侠在此!
- 1167 Cartesian Tree
- RegNet: Designing Network Design Spaces
- android 头像高斯模糊,Android 高斯模糊头像
- 判断内存条参数信息 版本 频率,以及主板最大支持内存
- HTML外边框塌陷什么意思,html-margin塌陷 :
- SRA Toolkit - prefetch
热门文章
- Leetcode 94. 二叉树的中序遍历 解题思路及C++实现
- 数据结构源码笔记(C语言):链接队列
- 利用KMP算法判断一个树是否是另一个树的子树
- Android中BaseAdapter使用总结(imooc笔记)
- 电脑的cpu是怎么制作的?
- 父类卡子类卡java_Java中关于子类覆盖父类的抛出异常问题
- 用javascript伪造太阳系模型系统
- boxfilter 函数
- android网页无法定位吗,在android中,js 无法定位 html页面的某元素
- maven java 目录结构_java – 为maven目录结构生成的源文件的位置