UA MATH566 统计理论7 另一个例子：二项检验

假设X1,X2,⋯,Xn∼Ber(p)X_1,X_2,\cdots,X_n \sim Ber(p)X1,X2,⋯,Xn∼Ber(p)，想根据这组样本做如下检验：
H0:p=p0Ha:p≠p0H_0:p=p_0 \\ H_a:p \ne p_0H0:p=p0Ha:p=p0
参数空间为
Θ0={p=p0}Θa={p≠p0}\Theta_0 = \{p=p_0\} \\ \Theta_a = \{p \ne p_0\}Θ0={p=p0}Θa={p=p0}
根据Karlin-Rubin定理，这个检验的UMP拒绝域为
C={X:λ(X)≤kα}C = \{X:\lambda(X) \le k_{\alpha}\}C={X:λ(X)≤kα}
先计算样本的似然函数：
L(p∣X)=∏i=1npXi(1−p)1−Xi=p∑i=1nXi(1−p)n−∑i=1nXiL(p|X) = \prod_{i=1}^n p^{X_i} (1-p)^{1-X_i} = p^{\sum_{i=1}^n X_i} (1-p)^{n-\sum_{i=1}^n X_i}L(p∣X)=i=1∏npXi(1−p)1−Xi=p∑i=1nXi(1−p)n−∑i=1nXi
根据Neyman-Fisher因子定理，定义T(X)=∑i=1nXi=nXˉT(X)=\sum_{i=1}^n X_i=n\bar{X}T(X)=∑i=1nXi=nXˉ，则T(X)T(X)T(X)是充分统计量。似然函数可以写成
L(p∣X)=∏i=1npXi(1−p)1−Xi=pT(X)(1−p)n−T(X)∂ln⁡L(p∣X)∂p=∂∂p[T(X)ln⁡p+(n−T(X))ln⁡(1−p)]=T(X)p−n−T(X)1−p=0L(p|X) = \prod_{i=1}^n p^{X_i} (1-p)^{1-X_i} = p^{T(X)} (1-p)^{n-T(X)} \\ \frac{\partial \ln L(p|X)}{\partial p} = \frac{\partial }{\partial p} [T(X)\ln p + (n-T(X))\ln(1-p)] \\ = \frac{T(X)}{p} - \frac{n-T(X)}{1-p} = 0L(p∣X)=i=1∏npXi(1−p)1−Xi=pT(X)(1−p)n−T(X)∂p∂lnL(p∣X)=∂p∂[T(X)lnp+(n−T(X))ln(1−p)]=pT(X)−1−pn−T(X)=0
因此p^=Xˉ\hat{p}=\bar{X}p^=Xˉ是ppp的最大似然估计。计算似然比，
L(p0∣X)L(p^∣X)=(np0T(X))T(X)(n−np0n−T(X))n−T(X)\frac{L(p_0|X)}{L(\hat{p}|X)} = \left( \frac{np_0}{T(X)} \right)^{T(X)} \left( \frac{n-np_0}{n-T(X)} \right)^{n-T(X)}L(p^∣X)L(p0∣X)=(T(X)np0)T(X)(n−T(X)n−np0)n−T(X)
记这个似然比的对数为g(T(X))g(T(X))g(T(X))，则
g(T(X))=T(X)(ln⁡np0−ln⁡T(X))+(n−T(X))(ln⁡(n−np0)−ln⁡(n−T(X)))dg(T(X))dT(X)=(ln⁡np0−ln⁡T(X))−1−(ln⁡(n−np0)−ln⁡(n−T(X)))+1=ln⁡np0(n−T(X))(n−np0)T(X)g(T(X)) = T(X)(\ln np_0 - \ln T(X)) + (n-T(X)) (\ln (n-np_0) - \ln (n-T(X))) \\ \frac{dg(T(X))}{dT(X)} = (\ln np_0 - \ln T(X)) - 1 - (\ln (n-np_0) - \ln (n-T(X))) + 1 \\ = \ln \frac{np_0 (n-T(X))}{(n-np_0)T(X)} g(T(X))=T(X)(lnnp0−lnT(X))+(n−T(X))(ln(n−np0)−ln(n−T(X)))dT(X)dg(T(X))=(lnnp0−lnT(X))−1−(ln(n−np0)−ln(n−T(X)))+1=ln(n−np0)T(X)np0(n−T(X))
考虑一个特殊情况，如果这个导数为正，则λ(X)<kα\lambda(X)<k_{\alpha}λ(X)<kα等价于T(X)<cα,∃cαT(X)<c_{\alpha},\exists c_{\alpha}T(X)<cα,∃cα。拒绝域为
C={X:T(X)≤cα}C=\{X:T(X) \le c_{\alpha}\}C={X:T(X)≤cα}
原假设下T(X)∼Binom(n,p0)T(X) \sim Binom(n,p_0)T(X)∼Binom(n,p0)，因此可以取cαc_{\alpha}cα为Binom(n,p0)Binom(n,p_0)Binom(n,p0)的左侧α\alphaα分位点，这个检验也由此得名二项检验（binomial test）。（R语言中可以用binom.test）

在这个特殊情况下，如果样本数量nnn足够大，根据中心极限定理
Z=Xˉ−pp(1−p)/n→dN(0,1)Z = \frac{\bar{X}-p}{\sqrt{p(1-p)/n}} \to_d N(0,1)Z=p(1−p)/nXˉ−p→dN(0,1)
Xˉ\bar{X}Xˉ是ppp的最大似然估计，也是充分统计量。可以根据ZZZ构造拒绝域：
C={X:∣Xˉ−p0p0(1−p0)/n∣≥zα/2}C = \{X:|\frac{\bar{X}-p_0}{\sqrt{p_0(1-p_0)/n}}| \ge z_{\alpha/2} \}C={X:∣p0(1−p0)/nXˉ−p0∣≥zα/2}
其中zα/2z_{\alpha/2}zα/2是标准正态分布的α/2\alpha/2α/2上分位点，这个检验叫做比例检验（proportion test），（R语言中可以用prop.test）。它的势函数为
Power=P(∣Z∣≤zα/2)=P(∣Xˉ−pp(1−p)/n∣≤zα/2)Power = P(|Z| \le z_{\alpha/2}) = P(|\frac{\bar{X}-p}{\sqrt{p(1-p)/n}}| \le z_{\alpha/2}) Power=P(∣Z∣≤zα/2)=P(∣p(1−p)/nXˉ−p∣≤zα/2)
考虑
−zα/2≤Xˉ−p0p0(1−p0)/n≤zα/2p0−zα/2p0(1−p0)/n≤Xˉ≤p0+p0(1−p0)/np0−pp0(1−p0)/n−zα/2p0(1−p0)p(1−p)≤Z≤p0−pp0(1−p0)/n+zα/2p0(1−p0)p(1−p)-z_{\alpha/2} \le \frac{\bar{X}-p_0}{\sqrt{p_0(1-p_0)/n}} \le z_{\alpha/2} \\ p_0-z_{\alpha/2}\sqrt{p_0(1-p_0)/n} \le \bar{X} \le p_0 + \sqrt{p_0(1-p_0)/n} \\ \frac{p_0-p}{\sqrt{p_0(1-p_0)/n}} - z_{\alpha/2} \sqrt{\frac{p_0(1-p_0)}{p(1-p)}} \le Z \le \frac{p_0-p}{\sqrt{p_0(1-p_0)/n}} +z_{\alpha/2} \sqrt{\frac{p_0(1-p_0)}{p(1-p)}}−zα/2≤p0(1−p0)/nXˉ−p0≤zα/2p0−zα/2p0(1−p0)/n≤Xˉ≤p0+p0(1−p0)/np0(1−p0)/np0−p−zα/2p(1−p)p0(1−p0)≤Z≤p0(1−p0)/np0−p+zα/2p(1−p)p0(1−p0)
所以
Power=Φ(p0−pp0(1−p0)/n+zα/2p0(1−p0)p(1−p))−Φ(p0−pp0(1−p0)/n−zα/2p0(1−p0)p(1−p))Power = \Phi(\frac{p_0-p}{\sqrt{p_0(1-p_0)/n}} +z_{\alpha/2} \sqrt{\frac{p_0(1-p_0)}{p(1-p)}}) - \Phi(\frac{p_0-p}{\sqrt{p_0(1-p_0)/n}} - z_{\alpha/2} \sqrt{\frac{p_0(1-p_0)}{p(1-p)}})Power=Φ(p0(1−p0)/np0−p+zα/2p(1−p)p0(1−p0))−Φ(p0(1−p0)/np0−p−zα/2p(1−p)p0(1−p0))

UA MATH566 统计理论7 另一个例子：二项检验相关推荐

UA MATH566 统计理论7 还有一个例子：推导卡方检验
UA MATH566 统计理论7 还有一个例子:推导卡方检验均值已知均值未知前面的文章中我们已经推导了Z检验和T检验,Z检验是方差已知时比较单个或两个正态总体均值的方法:T检验是方差未知时比较单 ...
UA MATH566 统计理论7 一个例子：推导T检验
UA MATH566 统计理论7 一个例子:推导T检验 T检验在math 571A和math 571B中已经用的很多了,这里按前两讲介绍的假设检验的理论回顾一下T检验,看一下T检验是怎么用似然比检验的 ...
UA MATH566 统计理论一个例题 Hierarchical Model的统计性质
UA MATH566 统计理论一个例题 Hierarchical Model的统计性质 Y∣X∼Pois(X)Y|X \sim Pois(X)Y∣X∼Pois(X) and X∼Γ(α,β)X \s ...
UA MATH566 统计理论 Bayes统计基础
UA MATH566 统计理论 Bayes统计基础共轭分布基于后验概率预测新的观测值 Bayes统计思想的基础是Bayes公式 P(Ci∣A)=P(A,Ci)P(A)=P(A∣Ci)P(Ci)∑i ...
UA MATH566 统计理论位置-尺度参数族
UA MATH566 统计理论位置-尺度参数族对位置-尺度参数族做位置-尺度变换对正态分布做位置-尺度变换对Gamma分布做位置-尺度变换对指数分布做位置尺度变换对均匀分布做位置-尺度变换 ...
UA MATH566 统计理论截断数据
UA MATH566 统计理论截断数据 Truncated Left-Trancated Right-Truncated 一个例子:双截断正态分布双截断正态分布的完备最小充分统计量这一讲介绍随机 ...
UA MATH566 统计理论10 Bootstrap简介
UA MATH566 统计理论10 Bootstrap简介 Bootstrap是用来替代基于CDF的一些统计计算的手段:当真实的CDF(记为F∈FF \in \mathbb{F}F∈F,F\mathb ...
UA MATH566 统计理论8 置信区间简介
UA MATH566 统计理论8 置信区间简介例1:单个正态总体均值的置信区间(方差已知) 例2:单个正态总体均值的置信区间(方差未知) 假设检验与置信区间的关系例3:根据单边检验导出单边置信区间 ...
UA MATH566 统计理论5 假设检验简介
UA MATH566 统计理论5 假设检验简介 Neyman-Pearson Lemma 一个例子构造拒绝域分析检验的势 ROC曲线这一讲根据最简单的一类假设检验介绍假设检验的思想.假设θ0,θ ...

UA MATH566 统计理论7 另一个例子：二项检验

UA MATH566 统计理论7 另一个例子：二项检验

UA MATH566 统计理论7 另一个例子：二项检验相关推荐

最新文章

热门文章