【概率论与数理统计(研究生课程)】知识点总结8(假设检验)

原文地址：【概率论与数理统计(研究生课程)】知识点总结8(假设检验)

假设检验
- 依据
- 方法(概率论反证法)
- 逻辑
两类错误
- 第一类错误
- 第二类错误
解题步骤
- 以单正态总体均值 μ \mu μ双边检验为例，方差 σ \sigma σ已知，显著水平 1 − α 1-\alpha 1−α
- 以单正态总体均值 μ \mu μ左边检验为例，方差 σ \sigma σ已知，显著水平 1 − α 1-\alpha 1−α
- 以单正态总体均值 μ \mu μ右边检验为例，方差 σ \sigma σ已知，显著水平 1 − α 1-\alpha 1−α
单正态总体均值假设检验，方差未知
单正态总体假设检验，均值未知
两个正态总体参数的假设检验，检验两正态总体均值相等
两正态总体均值之差的假设检验，方差未知
两正态总体方差相等的假设检验，均值未知
大子样总体均值的假设检验
大子样总体均值相等的假设检验
非正态总体的参数假设检验
- 0-1分布
非正态总体均值的假设检验
两个非正态筒体均值的假设检验
分布拟合检验卡方检验法
独立性检验(相关性检验)

假设检验

依据

小概率原理： 小概率事件在一次试验中几乎不会发生（实际推断原理）

小概率事件在一次试验中发生的概率记为 α \alpha α， α \alpha α为显著水平，检验水平

方法(概率论反证法)

先对关心问题提出原假设 H 0 H_0 H0和备择假设
运用样本信息看在 H 0 H_0 H0成立下会不会矛盾
最后对 H 0 H_0 H0成立与否做出判断：
若小概率事件发生，则否定 H 0 H_0 H0；否则接受 H 0 H_0 H0

逻辑

小概率事件在一次试验中居然发生，就可以以很大把握否定原假设。

注意：不否定 H 0 H_0 H0并不是肯定 H 0 H_0 H0一定对，而是说差异不够显著，没有达到足以否定 H 0 H_0 H0的程度

两类错误

第一类错误

记事件 A A A为犯第一类错误
P { A } = P { reject H 0 ∣ H 0 is true } = α P\{A\}=P\{\text{reject } H_0 | H_0\text{ is true}\}=\alpha P{A}=P{reject H0∣H0 is true}=α

第二类错误

记事件 B B B为犯第二类错误
P { B } = P { accept H 0 ∣ H 0 is false } = β β = ∫ μ 0 − U α 2 σ n μ 0 + U α 2 σ n 1 2 π σ n e − ( x ˉ − μ 1 ) 2 2 σ 2 n d x ˉ = Φ ( μ 0 − μ 1 σ / n + U α 2 ) − Φ ( μ 0 − μ 1 σ / n − U α 2 ) \begin{aligned} P\{B\}&=P\{\text{accept } H_0 | H_0\text{ is false}\}=\beta \\ \beta&=\int\limits_{\mu_0-U_{\frac{\alpha}{2}}\frac{\sigma}{\sqrt{n}}}^{\mu_0+U_{\frac{\alpha}{2}}\frac{\sigma}{\sqrt{n}}}\frac{1}{\sqrt{2\pi}\frac{\sigma}{\sqrt{n}}}e^{-\frac{(\bar{x}-\mu_1)^2}{2\frac{\sigma^2}{n}}}d\bar{x} \\ &=\Phi(\frac{\mu_0-\mu_1}{\sigma/\sqrt{n}}+U_{\frac{\alpha}{2}})-\Phi(\frac{\mu_0-\mu_1}{\sigma/\sqrt{n}}-U_{\frac{\alpha}{2}}) \end{aligned} P{B}β=P{accept H0∣H0 is false}=β=μ0−U2αn σ∫μ0+U2αn σ2π n σ1e−2nσ2(xˉ−μ1)2dxˉ=Φ(σ/n μ0−μ1+U2α)−Φ(σ/n μ0−μ1−U2α)

当样本容量固定式，一类错误概率减少导致另一类错误概率增加。 α \alpha α减少，区间长度 2 U α 2 σ n 2U_{\frac{\alpha}{2}}\frac{\sigma}{\sqrt{n}} 2U2αn σ变长，则 β \beta β变大。

要同时降低两类错误的概率，或在 α \alpha α不变时降低 β \beta β，需要增加样本容量。

显著性检验只对犯第一类错误的概率加以控制，而不考虑犯第二类错误的概率

解题步骤

以单正态总体均值 μ \mu μ双边检验为例，方差 σ \sigma σ已知，显著水平 1 − α 1-\alpha 1−α

提出原假设和备择假设：
H 0 : μ = μ 0 ; H 1 : μ ≠ μ 0 H_0:\mu=\mu_0;\quad H_1:\mu \neq\mu_0 H0:μ=μ0;H1:μ=μ0
选取统计量
U = X ˉ − μ 0 σ / n ∼ N ( 0 , 1 ) U=\frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}} \sim N(0,1) U=σ/n Xˉ−μ0∼N(0,1)
写出拒绝域
∣ U ∣ = ∣ X ˉ − μ 0 σ / n ∣ ≥ Z α 2 |U|=|\frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}}| \ge Z_{\frac{\alpha}{2}} ∣U∣=∣σ/n Xˉ−μ0∣≥Z2α
确定 Z α 2 Z_{\frac{\alpha}{2}} Z2α
计算 ∣ U ∣ |U| ∣U∣
判断结果
∣ U ∣ ≥ Z α 2 reject H 0 ∣ U ∣ < Z α 2 accept H 0 \begin{aligned} |U|\ge Z_{\frac{\alpha}{2}} \quad \text{reject } H_0 \\ |U|< Z_{\frac{\alpha}{2}} \quad \text{accept } H_0 \end{aligned} ∣U∣≥Z2αreject H0∣U∣<Z2αaccept H0

以单正态总体均值 μ \mu μ左边检验为例，方差 σ \sigma σ已知，显著水平 1 − α 1-\alpha 1−α

提出原假设和备择假设：
H 0 : μ ≥ μ 0 ; H 1 : μ < μ 0 H_0:\mu\ge\mu_0;\quad H_1:\mu <\mu_0 H0:μ≥μ0;H1:μ<μ0
选取统计量
U = X ˉ − μ 0 σ / n ∼ N ( 0 , 1 ) U=\frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}} \sim N(0,1) U=σ/n Xˉ−μ0∼N(0,1)
写出拒绝域
U = X ˉ − μ 0 σ / n ≤ − Z α U=\frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}} \le -Z_{\alpha} U=σ/n Xˉ−μ0≤−Zα
确定 Z α Z_{\alpha} Zα
计算 U U U
判断结果
U ≤ − Z α reject H 0 U > − Z α accept H 0 \begin{aligned} U\le -Z_{\alpha} &\quad \text{reject } H_0 \\ U> -Z_{\alpha} &\quad \text{accept } H_0 \end{aligned} U≤−ZαU>−Zαreject H0accept H0

以单正态总体均值 μ \mu μ右边检验为例，方差 σ \sigma σ已知，显著水平 1 − α 1-\alpha 1−α

提出原假设和备择假设：
H 0 : μ ≤ μ 0 ; H 1 : μ > μ 0 H_0:\mu\le\mu_0;\quad H_1:\mu >\mu_0 H0:μ≤μ0;H1:μ>μ0
选取统计量
U = X ˉ − μ 0 σ / n ∼ N ( 0 , 1 ) U=\frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}} \sim N(0,1) U=σ/n Xˉ−μ0∼N(0,1)
写出拒绝域
U = X ˉ − μ 0 σ / n ≥ Z α U=\frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}} \ge Z_{\alpha} U=σ/n Xˉ−μ0≥Zα
确定 Z α Z_{\alpha} Zα
计算 U U U
判断结果
U ≥ Z α reject H 0 U < Z α accept H 0 \begin{aligned} U\ge Z_{\alpha} &\quad \text{reject } H_0 \\ U< Z_{\alpha} &\quad \text{accept } H_0 \end{aligned} U≥ZαU<Zαreject H0accept H0

注意：

无论是双边检验还是单边检验，原假设 H 0 H_0 H0中一定要包含等于。

左边检验和右边检验原假设箭头方向问题。可以这么理解：左边检验，检验的是下界，箭头就是 ≥ \ge ≥，右边检验检验的是上界，箭头就是 ≤ \le ≤。

单边检验和双边检验使用情况总结：

右边检验：是否提高、是否偏高、是否增加、是否超过，原假设就是没有提高，用小于等于…

左边检验：是否降低、是否偏低、是否减少、是否不足，原假设就是没有降低，用大于等于…

双边检验：是否正常、是否合格、有无差别、有无差异、有无变化、有无影响

总的来说，单边检验问题中有方向性，双边检验问题无方向性。

关于原假设的提法，我也是搞了很久，一直不明白，我们再回顾一下假设检验的逻辑：小概率事件在一次试验中居然发生了，那我们就有很大把握否定原假设，因此原假设必然是大概率的，你没有足够的证据就不能说明原假设是错的（类似于法律上的无罪推定），也就是所谓的 H 0 H_0 H0受保护。那什么样的假设是大概率的？或者说我们该如何提原假设？我认为应该把通常情况，或者说过去一直发生的情况，或者说某种标准，再或者原先就有的结论作为原假设，因为这些事件都是大概率的；把我们需要去证明的结论作为备择假设（这种主要用于前面所说的几种情况题目中都没给）。比如题目中可能会说，某标准为不超过多少，问是否符合标准，此时应假设是符合标准的，即 H 0 : μ ≤ μ 0 H_0:\mu\le \mu_0 H0:μ≤μ0。比如以往某机器精度为 μ 0 \mu_0 μ0，让检验现在机器是否正常工作，此时应假设正常工作，即 H 0 : μ = μ 0 H_0:\mu=\mu_0 H0:μ=μ0。再比如什么都不知道，题目问能否认为某某超过 μ 0 \mu_0 μ0，此时假设 H 1 : μ > μ 0 H_1:\mu > \mu_0 H1:μ>μ0。至于说足够的证据，那就是一次试验中小概率事件发生了，根据实际推断原理，小概率事件是几乎不可能在一次试验中发生的，那既然发生了，我们就可以认为 H 0 H_0 H0错了，也就拒绝 H 0 H_0 H0。

以下双边检验仅提供统计量和拒绝域以及单边检验的原假设和拒绝域：

单正态总体均值假设检验，方差未知

双边

选取统计量： T = X ˉ − μ S / n ∼ t ( n − 1 ) T=\frac{\bar{X}-\mu}{S/\sqrt{n}}\sim t(n-1) T=S/n Xˉ−μ∼t(n−1)

拒绝域： ∣ T ∣ ≥ t α 2 ( n − 1 ) |T|\ge t_{\frac{\alpha}{2}}(n-1) ∣T∣≥t2α(n−1)

单边

right : H 0 : μ ≤ μ 0 ; H 1 : μ > μ 0 rejection region : X ˉ − μ S / n ≥ t α ( n − 1 ) left : H 0 : μ ≥ μ 0 ; H 1 : μ < μ 0 rejection region : X ˉ − μ S / n ≤ − t α ( n − 1 ) \begin{aligned} \text{right}&: \quad H_0:\mu\le\mu_0;\quad H_1:\mu>\mu_0 \\ \text{rejection region}&: \quad \frac{\bar{X}-\mu}{S/\sqrt{n}}\ge t_\alpha(n-1) \\ \text{left}&: \quad H_0:\mu\ge\mu_0;\quad H_1:\mu<\mu_0 \\ \text{rejection region}&: \quad \frac{\bar{X}-\mu}{S/\sqrt{n}}\le -t_\alpha(n-1) \end{aligned} rightrejection regionleftrejection region:H0:μ≤μ0;H1:μ>μ0:S/n Xˉ−μ≥tα(n−1):H0:μ≥μ0;H1:μ<μ0:S/n Xˉ−μ≤−tα(n−1)

单正态总体假设检验，均值未知

双边

选取统计量： χ 2 = ( n − 1 ) S 2 σ 2 ∼ χ 2 ( n − 1 ) \chi^2=\frac{(n-1)S^2}{\sigma^2}\sim \chi^2(n-1) χ2=σ2(n−1)S2∼χ2(n−1)

拒绝域： χ 2 ≤ χ 1 − α 2 2 ( n − 1 ) \chi^2\le\chi^2_{1-\frac{\alpha}{2}}(n-1) χ2≤χ1−2α2(n−1)或 χ 2 ≥ χ α 2 2 ( n − 1 ) \chi^2\ge\chi^2_{\frac{\alpha}{2}}(n-1) χ2≥χ2α2(n−1) 两个临界值都需要确定

单边

right : H 0 : σ 2 ≤ σ 0 2 ; H 1 : σ 2 > σ 0 2 rejection region : χ 2 ≥ χ α 2 ( n − 1 ) left : H 0 : σ 2 ≥ σ 0 2 ; H 1 : σ 2 < σ 0 2 rejection region : χ 2 ≤ χ 1 − α 2 ( n − 1 ) \begin{aligned} \text{right}&: \quad H_0:\sigma^2\le\sigma^2_0;\quad H_1:\sigma^2>\sigma^2_0 \\ \text{rejection region}&: \quad\chi^2\ge\chi^2_{\alpha}(n-1) \\ \text{left}&: \quad H_0:\sigma^2\ge\sigma^2_0;\quad H_1:\sigma^2<\sigma^2_0 \\ \text{rejection region}&: \quad\chi^2\le\chi^2_{1-\alpha}(n-1) \end{aligned} rightrejection regionleftrejection region:H0:σ2≤σ02;H1:σ2>σ02:χ2≥χα2(n−1):H0:σ2≥σ02;H1:σ2<σ02:χ2≤χ1−α2(n−1)

两个正态总体参数的假设检验，检验两正态总体均值相等

H 0 : μ 1 = μ 2 ; H 1 : μ 1 ≠ μ 2 H_0:\mu_1=\mu_2;\quad H_1:\mu_1\neq\mu_2 H0:μ1=μ2;H1:μ1=μ2

方差 σ 2 \sigma^2 σ2已知
- 双边
选取统计量： U = X ˉ − Y ˉ σ 1 2 n 1 + σ 2 2 n 2 ∼ N ( 0 , 1 ) U=\frac{\bar{X}-\bar{Y}}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}\sim N(0,1) U=n1σ12+n2σ22 Xˉ−Yˉ∼N(0,1)

拒绝域： ∣ U ∣ ≥ U α 2 |U|\ge U_{\frac{\alpha}{2}} ∣U∣≥U2α
- 单边
right : H 0 : μ 1 ≤ μ 2 ; H 1 : μ 1 > μ 2 rejection region : U ≥ U α left : H 0 : μ 1 ≥ μ 2 ; H 1 : μ 1 < μ 2 rejection region : U ≤ − U α \begin{aligned} \text{right}&: \quad H_0:\mu_1\le\mu_2;\quad H_1:\mu_1>\mu_2 \\ \text{rejection region}&: \quad U\ge U_\alpha \\ \text{left}&: \quad H_0:\mu_1\ge\mu_2;\quad H_1:\mu_1<\mu_2 \\ \text{rejection region}&: \quad U\le -U_\alpha \end{aligned} rightrejection regionleftrejection region:H0:μ1≤μ2;H1:μ1>μ2:U≥Uα:H0:μ1≥μ2;H1:μ1<μ2:U≤−Uα
方差 σ 2 \sigma^2 σ2未知
- 双边
  
  选取统计量： T = X ˉ − Y ˉ S w 1 n 1 + 1 n 2 ∼ t ( n 1 + n 2 − 2 ) , S w = ( n 1 − 1 ) S 1 2 + ( n 2 − 1 ) S 2 2 n 1 + n 2 − 2 T=\frac{\bar{X}-\bar{Y}}{S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}\sim t(n_1+n_2-2),\quad S_w=\sqrt{\frac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2}} T=Swn11+n21 Xˉ−Yˉ∼t(n1+n2−2),Sw=n1+n2−2(n1−1)S12+(n2−1)S22
  
  拒绝域： ∣ T ∣ ≥ t α 2 ( n 1 + n 2 − 2 ) |T|\ge t_{\frac{\alpha}{2}}(n_1+n_2-2) ∣T∣≥t2α(n1+n2−2)
- 单边
  right : H 0 : μ 1 ≤ μ 2 ; H 1 : μ 1 > μ 2 rejection region : T ≥ t α ( n 1 + n 2 − 2 ) left : H 0 : μ 1 ≥ μ 2 ; H 1 : μ 1 < μ 2 rejection region : T ≤ − t α ( n 1 + n 2 − 2 ) \begin{aligned} \text{right}&: \quad H_0:\mu_1\le\mu_2;\quad H_1:\mu_1>\mu_2 \\ \text{rejection region}&: \quad T\ge t_\alpha(n_1+n_2-2) \\ \text{left}&: \quad H_0:\mu_1\ge\mu_2;\quad H_1:\mu_1<\mu_2 \\ \text{rejection region}&: \quad T\le -t_\alpha(n_1+n_2-2) \end{aligned} rightrejection regionleftrejection region:H0:μ1≤μ2;H1:μ1>μ2:T≥tα(n1+n2−2):H0:μ1≥μ2;H1:μ1<μ2:T≤−tα(n1+n2−2)

两正态总体均值之差的假设检验，方差未知

双边

H 0 : μ 1 − μ 2 = δ ; H 1 : μ 1 − μ 2 ≠ δ H_0:\mu_1-\mu_2=\delta; \quad H_1:\mu_1-\mu_2\neq\delta H0:μ1−μ2=δ;H1:μ1−μ2=δ

如果是检验 μ 1 \mu_1 μ1和 μ 2 \mu_2 μ2是否相等，则 δ = 0 \delta=0 δ=0

选取统计量： T = X ˉ − Y ˉ − ( μ 1 − μ 2 ) S w 1 n 1 + 1 n 2 = X ˉ − Y ˉ − δ S w 1 n 1 + 1 n 2 ∼ t ( n 1 + n 2 − 2 ) T=\frac{\bar{X}-\bar{Y}-(\mu_1-\mu_2)}{S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}=\frac{\bar{X}-\bar{Y}-\delta}{S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}\sim t(n_1+n_2-2) T=Swn11+n21 Xˉ−Yˉ−(μ1−μ2)=Swn11+n21 Xˉ−Yˉ−δ∼t(n1+n2−2)

拒绝域： ∣ T ∣ ≥ t α 2 ( n 1 + n 2 − 2 ) |T|\ge t_{\frac{\alpha}{2}}(n_1+n_2-2) ∣T∣≥t2α(n1+n2−2)

单边

right : H 0 : μ 1 − μ 2 ≤ δ ; H 1 : μ 1 − μ 2 > δ rejection region : T ≥ t α ( n 1 + n 2 − 2 ) left : H 0 : μ 1 − μ 2 ≥ δ ; H 1 : μ 1 − μ 2 < δ rejection region : T ≤ − t α ( n 1 + n 2 − 2 ) \begin{aligned} \text{right}&: \quad H_0:\mu_1-\mu_2\le \delta;\quad H_1:\mu_1-\mu_2 > \delta \\ \text{rejection region}&: \quad T\ge t_\alpha(n_1+n_2-2) \\ \text{left}&: \quad H_0:\mu_1-\mu_2\ge \delta;\quad H_1:\mu_1-\mu_2 < \delta \\ \text{rejection region}&: \quad T\le -t_\alpha(n_1+n_2-2) \end{aligned} rightrejection regionleftrejection region:H0:μ1−μ2≤δ;H1:μ1−μ2>δ:T≥tα(n1+n2−2):H0:μ1−μ2≥δ;H1:μ1−μ2<δ:T≤−tα(n1+n2−2)

两正态总体方差相等的假设检验，均值未知

双边

H 0 : σ 1 2 = σ 2 2 ; H 1 : σ 1 2 ≠ σ 2 2 H_0:\sigma_1^2=\sigma_2^2;\quad H_1:\sigma_1^2\neq\sigma_2^2 H0:σ12=σ22;H1:σ12=σ22

选取统计量： F = S 1 2 / σ 1 2 S 2 2 / σ 2 2 = S 1 2 S 2 2 ∼ F ( n 1 − 1 , n 2 − 1 ) F=\frac{S_1^2/\sigma_1^2}{S_2^2/\sigma_2^2}=\frac{S_1^2}{S_2^2}\sim F(n_1-1,n_2-1) F=S22/σ22S12/σ12=S22S12∼F(n1−1,n2−1)

拒绝域： F ≤ F 1 − α 2 ( n 1 − 1 , n 2 − 1 ) F\le F_{1-\frac{\alpha}{2}}(n_1-1,n_2-1) F≤F1−2α(n1−1,n2−1)或 F ≥ F α 2 ( n 1 − 1 , n 2 − 1 ) F\ge F_{\frac{\alpha}{2}}(n_1-1,n_2-1) F≥F2α(n1−1,n2−1)

单边
right : H 0 : σ 1 2 ≤ σ 2 2 ; H 1 : σ 1 2 > σ 2 2 rejection region : F ≥ F α ( n 1 + n 2 − 2 ) left : H 0 : σ 1 2 ≥ σ 2 2 ; H 1 : σ 1 2 < σ 2 2 rejection region : F ≤ F 1 − α ( n 1 + n 2 − 2 ) \begin{aligned} \text{right}&: \quad H_0:\sigma_1^2\le\sigma_2^2;\quad H_1:\sigma_1^2>\sigma_2^2 \\ \text{rejection region}&: \quad F\ge F_\alpha(n_1+n_2-2) \\ \text{left}&: \quad H_0:\sigma_1^2\ge\sigma_2^2;\quad H_1:\sigma_1^2<\sigma_2^2 \\ \text{rejection region}&: \quad F\le F_{1-\alpha}(n_1+n_2-2) \end{aligned} rightrejection regionleftrejection region:H0:σ12≤σ22;H1:σ12>σ22:F≥Fα(n1+n2−2):H0:σ12≥σ22;H1:σ12<σ22:F≤F1−α(n1+n2−2)

大子样总体均值的假设检验

μ \mu μ假设检验是 X ∼ N ( μ , σ 2 ) X\sim N(\mu,\sigma^2) X∼N(μ,σ2)下提出的，当 X X X不能服从正态分布时，只需要 n n n足够大，对 μ \mu μ均可用 Z Z Z检验。

方差已知

选取统计量： Z = X ˉ − μ 0 σ / n ∼ N ( 0 , 1 ) Z=\frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}}\sim N(0,1) Z=σ/n Xˉ−μ0∼N(0,1)【近似】
方差未知

选取统计量： Z = X ˉ − μ 0 S / n ∼ N ( 0 , 1 ) Z=\frac{\bar{X}-\mu_0}{S/\sqrt{n}}\sim N(0,1) Z=S/n Xˉ−μ0∼N(0,1)【近似】

大子样总体均值相等的假设检验

方差已知

选取统计量： X ˉ − Y ˉ σ 1 2 n 1 + σ 2 2 n 2 ∼ N ( 0 , 1 ) \frac{\bar{X}-\bar{Y}}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}\sim N(0,1) n1σ12+n2σ22 Xˉ−Yˉ∼N(0,1)【近似、大子样】
方差未知

选取统计量： X ˉ − Y ˉ S 1 2 n 1 + S 2 2 n 2 ∼ N ( 0 , 1 ) \frac{\bar{X}-\bar{Y}}{\sqrt{\frac{S_1^2}{n_1}+\frac{S_2^2}{n_2}}}\sim N(0,1) n1S12+n2S22 Xˉ−Yˉ∼N(0,1)

若考虑 X ˉ 、 Y ˉ \bar{X}、\bar{Y} Xˉ、Yˉ， ∣ X ˉ − Y ˉ ∣ > U α 2 S 1 2 n 1 + S 2 2 n 2 |\bar{X}-\bar{Y}|>U_{\frac{\alpha}{2}}\sqrt{\frac{S_1^2}{n_1}+\frac{S_2^2}{n_2}} ∣Xˉ−Yˉ∣>U2αn1S12+n2S22

非正态总体的参数假设检验

0-1分布

P { X = x } = p x ( 1 − p ) 1 − x P\{X=x\}=p^x(1-p)^{1-x} P{X=x}=px(1−p)1−x

H 0 : p = p 0 ; H 1 : p ≠ p 0 H_0:p=p_0;H_1:p\neq p_0 H0:p=p0;H1:p=p0

E ( X ˉ ) = p , D ( X ˉ ) = 1 n p ( 1 − p ) E(\bar{X})=p,D(\bar{X})=\frac{1}{n}p(1-p) E(Xˉ)=p,D(Xˉ)=n1p(1−p)

当 n n n很大时， U = X ˉ − p p ( 1 − p ) n ∼ N ( 0 , 1 ) U=\frac{\bar{X}-p}{\sqrt{\frac{p(1-p)}{n}}}\sim N(0,1) U=np(1−p) Xˉ−p∼N(0,1)

拒绝域： ∣ U ∣ = ∣ X ˉ − p 0 ∣ p 0 ( 1 − p 0 ) / n ≥ U α 2 |U|=\frac{|\bar{X}-p_0|}{\sqrt{p_0(1-p_0)}/{\sqrt{n}}}\ge U_\frac{\alpha}{2} ∣U∣=p0(1−p0) /n ∣Xˉ−p0∣≥U2α

非正态总体均值的假设检验

H 0 : μ = μ 0 ; H 1 : μ ≠ μ 0 H_0:\mu=\mu_0;H_1:\mu\neq\mu_0 H0:μ=μ0;H1:μ=μ0

中心极限定理：当 n n n充分大时，

方差已知

选取统计量： U = X ˉ − μ 0 σ / n ∼ N ( 0 , 1 ) U=\frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}}\sim N(0,1) U=σ/n Xˉ−μ0∼N(0,1)【近似】
方差未知

选取统计量： U = X ˉ − μ 0 S / n ∼ N ( 0 , 1 ) U=\frac{\bar{X}-\mu_0}{S/\sqrt{n}}\sim N(0,1) U=S/n Xˉ−μ0∼N(0,1)【近似】

拒绝域： ∣ U ∣ ≥ U α 2 |U|\ge U_{\frac{\alpha}{2}} ∣U∣≥U2α

两个非正态筒体均值的假设检验

方差已知

选取统计量： U = X ˉ − Y ˉ − ( μ 1 − μ 2 ) σ 1 2 n 1 + σ 2 2 n 2 ∼ N ( 0 , 1 ) U=\frac{\bar{X}-\bar{Y}-(\mu_1-\mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}\sim N(0,1) U=n1σ12+n2σ22 Xˉ−Yˉ−(μ1−μ2)∼N(0,1)【近似】
方差未知

选取统计量： U = X ˉ − Y ˉ − ( μ 1 − μ 2 ) S 1 2 n 1 + S 2 2 n 2 ∼ N ( 0 , 1 ) U=\frac{\bar{X}-\bar{Y}-(\mu_1-\mu_2)}{\sqrt{\frac{S_1^2}{n_1}+\frac{S_2^2}{n_2}}}\sim N(0,1) U=n1S12+n2S22 Xˉ−Yˉ−(μ1−μ2)∼N(0,1)【近似】

拒绝域： ∣ U ∣ ≥ U α 2 |U|\ge U_{\frac{\alpha}{2}} ∣U∣≥U2α

分布拟合检验卡方检验法

H 0 : F ( x ) = F 0 ( x ) ; H 1 : F ( x ) ≠ F 0 ( x ) H_0:F(x)=F_0(x);\quad H_1:F(x)\neq F_0(x) H0:F(x)=F0(x);H1:F(x)=F0(x)

F(x)不含未知参数

选取统计量： χ 2 = ∑ i = 1 k ( f i − n p i ) 2 n p i ∼ χ 2 ( k − 1 ) \chi^2=\sum\limits_{i=1}^{k}\frac{(f_i-np_i)^2}{np_i}\sim \chi^2(k-1) χ2=i=1∑knpi(fi−npi)2∼χ2(k−1)【 H 0 H_0 H0为真， n n n充分大】

拒绝域： χ 2 ≥ χ α 2 ( k − 1 ) \chi^2\ge\chi^2_\alpha(k-1) χ2≥χα2(k−1)
F(x)含有未知参数
- 先求未知参数的极大似然估计 p ^ i = p ^ ( A i ) \hat{p}_i=\hat{p}(A_i) p^i=p^(Ai)
- 选取统计量： χ 2 = ∑ i = 1 k ( f i − n p ^ i ) 2 n p ^ i = ∑ i = 1 k f i 2 n p ^ i − n ∼ χ 2 ( k − r − 1 ) \chi^2=\sum\limits_{i=1}^{k}\frac{(f_i-n\hat{p}_i)^2}{n\hat{p}_i}=\sum\limits_{i=1}^{k}\frac{f_i^2}{n\hat{p}_i}-n\sim \chi^2(k-r-1) χ2=i=1∑knp^i(fi−np^i)2=i=1∑knp^ifi2−n∼χ2(k−r−1)[ H 0 H_0 H0为真， n n n充分大] (r是未知参数个数)
- 拒绝域： χ 2 ≥ χ α 2 ( k − r − 1 ) \chi^2\ge \chi^2_\alpha(k-r-1) χ2≥χα2(k−r−1)

注意：

大样本， n ≥ 50 n\ge 50 n≥50

要求各组理论频数 n p i ≥ 5 np_i\ge5 npi≥5或 n p ^ i ≥ 5 n\hat{p}_i\ge 5 np^i≥5

一般数据分成7到14组

存在问题：

分组不同，拟合的结果不同

需要有足够的样本容量

对连续型变量的优度拟合， χ 2 \chi^2 χ2检验不是理想的方法

独立性检验(相关性检验)

H 0 : X , Y H_0:X,Y H0:X,Y 独立; H 1 : X , Y \quad H_1:X,Y H1:X,Y 不独立

选取统计量： χ 2 = n ∑ i = 1 m ∑ j = 1 k ( n i j − n i ⋅ n ⋅ j n ) 2 n i ⋅ n ⋅ j = n ( ∑ i = 1 m ∑ j = 1 k n i j 2 n i ⋅ n ⋅ j − 1 ) ∼ χ 2 ( ( m − 1 ) ( k − 1 ) ) \chi^2=n\sum\limits_{i=1}^{m}\sum\limits_{j=1}^{k}\frac{(n_{ij}-\frac{n_{i\cdot}n_{\cdot j}}{n})^2}{n_{i\cdot}n_{\cdot j}}=n(\sum\limits_{i=1}^{m}\sum\limits_{j=1}^{k}\frac{n_{ij}^2}{n_{i\cdot}n_{\cdot j}}-1)\sim \chi^2((m-1)(k-1)) χ2=ni=1∑mj=1∑kni⋅n⋅j(nij−nni⋅n⋅j)2=n(i=1∑mj=1∑kni⋅n⋅jnij2−1)∼χ2((m−1)(k−1))【近似】

拒绝域： χ 2 ≥ χ α 2 ( ( m − 1 ) ( k − 1 ) ) \chi^2\ge \chi^2_\alpha((m-1)(k-1)) χ2≥χα2((m−1)(k−1))

同时，还能通过独立性判断相关性。