【概率论与数理统计(研究生课程)】知识点总结8(假设检验)
原文地址: 【概率论与数理统计(研究生课程)】知识点总结8(假设检验)
目录
- 假设检验
- 依据
- 方法(概率论反证法)
- 逻辑
- 两类错误
- 第一类错误
- 第二类错误
- 解题步骤
- 以单正态总体均值 μ \mu μ双边检验为例,方差 σ \sigma σ已知,显著水平 1 − α 1-\alpha 1−α
- 以单正态总体均值 μ \mu μ左边检验为例,方差 σ \sigma σ已知,显著水平 1 − α 1-\alpha 1−α
- 以单正态总体均值 μ \mu μ右边检验为例,方差 σ \sigma σ已知,显著水平 1 − α 1-\alpha 1−α
- 单正态总体均值假设检验,方差未知
- 单正态总体假设检验,均值未知
- 两个正态总体参数的假设检验,检验两正态总体均值相等
- 两正态总体均值之差的假设检验,方差未知
- 两正态总体方差相等的假设检验,均值未知
- 大子样总体均值的假设检验
- 大子样总体均值相等的假设检验
- 非正态总体的参数假设检验
- 0-1分布
- 非正态总体均值的假设检验
- 两个非正态筒体均值的假设检验
- 分布拟合检验 卡方检验法
- 独立性检验(相关性检验)
假设检验
依据
小概率原理: 小概率事件在一次试验中几乎不会发生(实际推断原理)
小概率事件在一次试验中发生的概率记为 α \alpha α, α \alpha α为显著水平,检验水平
方法(概率论反证法)
- 先对关心问题提出原假设 H 0 H_0 H0和备择假设
- 运用样本信息看在 H 0 H_0 H0成立下会不会矛盾
- 最后对 H 0 H_0 H0成立与否做出判断:
若小概率事件发生,则否定 H 0 H_0 H0;否则接受 H 0 H_0 H0
逻辑
小概率事件在一次试验中居然发生,就可以以很大把握否定原假设。
注意:不否定 H 0 H_0 H0并不是肯定 H 0 H_0 H0一定对,而是说差异不够显著,没有达到足以否定 H 0 H_0 H0的程度
两类错误
第一类错误
记事件 A A A为犯第一类错误
P { A } = P { reject H 0 ∣ H 0 is true } = α P\{A\}=P\{\text{reject } H_0 | H_0\text{ is true}\}=\alpha P{A}=P{reject H0∣H0 is true}=α
第二类错误
记事件 B B B为犯第二类错误
P { B } = P { accept H 0 ∣ H 0 is false } = β β = ∫ μ 0 − U α 2 σ n μ 0 + U α 2 σ n 1 2 π σ n e − ( x ˉ − μ 1 ) 2 2 σ 2 n d x ˉ = Φ ( μ 0 − μ 1 σ / n + U α 2 ) − Φ ( μ 0 − μ 1 σ / n − U α 2 ) \begin{aligned} P\{B\}&=P\{\text{accept } H_0 | H_0\text{ is false}\}=\beta \\ \beta&=\int\limits_{\mu_0-U_{\frac{\alpha}{2}}\frac{\sigma}{\sqrt{n}}}^{\mu_0+U_{\frac{\alpha}{2}}\frac{\sigma}{\sqrt{n}}}\frac{1}{\sqrt{2\pi}\frac{\sigma}{\sqrt{n}}}e^{-\frac{(\bar{x}-\mu_1)^2}{2\frac{\sigma^2}{n}}}d\bar{x} \\ &=\Phi(\frac{\mu_0-\mu_1}{\sigma/\sqrt{n}}+U_{\frac{\alpha}{2}})-\Phi(\frac{\mu_0-\mu_1}{\sigma/\sqrt{n}}-U_{\frac{\alpha}{2}}) \end{aligned} P{B}β=P{accept H0∣H0 is false}=β=μ0−U2αn σ∫μ0+U2αn σ2π n σ1e−2nσ2(xˉ−μ1)2dxˉ=Φ(σ/n μ0−μ1+U2α)−Φ(σ/n μ0−μ1−U2α)
- 当样本容量固定式,一类错误概率减少导致另一类错误概率增加。 α \alpha α减少,区间长度 2 U α 2 σ n 2U_{\frac{\alpha}{2}}\frac{\sigma}{\sqrt{n}} 2U2αn σ变长,则 β \beta β变大。
- 要同时降低两类错误的概率,或在 α \alpha α不变时降低 β \beta β,需要增加样本容量。
- 显著性检验只对犯第一类错误的概率加以控制,而不考虑犯第二类错误的概率
解题步骤
以单正态总体均值 μ \mu μ双边检验为例,方差 σ \sigma σ已知,显著水平 1 − α 1-\alpha 1−α
提出原假设和备择假设:
H 0 : μ = μ 0 ; H 1 : μ ≠ μ 0 H_0:\mu=\mu_0;\quad H_1:\mu \neq\mu_0 H0:μ=μ0;H1:μ=μ0选取统计量
U = X ˉ − μ 0 σ / n ∼ N ( 0 , 1 ) U=\frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}} \sim N(0,1) U=σ/n Xˉ−μ0∼N(0,1)写出拒绝域
∣ U ∣ = ∣ X ˉ − μ 0 σ / n ∣ ≥ Z α 2 |U|=|\frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}}| \ge Z_{\frac{\alpha}{2}} ∣U∣=∣σ/n Xˉ−μ0∣≥Z2α确定 Z α 2 Z_{\frac{\alpha}{2}} Z2α
计算 ∣ U ∣ |U| ∣U∣
判断结果
∣ U ∣ ≥ Z α 2 reject H 0 ∣ U ∣ < Z α 2 accept H 0 \begin{aligned} |U|\ge Z_{\frac{\alpha}{2}} \quad \text{reject } H_0 \\ |U|< Z_{\frac{\alpha}{2}} \quad \text{accept } H_0 \end{aligned} ∣U∣≥Z2αreject H0∣U∣<Z2αaccept H0
以单正态总体均值 μ \mu μ左边检验为例,方差 σ \sigma σ已知,显著水平 1 − α 1-\alpha 1−α
提出原假设和备择假设:
H 0 : μ ≥ μ 0 ; H 1 : μ < μ 0 H_0:\mu\ge\mu_0;\quad H_1:\mu <\mu_0 H0:μ≥μ0;H1:μ<μ0选取统计量
U = X ˉ − μ 0 σ / n ∼ N ( 0 , 1 ) U=\frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}} \sim N(0,1) U=σ/n Xˉ−μ0∼N(0,1)写出拒绝域
U = X ˉ − μ 0 σ / n ≤ − Z α U=\frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}} \le -Z_{\alpha} U=σ/n Xˉ−μ0≤−Zα确定 Z α Z_{\alpha} Zα
计算 U U U
判断结果
U ≤ − Z α reject H 0 U > − Z α accept H 0 \begin{aligned} U\le -Z_{\alpha} &\quad \text{reject } H_0 \\ U> -Z_{\alpha} &\quad \text{accept } H_0 \end{aligned} U≤−ZαU>−Zαreject H0accept H0
以单正态总体均值 μ \mu μ右边检验为例,方差 σ \sigma σ已知,显著水平 1 − α 1-\alpha 1−α
提出原假设和备择假设:
H 0 : μ ≤ μ 0 ; H 1 : μ > μ 0 H_0:\mu\le\mu_0;\quad H_1:\mu >\mu_0 H0:μ≤μ0;H1:μ>μ0选取统计量
U = X ˉ − μ 0 σ / n ∼ N ( 0 , 1 ) U=\frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}} \sim N(0,1) U=σ/n Xˉ−μ0∼N(0,1)写出拒绝域
U = X ˉ − μ 0 σ / n ≥ Z α U=\frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}} \ge Z_{\alpha} U=σ/n Xˉ−μ0≥Zα确定 Z α Z_{\alpha} Zα
计算 U U U
判断结果
U ≥ Z α reject H 0 U < Z α accept H 0 \begin{aligned} U\ge Z_{\alpha} &\quad \text{reject } H_0 \\ U< Z_{\alpha} &\quad \text{accept } H_0 \end{aligned} U≥ZαU<Zαreject H0accept H0
注意:
无论是双边检验还是单边检验,原假设 H 0 H_0 H0中一定要包含等于。
左边检验和右边检验原假设箭头方向问题。可以这么理解:左边检验,检验的是下界,箭头就是 ≥ \ge ≥,右边检验检验的是上界,箭头就是 ≤ \le ≤。
单边检验和双边检验使用情况总结:
右边检验:是否提高、是否偏高、是否增加、是否超过,原假设就是没有提高,用小于等于…
左边检验:是否降低、是否偏低、是否减少、是否不足,原假设就是没有降低,用大于等于…
双边检验:是否正常、是否合格、有无差别、有无差异、有无变化、有无影响
总的来说,单边检验问题中有方向性,双边检验问题无方向性。
关于原假设的提法,我也是搞了很久,一直不明白,我们再回顾一下假设检验的逻辑:小概率事件在一次试验中居然发生了,那我们就有很大把握否定原假设,因此原假设必然是大概率的,你没有足够的证据就不能说明原假设是错的(类似于法律上的无罪推定),也就是所谓的 H 0 H_0 H0受保护。那什么样的假设是大概率的?或者说我们该如何提原假设?我认为应该把通常情况,或者说过去一直发生的情况,或者说某种标准,再或者原先就有的结论作为原假设,因为这些事件都是大概率的;把我们需要去证明的结论作为备择假设(这种主要用于前面所说的几种情况题目中都没给)。比如题目中可能会说,某标准为不超过多少,问是否符合标准,此时应假设是符合标准的,即 H 0 : μ ≤ μ 0 H_0:\mu\le \mu_0 H0:μ≤μ0。比如以往某机器精度为 μ 0 \mu_0 μ0,让检验现在机器是否正常工作,此时应假设正常工作,即 H 0 : μ = μ 0 H_0:\mu=\mu_0 H0:μ=μ0。再比如什么都不知道,题目问能否认为某某超过 μ 0 \mu_0 μ0,此时假设 H 1 : μ > μ 0 H_1:\mu > \mu_0 H1:μ>μ0。至于说足够的证据,那就是一次试验中小概率事件发生了,根据实际推断原理,小概率事件是几乎不可能在一次试验中发生的,那既然发生了,我们就可以认为 H 0 H_0 H0错了,也就拒绝 H 0 H_0 H0。
以下双边检验仅提供统计量和拒绝域以及单边检验的原假设和拒绝域:
单正态总体均值假设检验,方差未知
- 双边
选取统计量: T = X ˉ − μ S / n ∼ t ( n − 1 ) T=\frac{\bar{X}-\mu}{S/\sqrt{n}}\sim t(n-1) T=S/n Xˉ−μ∼t(n−1)
拒绝域: ∣ T ∣ ≥ t α 2 ( n − 1 ) |T|\ge t_{\frac{\alpha}{2}}(n-1) ∣T∣≥t2α(n−1)
- 单边
right : H 0 : μ ≤ μ 0 ; H 1 : μ > μ 0 rejection region : X ˉ − μ S / n ≥ t α ( n − 1 ) left : H 0 : μ ≥ μ 0 ; H 1 : μ < μ 0 rejection region : X ˉ − μ S / n ≤ − t α ( n − 1 ) \begin{aligned} \text{right}&: \quad H_0:\mu\le\mu_0;\quad H_1:\mu>\mu_0 \\ \text{rejection region}&: \quad \frac{\bar{X}-\mu}{S/\sqrt{n}}\ge t_\alpha(n-1) \\ \text{left}&: \quad H_0:\mu\ge\mu_0;\quad H_1:\mu<\mu_0 \\ \text{rejection region}&: \quad \frac{\bar{X}-\mu}{S/\sqrt{n}}\le -t_\alpha(n-1) \end{aligned} rightrejection regionleftrejection region:H0:μ≤μ0;H1:μ>μ0:S/n Xˉ−μ≥tα(n−1):H0:μ≥μ0;H1:μ<μ0:S/n Xˉ−μ≤−tα(n−1)
单正态总体假设检验,均值未知
- 双边
选取统计量: χ 2 = ( n − 1 ) S 2 σ 2 ∼ χ 2 ( n − 1 ) \chi^2=\frac{(n-1)S^2}{\sigma^2}\sim \chi^2(n-1) χ2=σ2(n−1)S2∼χ2(n−1)
拒绝域: χ 2 ≤ χ 1 − α 2 2 ( n − 1 ) \chi^2\le\chi^2_{1-\frac{\alpha}{2}}(n-1) χ2≤χ1−2α2(n−1)或 χ 2 ≥ χ α 2 2 ( n − 1 ) \chi^2\ge\chi^2_{\frac{\alpha}{2}}(n-1) χ2≥χ2α2(n−1) 两个临界值都需要确定
- 单边
right : H 0 : σ 2 ≤ σ 0 2 ; H 1 : σ 2 > σ 0 2 rejection region : χ 2 ≥ χ α 2 ( n − 1 ) left : H 0 : σ 2 ≥ σ 0 2 ; H 1 : σ 2 < σ 0 2 rejection region : χ 2 ≤ χ 1 − α 2 ( n − 1 ) \begin{aligned} \text{right}&: \quad H_0:\sigma^2\le\sigma^2_0;\quad H_1:\sigma^2>\sigma^2_0 \\ \text{rejection region}&: \quad\chi^2\ge\chi^2_{\alpha}(n-1) \\ \text{left}&: \quad H_0:\sigma^2\ge\sigma^2_0;\quad H_1:\sigma^2<\sigma^2_0 \\ \text{rejection region}&: \quad\chi^2\le\chi^2_{1-\alpha}(n-1) \end{aligned} rightrejection regionleftrejection region:H0:σ2≤σ02;H1:σ2>σ02:χ2≥χα2(n−1):H0:σ2≥σ02;H1:σ2<σ02:χ2≤χ1−α2(n−1)
两个正态总体参数的假设检验,检验两正态总体均值相等
H 0 : μ 1 = μ 2 ; H 1 : μ 1 ≠ μ 2 H_0:\mu_1=\mu_2;\quad H_1:\mu_1\neq\mu_2 H0:μ1=μ2;H1:μ1=μ2
方差 σ 2 \sigma^2 σ2已知
- 双边
选取统计量: U = X ˉ − Y ˉ σ 1 2 n 1 + σ 2 2 n 2 ∼ N ( 0 , 1 ) U=\frac{\bar{X}-\bar{Y}}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}\sim N(0,1) U=n1σ12+n2σ22 Xˉ−Yˉ∼N(0,1)
拒绝域: ∣ U ∣ ≥ U α 2 |U|\ge U_{\frac{\alpha}{2}} ∣U∣≥U2α
- 单边
right : H 0 : μ 1 ≤ μ 2 ; H 1 : μ 1 > μ 2 rejection region : U ≥ U α left : H 0 : μ 1 ≥ μ 2 ; H 1 : μ 1 < μ 2 rejection region : U ≤ − U α \begin{aligned} \text{right}&: \quad H_0:\mu_1\le\mu_2;\quad H_1:\mu_1>\mu_2 \\ \text{rejection region}&: \quad U\ge U_\alpha \\ \text{left}&: \quad H_0:\mu_1\ge\mu_2;\quad H_1:\mu_1<\mu_2 \\ \text{rejection region}&: \quad U\le -U_\alpha \end{aligned} rightrejection regionleftrejection region:H0:μ1≤μ2;H1:μ1>μ2:U≥Uα:H0:μ1≥μ2;H1:μ1<μ2:U≤−Uα
方差 σ 2 \sigma^2 σ2未知
双边
选取统计量: T = X ˉ − Y ˉ S w 1 n 1 + 1 n 2 ∼ t ( n 1 + n 2 − 2 ) , S w = ( n 1 − 1 ) S 1 2 + ( n 2 − 1 ) S 2 2 n 1 + n 2 − 2 T=\frac{\bar{X}-\bar{Y}}{S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}\sim t(n_1+n_2-2),\quad S_w=\sqrt{\frac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2}} T=Swn11+n21 Xˉ−Yˉ∼t(n1+n2−2),Sw=n1+n2−2(n1−1)S12+(n2−1)S22
拒绝域: ∣ T ∣ ≥ t α 2 ( n 1 + n 2 − 2 ) |T|\ge t_{\frac{\alpha}{2}}(n_1+n_2-2) ∣T∣≥t2α(n1+n2−2)
单边
right : H 0 : μ 1 ≤ μ 2 ; H 1 : μ 1 > μ 2 rejection region : T ≥ t α ( n 1 + n 2 − 2 ) left : H 0 : μ 1 ≥ μ 2 ; H 1 : μ 1 < μ 2 rejection region : T ≤ − t α ( n 1 + n 2 − 2 ) \begin{aligned} \text{right}&: \quad H_0:\mu_1\le\mu_2;\quad H_1:\mu_1>\mu_2 \\ \text{rejection region}&: \quad T\ge t_\alpha(n_1+n_2-2) \\ \text{left}&: \quad H_0:\mu_1\ge\mu_2;\quad H_1:\mu_1<\mu_2 \\ \text{rejection region}&: \quad T\le -t_\alpha(n_1+n_2-2) \end{aligned} rightrejection regionleftrejection region:H0:μ1≤μ2;H1:μ1>μ2:T≥tα(n1+n2−2):H0:μ1≥μ2;H1:μ1<μ2:T≤−tα(n1+n2−2)
两正态总体均值之差的假设检验,方差未知
- 双边
H 0 : μ 1 − μ 2 = δ ; H 1 : μ 1 − μ 2 ≠ δ H_0:\mu_1-\mu_2=\delta; \quad H_1:\mu_1-\mu_2\neq\delta H0:μ1−μ2=δ;H1:μ1−μ2=δ
如果是检验 μ 1 \mu_1 μ1和 μ 2 \mu_2 μ2是否相等,则 δ = 0 \delta=0 δ=0
选取统计量: T = X ˉ − Y ˉ − ( μ 1 − μ 2 ) S w 1 n 1 + 1 n 2 = X ˉ − Y ˉ − δ S w 1 n 1 + 1 n 2 ∼ t ( n 1 + n 2 − 2 ) T=\frac{\bar{X}-\bar{Y}-(\mu_1-\mu_2)}{S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}=\frac{\bar{X}-\bar{Y}-\delta}{S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}\sim t(n_1+n_2-2) T=Swn11+n21 Xˉ−Yˉ−(μ1−μ2)=Swn11+n21 Xˉ−Yˉ−δ∼t(n1+n2−2)
拒绝域: ∣ T ∣ ≥ t α 2 ( n 1 + n 2 − 2 ) |T|\ge t_{\frac{\alpha}{2}}(n_1+n_2-2) ∣T∣≥t2α(n1+n2−2)
- 单边
right : H 0 : μ 1 − μ 2 ≤ δ ; H 1 : μ 1 − μ 2 > δ rejection region : T ≥ t α ( n 1 + n 2 − 2 ) left : H 0 : μ 1 − μ 2 ≥ δ ; H 1 : μ 1 − μ 2 < δ rejection region : T ≤ − t α ( n 1 + n 2 − 2 ) \begin{aligned} \text{right}&: \quad H_0:\mu_1-\mu_2\le \delta;\quad H_1:\mu_1-\mu_2 > \delta \\ \text{rejection region}&: \quad T\ge t_\alpha(n_1+n_2-2) \\ \text{left}&: \quad H_0:\mu_1-\mu_2\ge \delta;\quad H_1:\mu_1-\mu_2 < \delta \\ \text{rejection region}&: \quad T\le -t_\alpha(n_1+n_2-2) \end{aligned} rightrejection regionleftrejection region:H0:μ1−μ2≤δ;H1:μ1−μ2>δ:T≥tα(n1+n2−2):H0:μ1−μ2≥δ;H1:μ1−μ2<δ:T≤−tα(n1+n2−2)
两正态总体方差相等的假设检验,均值未知
- 双边
H 0 : σ 1 2 = σ 2 2 ; H 1 : σ 1 2 ≠ σ 2 2 H_0:\sigma_1^2=\sigma_2^2;\quad H_1:\sigma_1^2\neq\sigma_2^2 H0:σ12=σ22;H1:σ12=σ22
选取统计量: F = S 1 2 / σ 1 2 S 2 2 / σ 2 2 = S 1 2 S 2 2 ∼ F ( n 1 − 1 , n 2 − 1 ) F=\frac{S_1^2/\sigma_1^2}{S_2^2/\sigma_2^2}=\frac{S_1^2}{S_2^2}\sim F(n_1-1,n_2-1) F=S22/σ22S12/σ12=S22S12∼F(n1−1,n2−1)
拒绝域: F ≤ F 1 − α 2 ( n 1 − 1 , n 2 − 1 ) F\le F_{1-\frac{\alpha}{2}}(n_1-1,n_2-1) F≤F1−2α(n1−1,n2−1)或 F ≥ F α 2 ( n 1 − 1 , n 2 − 1 ) F\ge F_{\frac{\alpha}{2}}(n_1-1,n_2-1) F≥F2α(n1−1,n2−1)
- 单边
right : H 0 : σ 1 2 ≤ σ 2 2 ; H 1 : σ 1 2 > σ 2 2 rejection region : F ≥ F α ( n 1 + n 2 − 2 ) left : H 0 : σ 1 2 ≥ σ 2 2 ; H 1 : σ 1 2 < σ 2 2 rejection region : F ≤ F 1 − α ( n 1 + n 2 − 2 ) \begin{aligned} \text{right}&: \quad H_0:\sigma_1^2\le\sigma_2^2;\quad H_1:\sigma_1^2>\sigma_2^2 \\ \text{rejection region}&: \quad F\ge F_\alpha(n_1+n_2-2) \\ \text{left}&: \quad H_0:\sigma_1^2\ge\sigma_2^2;\quad H_1:\sigma_1^2<\sigma_2^2 \\ \text{rejection region}&: \quad F\le F_{1-\alpha}(n_1+n_2-2) \end{aligned} rightrejection regionleftrejection region:H0:σ12≤σ22;H1:σ12>σ22:F≥Fα(n1+n2−2):H0:σ12≥σ22;H1:σ12<σ22:F≤F1−α(n1+n2−2)
大子样总体均值的假设检验
μ \mu μ假设检验是 X ∼ N ( μ , σ 2 ) X\sim N(\mu,\sigma^2) X∼N(μ,σ2)下提出的,当 X X X不能服从正态分布时,只需要 n n n足够大,对 μ \mu μ均可用 Z Z Z检验。
方差已知
选取统计量: Z = X ˉ − μ 0 σ / n ∼ N ( 0 , 1 ) Z=\frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}}\sim N(0,1) Z=σ/n Xˉ−μ0∼N(0,1)【近似】
方差未知
选取统计量: Z = X ˉ − μ 0 S / n ∼ N ( 0 , 1 ) Z=\frac{\bar{X}-\mu_0}{S/\sqrt{n}}\sim N(0,1) Z=S/n Xˉ−μ0∼N(0,1)【近似】
大子样总体均值相等的假设检验
方差已知
选取统计量: X ˉ − Y ˉ σ 1 2 n 1 + σ 2 2 n 2 ∼ N ( 0 , 1 ) \frac{\bar{X}-\bar{Y}}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}\sim N(0,1) n1σ12+n2σ22 Xˉ−Yˉ∼N(0,1)【近似、大子样】
方差未知
选取统计量: X ˉ − Y ˉ S 1 2 n 1 + S 2 2 n 2 ∼ N ( 0 , 1 ) \frac{\bar{X}-\bar{Y}}{\sqrt{\frac{S_1^2}{n_1}+\frac{S_2^2}{n_2}}}\sim N(0,1) n1S12+n2S22 Xˉ−Yˉ∼N(0,1)
若考虑 X ˉ 、 Y ˉ \bar{X}、\bar{Y} Xˉ、Yˉ, ∣ X ˉ − Y ˉ ∣ > U α 2 S 1 2 n 1 + S 2 2 n 2 |\bar{X}-\bar{Y}|>U_{\frac{\alpha}{2}}\sqrt{\frac{S_1^2}{n_1}+\frac{S_2^2}{n_2}} ∣Xˉ−Yˉ∣>U2αn1S12+n2S22
非正态总体的参数假设检验
0-1分布
P { X = x } = p x ( 1 − p ) 1 − x P\{X=x\}=p^x(1-p)^{1-x} P{X=x}=px(1−p)1−x
H 0 : p = p 0 ; H 1 : p ≠ p 0 H_0:p=p_0;H_1:p\neq p_0 H0:p=p0;H1:p=p0
E ( X ˉ ) = p , D ( X ˉ ) = 1 n p ( 1 − p ) E(\bar{X})=p,D(\bar{X})=\frac{1}{n}p(1-p) E(Xˉ)=p,D(Xˉ)=n1p(1−p)
当 n n n很大时, U = X ˉ − p p ( 1 − p ) n ∼ N ( 0 , 1 ) U=\frac{\bar{X}-p}{\sqrt{\frac{p(1-p)}{n}}}\sim N(0,1) U=np(1−p) Xˉ−p∼N(0,1)
拒绝域: ∣ U ∣ = ∣ X ˉ − p 0 ∣ p 0 ( 1 − p 0 ) / n ≥ U α 2 |U|=\frac{|\bar{X}-p_0|}{\sqrt{p_0(1-p_0)}/{\sqrt{n}}}\ge U_\frac{\alpha}{2} ∣U∣=p0(1−p0) /n ∣Xˉ−p0∣≥U2α
非正态总体均值的假设检验
H 0 : μ = μ 0 ; H 1 : μ ≠ μ 0 H_0:\mu=\mu_0;H_1:\mu\neq\mu_0 H0:μ=μ0;H1:μ=μ0
中心极限定理:当 n n n充分大时,
方差已知
选取统计量: U = X ˉ − μ 0 σ / n ∼ N ( 0 , 1 ) U=\frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}}\sim N(0,1) U=σ/n Xˉ−μ0∼N(0,1)【近似】
方差未知
选取统计量: U = X ˉ − μ 0 S / n ∼ N ( 0 , 1 ) U=\frac{\bar{X}-\mu_0}{S/\sqrt{n}}\sim N(0,1) U=S/n Xˉ−μ0∼N(0,1)【近似】
拒绝域: ∣ U ∣ ≥ U α 2 |U|\ge U_{\frac{\alpha}{2}} ∣U∣≥U2α
两个非正态筒体均值的假设检验
方差已知
选取统计量: U = X ˉ − Y ˉ − ( μ 1 − μ 2 ) σ 1 2 n 1 + σ 2 2 n 2 ∼ N ( 0 , 1 ) U=\frac{\bar{X}-\bar{Y}-(\mu_1-\mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}\sim N(0,1) U=n1σ12+n2σ22 Xˉ−Yˉ−(μ1−μ2)∼N(0,1)【近似】
方差未知
选取统计量: U = X ˉ − Y ˉ − ( μ 1 − μ 2 ) S 1 2 n 1 + S 2 2 n 2 ∼ N ( 0 , 1 ) U=\frac{\bar{X}-\bar{Y}-(\mu_1-\mu_2)}{\sqrt{\frac{S_1^2}{n_1}+\frac{S_2^2}{n_2}}}\sim N(0,1) U=n1S12+n2S22 Xˉ−Yˉ−(μ1−μ2)∼N(0,1)【近似】
拒绝域: ∣ U ∣ ≥ U α 2 |U|\ge U_{\frac{\alpha}{2}} ∣U∣≥U2α
分布拟合检验 卡方检验法
H 0 : F ( x ) = F 0 ( x ) ; H 1 : F ( x ) ≠ F 0 ( x ) H_0:F(x)=F_0(x);\quad H_1:F(x)\neq F_0(x) H0:F(x)=F0(x);H1:F(x)=F0(x)
F(x)不含未知参数
选取统计量: χ 2 = ∑ i = 1 k ( f i − n p i ) 2 n p i ∼ χ 2 ( k − 1 ) \chi^2=\sum\limits_{i=1}^{k}\frac{(f_i-np_i)^2}{np_i}\sim \chi^2(k-1) χ2=i=1∑knpi(fi−npi)2∼χ2(k−1)【 H 0 H_0 H0为真, n n n充分大】
拒绝域: χ 2 ≥ χ α 2 ( k − 1 ) \chi^2\ge\chi^2_\alpha(k-1) χ2≥χα2(k−1)
F(x)含有未知参数
- 先求未知参数的极大似然估计 p ^ i = p ^ ( A i ) \hat{p}_i=\hat{p}(A_i) p^i=p^(Ai)
- 选取统计量: χ 2 = ∑ i = 1 k ( f i − n p ^ i ) 2 n p ^ i = ∑ i = 1 k f i 2 n p ^ i − n ∼ χ 2 ( k − r − 1 ) \chi^2=\sum\limits_{i=1}^{k}\frac{(f_i-n\hat{p}_i)^2}{n\hat{p}_i}=\sum\limits_{i=1}^{k}\frac{f_i^2}{n\hat{p}_i}-n\sim \chi^2(k-r-1) χ2=i=1∑knp^i(fi−np^i)2=i=1∑knp^ifi2−n∼χ2(k−r−1)[ H 0 H_0 H0为真, n n n充分大] (r是未知参数个数)
- 拒绝域: χ 2 ≥ χ α 2 ( k − r − 1 ) \chi^2\ge \chi^2_\alpha(k-r-1) χ2≥χα2(k−r−1)
注意:
- 大样本, n ≥ 50 n\ge 50 n≥50
- 要求各组理论频数 n p i ≥ 5 np_i\ge5 npi≥5或 n p ^ i ≥ 5 n\hat{p}_i\ge 5 np^i≥5
- 一般数据分成7到14组
存在问题:
- 分组不同,拟合的结果不同
- 需要有足够的样本容量
- 对连续型变量的优度拟合, χ 2 \chi^2 χ2检验不是理想的方法
独立性检验(相关性检验)
H 0 : X , Y H_0:X,Y H0:X,Y 独立; H 1 : X , Y \quad H_1:X,Y H1:X,Y 不独立
选取统计量: χ 2 = n ∑ i = 1 m ∑ j = 1 k ( n i j − n i ⋅ n ⋅ j n ) 2 n i ⋅ n ⋅ j = n ( ∑ i = 1 m ∑ j = 1 k n i j 2 n i ⋅ n ⋅ j − 1 ) ∼ χ 2 ( ( m − 1 ) ( k − 1 ) ) \chi^2=n\sum\limits_{i=1}^{m}\sum\limits_{j=1}^{k}\frac{(n_{ij}-\frac{n_{i\cdot}n_{\cdot j}}{n})^2}{n_{i\cdot}n_{\cdot j}}=n(\sum\limits_{i=1}^{m}\sum\limits_{j=1}^{k}\frac{n_{ij}^2}{n_{i\cdot}n_{\cdot j}}-1)\sim \chi^2((m-1)(k-1)) χ2=ni=1∑mj=1∑kni⋅n⋅j(nij−nni⋅n⋅j)2=n(i=1∑mj=1∑kni⋅n⋅jnij2−1)∼χ2((m−1)(k−1))【近似】
拒绝域: χ 2 ≥ χ α 2 ( ( m − 1 ) ( k − 1 ) ) \chi^2\ge \chi^2_\alpha((m-1)(k-1)) χ2≥χα2((m−1)(k−1))
同时,还能通过独立性判断相关性。
【概率论与数理统计(研究生课程)】知识点总结8(假设检验)相关推荐
- 【概率论与数理统计(研究生课程)】知识点总结9(回归分析)
原文地址:[概率论与数理统计(研究生课程)]知识点总结9(回归分析) 一元线性回归模型 y = β 0 + β 1 x + ϵ , ϵ ∼ N ( μ , σ 2 ) E ( ϵ ) = 0 , D ...
- 电子科技大学-《图论》-研究生课程-知识点汇总-anki卡片定义定理整理-503张卡片
平凡图的定义 只有一个顶点而无边 简单图的定义 没有重边的图 重边的定义 连接两个顶点间的边的数量若大于1则为重边 u和v相邻是什么意思 u和v这两个端点间有边 端点u与边e相关联是什么意思 e的一个 ...
- 《概率论与数理统计》笔记——知识点总结
第一章:
- 【概率论与数理统计】常见分布特征函数推导过程
相关内容: [概率论与数理统计(研究生课程)]知识点总结1(概率论基础) [概率论与数理统计(研究生课程)]知识点总结2(一维随机变量及其分布) [概率论与数理统计(研究生课程)]知识点总结3(二维随 ...
- 概率论由相关性求数学期望和方差的公式_《概率论与数理统计》(公共课—计算机科学与技术本科专业)教学大纲(2017.2编)资料...
<概率论与数理统计>课程教学大纲 (2016版) 一.课程基本信息 课程名称:概率论与数理统计 英文名称:Probability Theory and Mathematical Stati ...
- 概率论 方差公式_概率论与数理统计课程教学、学习基本要求和教学建议
点"考研竞赛数学"↑可每天"涨姿势"哦! 工科类本科数学基础课程教学基本要求 概率论与数理统计部分 各门课程的内容按教学要求的不同,都分为两个层次.文中用黑体字 ...
- 概率论与数理统计 | 知识点总结(下)
参考资料 最大似然估计例题 何书元<概率论与数理统计> 6. 描述性统计 统计学的做法分为两种: 描述性统计: 从数据样本中计算一些平均值.标准差.最小值.最大值等概括 统计量, 画直方图 ...
- 概率论课程设计利用Matlab,概率论与数理统计课程设计
概率论与数理统计课程设计 概率论课程设计 1110410327 苏浪1 国内产值与人力资本的回归分析 目录 一. 设计目的 二. 设计问题 三. 设计原理 四. 设计程序 设计步骤 设计结果 1.得到 ...
- 概率论与数理统计--知识点
概率论 (<概率论与数理统计> 主编 金大勇 徐永) 1.2.3 概率的性质 加法定理 A,B是任意两个事件,则P(AUB)=P(A)+P(B)-P(AB) A,B是任意两个事件,则P(A ...
最新文章
- 【c语言】蓝桥杯算法提高 c++_ch02_01
- python网页数据存入数据库_python网络爬虫抓取动态网页并将数据存入数据库MySQL...
- 不是开发者也能玩得high!科大讯飞1024开发者节,看AI如何改变你的生活
- php中把美国时间转为北京时间的自定义
- 在 .NET 中使用 C# 处理 YAML
- python loads_python dumps和loads区别详解
- 公安计算机技能测试题库,2018公安文职考试题库:行政职业能力测验
- 从mysql到大数据(二)--数据库的认识
- 修改php.ini没效果,修改php.ini后没有效果
- 带刺的下沉市场:小镇青年要的不止是9块9包邮
- 需求分析与系统设计读书笔记之五
- 【Linux】之 从源代码安装软件(HelloWorld)
- 菜鸟历程1腾讯云服务器 10元学生套餐购买
- 2020最新注册卡密微信在线充值购卡功能(适用于各种网络验证开发)【易语言源码】
- 中国剩余定理求解同余线性方程组(模数互素和非互素的情况)
- 毕业一周年--IT在路上
- java程序设计实验报告代写_代写file I/O作业、代写java Scanner I/O程序、代写java编程作业、代做java实验报告...
- python计算学分绩点_使用Python计算研究生学分绩(绩点)
- 计算机网络第七版(谢希仁)学习目录
- 使用python创造照片马赛克