Type I Error与Type II Error

这里用一个简单的例子说明这两种错误。尿白蛋白与肌酐比值（Urinary Albumin to Creatinine Ratio，ACR）是肾脏化验的一个化验项，正常范围是小于3。这个指标用来衡量尿液中的蛋白质数量，如果肾脏发生病变从血液漏入尿液中的蛋白质就会超出正常范围。假设患有肾病的个体ACR为Y1Y_1Y1，未患肾病的个体ACR为Y0Y_0Y0，其中Y1Y_1Y1的概率密度为f(y,θ1)f(y,\theta_1)f(y,θ1)，Y0Y_0Y0的概率密度为f(y,θ0)f(y,\theta_0)f(y,θ0)。人群中患肾病的个体占比为π\piπ，未患肾病的个体占比为1−π1-\pi1−π，则人群ACR记为YYY，其分布为
f(y)=πf(y,θ1)+(1−π)f(y,θ0)f(y) = \pi f(y,\theta_1) + (1-\pi)f(y,\theta_0) f(y)=πf(y,θ1)+(1−π)f(y,θ0)
记其均值为μ\muμ，则ACR检验的经验法则可以用单侧检验表示
H0:μ<μ0Ha:μ≥μ0H_0:\mu < \mu_0 \\H_a:\mu \ge \mu_0 H0:μ<μ0Ha:μ≥μ0
其中μ0=3\mu_0=3μ0=3。现在分析一下这个检验。在假设检验中，Type I Error（也叫false positive rate，假阳性）是
α=P[rejectH0∣H0istrue]\alpha = P[reject\ H_0|H_0\ is\ true] α=P[reject H0∣H0 is true]
Type II Error（也叫false negative rate，假阴性）是
β=P[acceptH0∣Haistrue]\beta = P[accept\ H_0|H_a\ is\ true] β=P[accept H0∣Ha is true]
检验的势被定义为
Power=1−β=P[rejectH0∣H1istrue]Power = 1-\beta = P[reject\ H_0|H_1\ is\ true] Power=1−β=P[reject H0∣H1 is true]
在这个例子中，Type I Error就是未患肾病的个体被医生认为患有肾病，Type II Error就是患有肾病的个体被医生认为未患肾病。计算一下这两类错误发生的概率以及检验的势
α=∫μ0+∞f(y,θ0)dyβ=∫0μ0f(y,θ1)dyPower=1−β=∫μ0+∞f(y,θ1)dy\alpha = \int_{\mu_0}^{+\infty} f(y,\theta_0)dy \\ \beta = \int_{0}^{\mu_0} f(y,\theta_1)dy \\ Power = 1-\beta = \int_{\mu_0}^{+\infty} f(y,\theta_1)dy α=∫μ0+∞f(y,θ0)dyβ=∫0μ0f(y,θ1)dyPower=1−β=∫μ0+∞f(y,θ1)dy
其中
∂αμ0=−f(y,θ0)<0,∂βμ0=f(y,θ1)>0\frac{\partial \alpha}{\mu_0} = -f(y,\theta_0)<0, \frac{\partial \beta}{\mu_0}=f(y,\theta_1)>0 μ0∂α=−f(y,θ0)<0,μ0∂β=f(y,θ1)>0
因此随着判断准则在(0,+∞)(0,+\infty)(0,+∞)之间增加的时候，假阳性的概率会逐渐减小，假阴性的概率会逐渐增大，二者总是此消彼长的。假设检验的目标一般是在给定的α\alphaα的情况下，找到最优的critical region最大化检验的势。

单正态总体样本的假设检验

f(y,θ0)f(y,\theta_0)f(y,θ0)与f(y,θ1)f(y,\theta_1)f(y,θ1)正态分布，假设前者均值为μ0\mu_0μ0、标准差为σ0\sigma_0σ0，为了验证ACR的正常范围是小于3这个判断标准是否合理，现在从f(y,θ0)f(y,\theta_0)f(y,θ0)中随机抽取了12个个体，测得其ACR为

个体1	2	3	4	5	6	7	8	9	10	11	12
1.1	1.7	1.9	2.0	2.0	2.1	2.2	2.7	2.9	3.2	3.3	3.8

假设未患肾病群体ACR均值用μ0\mu_0μ0表示，假设检验为
H0:μ0=3Ha:μ0<3H_0:\mu_0 = 3 \\ H_a:\mu_0 < 3 H0:μ0=3Ha:μ0<3
假设未患肾病群体ACR的简单随机样本为{X1,⋯,Xn}\{X_1,\cdots,X_n\}{X1,⋯,Xn}，则样本均值Xˉ\bar{X}Xˉ是μ0\mu_0μ0的UMVUE。

Z检验

假设单正态总体σ0\sigma_0σ0已知，要检验均值是否等于一个已知量ccc，可以使用Z检验。假设检验水平为α\alphaα（这个α\alphaα就是假阳性的概率）
Z≜Xˉ−cσ0/n∼N(0,1)Z \triangleq \frac{\bar{X}-c}{\sigma_0/\sqrt{n}} \sim N(0,1) Z≜σ0/nXˉ−c∼N(0,1)
双边检验
H0:μ0=cHa:μ0≠cH_0:\mu_0 = c \\ H_a:\mu_0 \ne c H0:μ0=cHa:μ0=c
原假设的拒绝域为
∣Z∣≥Zα/2⇒Xˉ∈(−∞,c−σ0nZα/2]∩[c+σ0nZα/2,∞)|Z| \ge Z_{\alpha/2} \Rightarrow \bar{X} \in(-\infty,c-\frac{\sigma_0}{\sqrt{n}}Z_{\alpha/2}] \cap [ c+\frac{\sigma_0}{\sqrt{n}}Z_{\alpha/2},\infty) ∣Z∣≥Zα/2⇒Xˉ∈(−∞,c−nσ0Zα/2]∩[c+nσ0Zα/2,∞)
P值为
p=2[1−Φ(∣Z∣)]p = 2[1-\Phi(|Z|)] p=2[1−Φ(∣Z∣)]
单边检验分为左侧检验和右侧检验，左侧检验为
H0:μ0≥cHa:μ0<cH_0:\mu_0 \ge c \\ H_a:\mu_0 < c H0:μ0≥cHa:μ0<c
原假设的拒绝域为
Z<−Zα⇒Xˉ∈(−∞,c−σ0nZα)Z < -Z_{\alpha} \Rightarrow \bar{X} \in(-\infty,c-\frac{\sigma_0}{\sqrt{n}}Z_{\alpha}) Z<−Zα⇒Xˉ∈(−∞,c−nσ0Zα)
P值为
p=Φ(Z)p = \Phi(Z) p=Φ(Z)
右侧检验为
H0:μ0≤cHa:μ0>cH_0:\mu_0 \le c \\ H_a:\mu_0 > c H0:μ0≤cHa:μ0>c
原假设的拒绝域为
Z>Zα⇒Xˉ∈(c+σ0nZα,∞)Z > Z_{\alpha} \Rightarrow \bar{X} \in (c+\frac{\sigma_0}{\sqrt{n}}Z_{\alpha},\infty) Z>Zα⇒Xˉ∈(c+nσ0Zα,∞)
P值为
p=1−Φ(Z)p = 1-\Phi(Z) p=1−Φ(Z)
需要注意的是，往往这个σ0\sigma_0σ0是一个猜测值或者经验值，所以我们也需要检验一下真实的标准差是不是这个
H0:Var(X)=σ02Ha:Var(X)≠σ02H_0:Var(X) = \sigma^2_0 \\ H_a : Var(X) \ne \sigma^2_0 H0:Var(X)=σ02Ha:Var(X)=σ02
用样本方差S2S^2S2构造Chi统计量
χ02=(n−1)S2σ02∼χ2(n−1)\chi^2_0 = \frac{(n-1)S^2}{\sigma_0^2} \sim \chi^2(n-1) χ02=σ02(n−1)S2∼χ2(n−1)
假设检验水平为α\alphaα，原假设的拒绝域为
χ02∈[0,χ2(α/2,n−1)]∩[χ2(1−α/2,n−1),∞)\chi^2_0 \in [0,\chi^2(\alpha/2,n-1) ] \cap [\chi^2(1-\alpha/2,n-1),\infty) χ02∈[0,χ2(α/2,n−1)]∩[χ2(1−α/2,n−1),∞)

t检验

假设单正态总体σ0\sigma_0σ0未知，要检验均值是否等于一个已知量ccc，可以使用t检验。假设检验水平为α\alphaα
T≜Xˉ−cS/n∼t(n−1)T \triangleq \frac{\bar{X}-c}{S/\sqrt{n}} \sim t(n-1) T≜S/nXˉ−c∼t(n−1)
双边检验
H0:μ0=cHa:μ0≠cH_0:\mu_0 = c \\ H_a:\mu_0 \ne c H0:μ0=cHa:μ0=c
原假设的拒绝域为
∣T∣≥tα/2,n−1⇒Xˉ∈(−∞,c−Sntα/2,n−1]∩[c+Sntα/2,n−1,∞)|T| \ge t_{\alpha/2,n-1} \Rightarrow \bar{X} \in(-\infty,c-\frac{S}{\sqrt{n}}t_{\alpha/2,n-1}] \cap [ c+\frac{S}{\sqrt{n}}t_{\alpha/2,n-1},\infty) ∣T∣≥tα/2,n−1⇒Xˉ∈(−∞,c−nStα/2,n−1]∩[c+nStα/2,n−1,∞)
单边检验分为左侧检验和右侧检验，左侧检验为
H0:μ0≥cHa:μ0<cH_0:\mu_0 \ge c \\ H_a:\mu_0 < c H0:μ0≥cHa:μ0<c
原假设的拒绝域为
T<−tα,n−1⇒Xˉ∈(−∞,c−Sntα,n−1)T < - t_{\alpha,n-1} \Rightarrow \bar{X} \in(-\infty,c-\frac{S}{\sqrt{n}} t_{\alpha,n-1} ) T<−tα,n−1⇒Xˉ∈(−∞,c−nStα,n−1)
右侧检验为
H0:μ0≤cHa:μ0>cH_0:\mu_0 \le c \\ H_a:\mu_0 > c H0:μ0≤cHa:μ0>c
原假设的拒绝域为
T>tα,n−1⇒Xˉ∈(c+Sntα,n−1,∞)T > t_{\alpha,n-1} \Rightarrow \bar{X} \in (c+\frac{S}{\sqrt{n}} t_{\alpha,n-1} ,\infty) T>tα,n−1⇒Xˉ∈(c+nStα,n−1,∞)

双正态总体样本的假设检验

假设数据生成过程（DGP，data generating process）是
yij=μi+ϵij,ϵij∼iidN(0,σ2),i=1,2;j=1,⋯,ny_{ij} = \mu_i + \epsilon_{ij},\epsilon_{ij} \sim_{iid}N(0,\sigma^2),i=1,2;j=1,\cdots,n yij=μi+ϵij,ϵij∼iidN(0,σ2),i=1,2;j=1,⋯,n
yijy_{ij}yij是第iii组试验的第jjj个试验单位的response的值，这个模型认为这个值由两部分组成，一部分是第iii组试验的组内平均μi\mu_iμi，另一部分是随机误差ϵij\epsilon_{ij}ϵij。两正态总体样本的假设检验想研究的问题其实是μ1\mu_1μ1与μ2\mu_2μ2的大小关系，从而比较两种不同的试验处理对response的影响。对于比较一般的情况，假设第一组试验的方差为σ12\sigma_1^2σ12，试验单位数目为n1n_1n1；第一组试验的方差为σ22\sigma_2^2σ22，试验单位数目为n2n_2n2。

Z检验

当σ1\sigma_1σ1与σ2\sigma_2σ2已知时，可以用Z检验。
双边检验：
H0:μ1=μ2Ha:μ1≠μ2H_0:\mu_1=\mu_2 \\ H_a: \mu_1 \ne \mu_2 H0:μ1=μ2Ha:μ1=μ2
构造Z统计量
Z=yˉ1−yˉ1σ12n1+σ22n2∼N(0,1)Z = \frac{\bar{y}_1-\bar{y}_1}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}} \sim N(0,1) Z=n1σ12+n2σ22yˉ1−yˉ1∼N(0,1)
原假设的拒绝域为
∣Z∣≥Zα/2|Z| \ge Z_{\alpha/2} ∣Z∣≥Zα/2
P值为
p=2[1−Φ(∣Z∣)]p = 2[1-\Phi(|Z|)] p=2[1−Φ(∣Z∣)]
单侧检验与单样本的类似。

t检验

当σ1\sigma_1σ1与σ2\sigma_2σ2未知时，可以用t检验。考虑双边检验：

同方差

如果σ1=σ2\sigma_1=\sigma_2σ1=σ2，t统计量为
T=yˉ1−yˉ1S12n1+S22n2∼t(v)v=n1+n2−2T = \frac{\bar{y}_1-\bar{y}_1}{\sqrt{\frac{S_1^2}{n_1}+\frac{S_2^2}{n_2}}} \sim t(v) \\ v = n_1 + n_2 -2 T=n1S12+n2S22yˉ1−yˉ1∼t(v)v=n1+n2−2
但如果不确定同方差是不是真的成立需要做同方差检验
H0:σ12=σ22H_0:\sigma_1^2 = \sigma_2^2 H0:σ12=σ22
这个可以用F检验，构造F统计量
F0=S12S22∼F(n1−1,n2−1)F_0 = \frac{S_1^2}{S_2^2} \sim F(n_1-1,n_2-1) F0=S22S12∼F(n1−1,n2−1)
原假设的拒绝域为
F0∈[0,F(α/2,n1−1,n2−1)]∩[F(1−α/2,n1−1,n2−1),∞)F_0 \in [0,F(\alpha/2,n_1-1,n_2-1) ] \cap [F(1-\alpha/2,n_1-1,n_2-1),\infty) F0∈[0,F(α/2,n1−1,n2−1)]∩[F(1−α/2,n1−1,n2−1),∞)

异方差

如果上面的检验拒绝了原假设，还是可以用t检验，只是自由度的计算要改成
v=(S12n1+S22n2)2(S12n1)2n1−1+(S22n2)2n2−1v = \frac{(\frac{S_1^2}{n_1}+\frac{S_2^2}{n_2})^2}{\frac{(\frac{S_1^2}{n_1})^2}{n_1-1} + \frac{(\frac{S_2^2}{n_2})^2}{n_2-1}} v=n1−1(n1S12)2+n2−1(n2S22)2(n1S12+n2S22)2

配对t检验

配对t检验（paired t test）与两样本的t检验有区别。配对t检验是处理配对比较试验（paired comparison）的统计方法。举一个比较简单的配对比较试验的例子。某桑拿房宣称自家定制桑拿配合自创按摩服务可以治疗高血脂。某公众号团队为了验证这家桑拿房的说法，随机选择了2n2n2n个人。测量并记录其初始的血清总胆固醇（TC），并将TC相近的分为一对，记其TC均值为{βi}i=1n\{\beta_i\}_{i=1}^n{βi}i=1n。在每一对中随机抽一人去体验这家桑拿房定制桑拿配合自创按摩服务，另一个人去普通的桑拿房。体验完毕后测血清总胆固醇为{(y1i,y2i)}i=1n\{(y_{1i},y_{2i})\}_{i=1}^n{(y1i,y2i)}i=1n，其中111是去体验定制桑拿配合自创按摩服务那一组。则建立体验完毕后TC的统计模型
yij=μi+βj+ϵijϵij∼iidN(0,σi2);i=1,2;j=1,⋯,ny_{ij} = \mu_{i} + \beta_{j} + \epsilon_{ij}\\ \epsilon_{ij}\sim_{iid}N(0,\sigma_i^2);i=1,2;j=1,\cdots,n yij=μi+βj+ϵijϵij∼iidN(0,σi2);i=1,2;j=1,⋯,n
则我们要研究的问题可以写成假设检验
H0:μ1<μ2Ha:μ1≥μ2H_0:\mu_1 < \mu_2 \\ H_a: \mu_1 \ge \mu_2 H0:μ1<μ2Ha:μ1≥μ2
从统计模型上来看配对t检验和两样本t检验就是有明显差别的，配对t检验一般用来处理成对数据的问题。记dj=y1j−y2j=μ1−μ2+(ϵ1j−ϵ2j)d_j = y_{1j}-y_{2j} = \mu_1 - \mu_2 + (\epsilon_{1j}-\epsilon_{2j})dj=y1j−y2j=μ1−μ2+(ϵ1j−ϵ2j)，定义μd=μ1−μ2\mu_d = \mu_1 - \mu_2μd=μ1−μ2，则假设检验又可以写成
H0:μd<0Ha:μd≥0H_0:\mu_d<0 \\ H_a: \mu_d \ge 0 H0:μd<0Ha:μd≥0
由于djd_jdj是服从正态分布的，所以这个假设检验可以用单正态总体样本的t检验来做。

UA MATH571B 试验设计II 简单试验的分析方法相关推荐

UA MATH571B 试验设计总结判断试验类型的例题
UA MATH571B 试验设计总结判断试验类型的例题 2015年5月第二题:Blocking factorial design 2015年5月第三题:Split-plot Design 2017 ...
UA MATH571B 试验设计总结试验的类型与选择
UA MATH571B 试验设计总结试验的类型与选择试验的意义,试验设计的意义单个treatment factor的试验多个treatment factor的试验多个treatment f ...
UA MATH571B 试验设计 QE练习题不使用代码分析试验结果I
UA MATH571B 试验设计 QE练习题不使用代码分析试验结果I 2014年5月第一题 2015年5月第一题 2016年5月第二题 2017年1月第一题不使用代码分析试验结果考察的是对试验设计 ...
UA MATH571B 试验设计 Quarter 2-level析因设计
UA MATH571B 试验设计 Quarter 2-level析因设计 2k−22^{k-2}2k−2设计的基本概念 2k−22^{k-2}2k−2试验结果的SAS分析 Quarter 2-leve ...
UA MATH571B 试验设计 2k析因设计理论下
UA MATH571B 试验设计 2k析因设计理论下 Confounding Blocking 222^222析因设计 Blocking 232^323析因设计 principal block Fra ...
UA MATH571B 试验设计 QE练习题1
UA MATH571B 试验设计 QE练习题1 第一题第二题第三题这是2014年一月Methodology的1-3题. 第一题希望今年的考试没有这种概念题! 第一个是对的,比较多正态总体的方差 ...
UA MATH571B 试验设计IV RCBD与Latin Square上
UA MATH571B 试验设计IV RCBD与Latin Square上 RCBD Latin Square Design Graeco-Latin Square Design BIBD RCBD ...
UA MATH571B 试验设计I 试验设计简介
UA MATH571B 试验设计I 试验设计简介试验设计的作用与意义混淆变量相关性与因果试验设计的流程与目标消除偏差对照组随机试验 Blinding 减少抽样误差重复试验平衡试验和区 ...
UA MATH571B 试验设计 QE练习题平衡非完全区组设计BIBD
UA MATH571B 试验设计 QE练习题平衡非完全区组设计BIBD 2015年1月第一题 2018年1月第一题 2015年1月第一题 Part a 显然这是一个BIBD(Balanced Inc ...

UA MATH571B 试验设计II 简单试验的分析方法