UA MATH571B 试验设计II 简单试验的分析方法

  • Type I Error与Type II Error
  • 单正态总体样本的假设检验
    • Z检验
    • t检验
  • 双正态总体样本的假设检验
    • Z检验
    • t检验
      • 同方差
      • 异方差
  • 配对t检验

Type I Error与Type II Error

这里用一个简单的例子说明这两种错误。尿白蛋白与肌酐比值(Urinary Albumin to Creatinine Ratio,ACR)是肾脏化验的一个化验项,正常范围是小于3。这个指标用来衡量尿液中的蛋白质数量,如果肾脏发生病变从血液漏入尿液中的蛋白质就会超出正常范围。假设患有肾病的个体ACR为Y1Y_1Y1​,未患肾病的个体ACR为Y0Y_0Y0​,其中Y1Y_1Y1​的概率密度为f(y,θ1)f(y,\theta_1)f(y,θ1​),Y0Y_0Y0​的概率密度为f(y,θ0)f(y,\theta_0)f(y,θ0​)。人群中患肾病的个体占比为π\piπ,未患肾病的个体占比为1−π1-\pi1−π,则人群ACR记为YYY,其分布为
f(y)=πf(y,θ1)+(1−π)f(y,θ0)f(y) = \pi f(y,\theta_1) + (1-\pi)f(y,\theta_0) f(y)=πf(y,θ1​)+(1−π)f(y,θ0​)
记其均值为μ\muμ,则ACR检验的经验法则可以用单侧检验表示
H0:μ<μ0Ha:μ≥μ0H_0:\mu < \mu_0 \\H_a:\mu \ge \mu_0 H0​:μ<μ0​Ha​:μ≥μ0​
其中μ0=3\mu_0=3μ0​=3。现在分析一下这个检验。在假设检验中,Type I Error(也叫false positive rate,假阳性)是
α=P[rejectH0∣H0istrue]\alpha = P[reject\ H_0|H_0\ is\ true] α=P[reject H0​∣H0​ is true]
Type II Error(也叫false negative rate,假阴性)是
β=P[acceptH0∣Haistrue]\beta = P[accept\ H_0|H_a\ is\ true] β=P[accept H0​∣Ha​ is true]
检验的势被定义为
Power=1−β=P[rejectH0∣H1istrue]Power = 1-\beta = P[reject\ H_0|H_1\ is\ true] Power=1−β=P[reject H0​∣H1​ is true]
在这个例子中,Type I Error就是未患肾病的个体被医生认为患有肾病,Type II Error就是患有肾病的个体被医生认为未患肾病。计算一下这两类错误发生的概率以及检验的势
α=∫μ0+∞f(y,θ0)dyβ=∫0μ0f(y,θ1)dyPower=1−β=∫μ0+∞f(y,θ1)dy\alpha = \int_{\mu_0}^{+\infty} f(y,\theta_0)dy \\ \beta = \int_{0}^{\mu_0} f(y,\theta_1)dy \\ Power = 1-\beta = \int_{\mu_0}^{+\infty} f(y,\theta_1)dy α=∫μ0​+∞​f(y,θ0​)dyβ=∫0μ0​​f(y,θ1​)dyPower=1−β=∫μ0​+∞​f(y,θ1​)dy
其中
∂αμ0=−f(y,θ0)<0,∂βμ0=f(y,θ1)>0\frac{\partial \alpha}{\mu_0} = -f(y,\theta_0)<0, \frac{\partial \beta}{\mu_0}=f(y,\theta_1)>0 μ0​∂α​=−f(y,θ0​)<0,μ0​∂β​=f(y,θ1​)>0
因此随着判断准则在(0,+∞)(0,+\infty)(0,+∞)之间增加的时候,假阳性的概率会逐渐减小,假阴性的概率会逐渐增大,二者总是此消彼长的。假设检验的目标一般是在给定的α\alphaα的情况下,找到最优的critical region最大化检验的势。

单正态总体样本的假设检验

f(y,θ0)f(y,\theta_0)f(y,θ0​)与f(y,θ1)f(y,\theta_1)f(y,θ1​)正态分布,假设前者均值为μ0\mu_0μ0​、标准差为σ0\sigma_0σ0​,为了验证ACR的正常范围是小于3这个判断标准是否合理,现在从f(y,θ0)f(y,\theta_0)f(y,θ0​)中随机抽取了12个个体,测得其ACR为

个体1 2 3 4 5 6 7 8 9 10 11 12
1.1 1.7 1.9 2.0 2.0 2.1 2.2 2.7 2.9 3.2 3.3 3.8

假设未患肾病群体ACR均值用μ0\mu_0μ0​表示,假设检验为
H0:μ0=3Ha:μ0<3H_0:\mu_0 = 3 \\ H_a:\mu_0 < 3 H0​:μ0​=3Ha​:μ0​<3
假设未患肾病群体ACR的简单随机样本为{X1,⋯,Xn}\{X_1,\cdots,X_n\}{X1​,⋯,Xn​},则样本均值Xˉ\bar{X}Xˉ是μ0\mu_0μ0​的UMVUE。

Z检验

假设单正态总体σ0\sigma_0σ0​已知,要检验均值是否等于一个已知量ccc,可以使用Z检验。假设检验水平为α\alphaα(这个α\alphaα就是假阳性的概率)
Z≜Xˉ−cσ0/n∼N(0,1)Z \triangleq \frac{\bar{X}-c}{\sigma_0/\sqrt{n}} \sim N(0,1) Z≜σ0​/n​Xˉ−c​∼N(0,1)
双边检验
H0:μ0=cHa:μ0≠cH_0:\mu_0 = c \\ H_a:\mu_0 \ne c H0​:μ0​=cHa​:μ0​​=c
原假设的拒绝域为
∣Z∣≥Zα/2⇒Xˉ∈(−∞,c−σ0nZα/2]∩[c+σ0nZα/2,∞)|Z| \ge Z_{\alpha/2} \Rightarrow \bar{X} \in(-\infty,c-\frac{\sigma_0}{\sqrt{n}}Z_{\alpha/2}] \cap [ c+\frac{\sigma_0}{\sqrt{n}}Z_{\alpha/2},\infty) ∣Z∣≥Zα/2​⇒Xˉ∈(−∞,c−n​σ0​​Zα/2​]∩[c+n​σ0​​Zα/2​,∞)
P值为
p=2[1−Φ(∣Z∣)]p = 2[1-\Phi(|Z|)] p=2[1−Φ(∣Z∣)]
单边检验分为左侧检验和右侧检验,左侧检验为
H0:μ0≥cHa:μ0<cH_0:\mu_0 \ge c \\ H_a:\mu_0 < c H0​:μ0​≥cHa​:μ0​<c
原假设的拒绝域为
Z<−Zα⇒Xˉ∈(−∞,c−σ0nZα)Z < -Z_{\alpha} \Rightarrow \bar{X} \in(-\infty,c-\frac{\sigma_0}{\sqrt{n}}Z_{\alpha}) Z<−Zα​⇒Xˉ∈(−∞,c−n​σ0​​Zα​)
P值为
p=Φ(Z)p = \Phi(Z) p=Φ(Z)
右侧检验为
H0:μ0≤cHa:μ0>cH_0:\mu_0 \le c \\ H_a:\mu_0 > c H0​:μ0​≤cHa​:μ0​>c
原假设的拒绝域为
Z>Zα⇒Xˉ∈(c+σ0nZα,∞)Z > Z_{\alpha} \Rightarrow \bar{X} \in (c+\frac{\sigma_0}{\sqrt{n}}Z_{\alpha},\infty) Z>Zα​⇒Xˉ∈(c+n​σ0​​Zα​,∞)
P值为
p=1−Φ(Z)p = 1-\Phi(Z) p=1−Φ(Z)
需要注意的是,往往这个σ0\sigma_0σ0​是一个猜测值或者经验值,所以我们也需要检验一下真实的标准差是不是这个
H0:Var(X)=σ02Ha:Var(X)≠σ02H_0:Var(X) = \sigma^2_0 \\ H_a : Var(X) \ne \sigma^2_0 H0​:Var(X)=σ02​Ha​:Var(X)​=σ02​
用样本方差S2S^2S2构造Chi统计量
χ02=(n−1)S2σ02∼χ2(n−1)\chi^2_0 = \frac{(n-1)S^2}{\sigma_0^2} \sim \chi^2(n-1) χ02​=σ02​(n−1)S2​∼χ2(n−1)
假设检验水平为α\alphaα,原假设的拒绝域为
χ02∈[0,χ2(α/2,n−1)]∩[χ2(1−α/2,n−1),∞)\chi^2_0 \in [0,\chi^2(\alpha/2,n-1) ] \cap [\chi^2(1-\alpha/2,n-1),\infty) χ02​∈[0,χ2(α/2,n−1)]∩[χ2(1−α/2,n−1),∞)

t检验

假设单正态总体σ0\sigma_0σ0​未知,要检验均值是否等于一个已知量ccc,可以使用t检验。假设检验水平为α\alphaα
T≜Xˉ−cS/n∼t(n−1)T \triangleq \frac{\bar{X}-c}{S/\sqrt{n}} \sim t(n-1) T≜S/n​Xˉ−c​∼t(n−1)
双边检验
H0:μ0=cHa:μ0≠cH_0:\mu_0 = c \\ H_a:\mu_0 \ne c H0​:μ0​=cHa​:μ0​​=c
原假设的拒绝域为
∣T∣≥tα/2,n−1⇒Xˉ∈(−∞,c−Sntα/2,n−1]∩[c+Sntα/2,n−1,∞)|T| \ge t_{\alpha/2,n-1} \Rightarrow \bar{X} \in(-\infty,c-\frac{S}{\sqrt{n}}t_{\alpha/2,n-1}] \cap [ c+\frac{S}{\sqrt{n}}t_{\alpha/2,n-1},\infty) ∣T∣≥tα/2,n−1​⇒Xˉ∈(−∞,c−n​S​tα/2,n−1​]∩[c+n​S​tα/2,n−1​,∞)
单边检验分为左侧检验和右侧检验,左侧检验为
H0:μ0≥cHa:μ0<cH_0:\mu_0 \ge c \\ H_a:\mu_0 < c H0​:μ0​≥cHa​:μ0​<c
原假设的拒绝域为
T<−tα,n−1⇒Xˉ∈(−∞,c−Sntα,n−1)T < - t_{\alpha,n-1} \Rightarrow \bar{X} \in(-\infty,c-\frac{S}{\sqrt{n}} t_{\alpha,n-1} ) T<−tα,n−1​⇒Xˉ∈(−∞,c−n​S​tα,n−1​)
右侧检验为
H0:μ0≤cHa:μ0>cH_0:\mu_0 \le c \\ H_a:\mu_0 > c H0​:μ0​≤cHa​:μ0​>c
原假设的拒绝域为
T>tα,n−1⇒Xˉ∈(c+Sntα,n−1,∞)T > t_{\alpha,n-1} \Rightarrow \bar{X} \in (c+\frac{S}{\sqrt{n}} t_{\alpha,n-1} ,\infty) T>tα,n−1​⇒Xˉ∈(c+n​S​tα,n−1​,∞)

双正态总体样本的假设检验

假设数据生成过程(DGP,data generating process)是
yij=μi+ϵij,ϵij∼iidN(0,σ2),i=1,2;j=1,⋯,ny_{ij} = \mu_i + \epsilon_{ij},\epsilon_{ij} \sim_{iid}N(0,\sigma^2),i=1,2;j=1,\cdots,n yij​=μi​+ϵij​,ϵij​∼iid​N(0,σ2),i=1,2;j=1,⋯,n
yijy_{ij}yij​是第iii组试验的第jjj个试验单位的response的值,这个模型认为这个值由两部分组成,一部分是第iii组试验的组内平均μi\mu_iμi​,另一部分是随机误差ϵij\epsilon_{ij}ϵij​。两正态总体样本的假设检验想研究的问题其实是μ1\mu_1μ1​与μ2\mu_2μ2​的大小关系,从而比较两种不同的试验处理对response的影响。对于比较一般的情况,假设第一组试验的方差为σ12\sigma_1^2σ12​,试验单位数目为n1n_1n1​;第一组试验的方差为σ22\sigma_2^2σ22​,试验单位数目为n2n_2n2​。

Z检验

当σ1\sigma_1σ1​与σ2\sigma_2σ2​已知时,可以用Z检验。
双边检验:
H0:μ1=μ2Ha:μ1≠μ2H_0:\mu_1=\mu_2 \\ H_a: \mu_1 \ne \mu_2 H0​:μ1​=μ2​Ha​:μ1​​=μ2​
构造Z统计量
Z=yˉ1−yˉ1σ12n1+σ22n2∼N(0,1)Z = \frac{\bar{y}_1-\bar{y}_1}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}} \sim N(0,1) Z=n1​σ12​​+n2​σ22​​​yˉ​1​−yˉ​1​​∼N(0,1)
原假设的拒绝域为
∣Z∣≥Zα/2|Z| \ge Z_{\alpha/2} ∣Z∣≥Zα/2​
P值为
p=2[1−Φ(∣Z∣)]p = 2[1-\Phi(|Z|)] p=2[1−Φ(∣Z∣)]
单侧检验与单样本的类似。

t检验

当σ1\sigma_1σ1​与σ2\sigma_2σ2​未知时,可以用t检验。考虑双边检验:

同方差

如果σ1=σ2\sigma_1=\sigma_2σ1​=σ2​,t统计量为
T=yˉ1−yˉ1S12n1+S22n2∼t(v)v=n1+n2−2T = \frac{\bar{y}_1-\bar{y}_1}{\sqrt{\frac{S_1^2}{n_1}+\frac{S_2^2}{n_2}}} \sim t(v) \\ v = n_1 + n_2 -2 T=n1​S12​​+n2​S22​​​yˉ​1​−yˉ​1​​∼t(v)v=n1​+n2​−2
但如果不确定同方差是不是真的成立需要做同方差检验
H0:σ12=σ22H_0:\sigma_1^2 = \sigma_2^2 H0​:σ12​=σ22​
这个可以用F检验,构造F统计量
F0=S12S22∼F(n1−1,n2−1)F_0 = \frac{S_1^2}{S_2^2} \sim F(n_1-1,n_2-1) F0​=S22​S12​​∼F(n1​−1,n2​−1)
原假设的拒绝域为
F0∈[0,F(α/2,n1−1,n2−1)]∩[F(1−α/2,n1−1,n2−1),∞)F_0 \in [0,F(\alpha/2,n_1-1,n_2-1) ] \cap [F(1-\alpha/2,n_1-1,n_2-1),\infty) F0​∈[0,F(α/2,n1​−1,n2​−1)]∩[F(1−α/2,n1​−1,n2​−1),∞)

异方差

如果上面的检验拒绝了原假设,还是可以用t检验,只是自由度的计算要改成
v=(S12n1+S22n2)2(S12n1)2n1−1+(S22n2)2n2−1v = \frac{(\frac{S_1^2}{n_1}+\frac{S_2^2}{n_2})^2}{\frac{(\frac{S_1^2}{n_1})^2}{n_1-1} + \frac{(\frac{S_2^2}{n_2})^2}{n_2-1}} v=n1​−1(n1​S12​​)2​+n2​−1(n2​S22​​)2​(n1​S12​​+n2​S22​​)2​

配对t检验

配对t检验(paired t test)与两样本的t检验有区别。配对t检验是处理配对比较试验(paired comparison)的统计方法。举一个比较简单的配对比较试验的例子。某桑拿房宣称自家定制桑拿配合自创按摩服务可以治疗高血脂。某公众号团队为了验证这家桑拿房的说法,随机选择了2n2n2n个人。测量并记录其初始的血清总胆固醇(TC),并将TC相近的分为一对,记其TC均值为{βi}i=1n\{\beta_i\}_{i=1}^n{βi​}i=1n​。在每一对中随机抽一人去体验这家桑拿房定制桑拿配合自创按摩服务,另一个人去普通的桑拿房。体验完毕后测血清总胆固醇为{(y1i,y2i)}i=1n\{(y_{1i},y_{2i})\}_{i=1}^n{(y1i​,y2i​)}i=1n​,其中111是去体验定制桑拿配合自创按摩服务那一组。则建立体验完毕后TC的统计模型
yij=μi+βj+ϵijϵij∼iidN(0,σi2);i=1,2;j=1,⋯,ny_{ij} = \mu_{i} + \beta_{j} + \epsilon_{ij}\\ \epsilon_{ij}\sim_{iid}N(0,\sigma_i^2);i=1,2;j=1,\cdots,n yij​=μi​+βj​+ϵij​ϵij​∼iid​N(0,σi2​);i=1,2;j=1,⋯,n
则我们要研究的问题可以写成假设检验
H0:μ1<μ2Ha:μ1≥μ2H_0:\mu_1 < \mu_2 \\ H_a: \mu_1 \ge \mu_2 H0​:μ1​<μ2​Ha​:μ1​≥μ2​
从统计模型上来看配对t检验和两样本t检验就是有明显差别的,配对t检验一般用来处理成对数据的问题。记dj=y1j−y2j=μ1−μ2+(ϵ1j−ϵ2j)d_j = y_{1j}-y_{2j} = \mu_1 - \mu_2 + (\epsilon_{1j}-\epsilon_{2j})dj​=y1j​−y2j​=μ1​−μ2​+(ϵ1j​−ϵ2j​),定义μd=μ1−μ2\mu_d = \mu_1 - \mu_2μd​=μ1​−μ2​,则假设检验又可以写成
H0:μd<0Ha:μd≥0H_0:\mu_d<0 \\ H_a: \mu_d \ge 0 H0​:μd​<0Ha​:μd​≥0
由于djd_jdj​是服从正态分布的,所以这个假设检验可以用单正态总体样本的t检验来做。

UA MATH571B 试验设计II 简单试验的分析方法相关推荐

  1. UA MATH571B 试验设计 总结 判断试验类型的例题

    UA MATH571B 试验设计 总结 判断试验类型的例题 2015年5月第二题:Blocking factorial design 2015年5月第三题:Split-plot Design 2017 ...

  2. UA MATH571B 试验设计 总结 试验的类型与选择

    UA MATH571B 试验设计 总结 试验的类型与选择 试验的意义,试验设计的意义 单个treatment factor的试验 多个treatment factor的试验 多个treatment f ...

  3. UA MATH571B 试验设计 QE练习题 不使用代码分析试验结果I

    UA MATH571B 试验设计 QE练习题 不使用代码分析试验结果I 2014年5月第一题 2015年5月第一题 2016年5月第二题 2017年1月第一题 不使用代码分析试验结果考察的是对试验设计 ...

  4. UA MATH571B 试验设计 Quarter 2-level析因设计

    UA MATH571B 试验设计 Quarter 2-level析因设计 2k−22^{k-2}2k−2设计的基本概念 2k−22^{k-2}2k−2试验结果的SAS分析 Quarter 2-leve ...

  5. UA MATH571B 试验设计 2k析因设计理论下

    UA MATH571B 试验设计 2k析因设计理论下 Confounding Blocking 222^222析因设计 Blocking 232^323析因设计 principal block Fra ...

  6. UA MATH571B 试验设计 QE练习题1

    UA MATH571B 试验设计 QE练习题1 第一题 第二题 第三题 这是2014年一月Methodology的1-3题. 第一题 希望今年的考试没有这种概念题! 第一个是对的,比较多正态总体的方差 ...

  7. UA MATH571B 试验设计IV RCBD与Latin Square上

    UA MATH571B 试验设计IV RCBD与Latin Square上 RCBD Latin Square Design Graeco-Latin Square Design BIBD RCBD ...

  8. UA MATH571B 试验设计I 试验设计简介

    UA MATH571B 试验设计I 试验设计简介 试验设计的作用与意义 混淆变量 相关性与因果 试验设计的流程与目标 消除偏差 对照组 随机试验 Blinding 减少抽样误差 重复试验 平衡试验和区 ...

  9. UA MATH571B 试验设计 QE练习题 平衡非完全区组设计BIBD

    UA MATH571B 试验设计 QE练习题 平衡非完全区组设计BIBD 2015年1月第一题 2018年1月第一题 2015年1月第一题 Part a 显然这是一个BIBD(Balanced Inc ...

最新文章

  1. QT5.11 + VS2017 环境搭建
  2. 工作区、暂存区、版本库、远程仓库
  3. 实践单元测试(2) - 大话单元测试
  4. C#中is vs as
  5. javaSE基础——常见的dos命令即其他
  6. b超可以看出什么_B超可以查出什么
  7. JQuery与springmvc实现多个文件上传操作
  8. 工业测试软件技术指标,工业过程难测参数软测量建模方法研究及应用
  9. android模拟器开启vt,逍遥安卓模拟器怎样打开VT模式 VT虚拟化设置办法
  10. Mark- 新的开始
  11. 明源地产ERP实施五步法
  12. 常用的人格测试理论等小结
  13. 网站301转向代码大全
  14. 华为RH2288 V3装centos7
  15. 微信分享多个图片和文字到朋友圈
  16. 淘宝/天猫API接口,获得淘宝商品详情高级版
  17. Android和C#实现实时视频传输Demo
  18. MATLAB LSB图像信息隐藏 最低位平面验证 以及PSNR SSIM评价
  19. Mybatis 中文技术文档
  20. mysql的配置文件的各项参数意思

热门文章

  1. (转载)四种常见的 POST 提交数据方式
  2. MapReduce基础开发之一词汇统计和排序(wordcount)
  3. 高等数学第七版-习题解答:总复习3
  4. 分别用递归和非递归方式实现二叉树先序、中序和后序遍历(java实现)
  5. 使用Postgrest快速创建数据库的OpenAPI接口
  6. IBM was调试端口开通演示,was服务重启、端口号查看方法
  7. 如何分配和释放存储空间
  8. java 时间轮算法_时间轮算法(TimingWheel)是如何实现的?
  9. idea使用ant将wsdl文件_文件曝光:奔驰GLC将使用E级同款1.5T发动机
  10. 有序的两个数组在满足其中一个数组的所有数都小于另外一个数组的情况下的整体的中位数