假设检验中的两类错误

  • 1、Ⅰ、Ⅱ类错误及其产生的原因
  • 2、两类错误的关系以及影响因素
  • 3、如何控制两类错误

1、Ⅰ、Ⅱ类错误及其产生的原因

  虽然小概率事件发生的概率很小,但依然有可能发生。由于抽样的随机性,利用小概率原理对H0是否成立作为判断时,难免会犯两类错误。

  • 第一类错误(α错误/弃真错误):实际上H0H_0H0​为真时,但利用随机抽样样本,构建的小概率事件出现了,作出拒绝H0H_0H0​的决策,即α=P(拒绝H0H_0H0​|H0H_0H0​为真)

  • 第二类错误(β错误/取伪错误):实际上H0H_0H0​为伪时,但利用随机抽样样本,构建的小概率事件未出现了,作出接受H0H_0H0​的决策,即β=P(接受H0H_0H0​|H0H_0H0​为伪)

2、两类错误的关系以及影响因素

  • 第一类错误的影响因素

  由实际推断原理引起的,即“小概率事件不会发生”的假定所引起的,所以有理由将所有小概率事件发生的概率之和或者即显著性水平(α=0.05)看作α错误发生的概率,换言之,α错误发生的概率为检验所选择的显著性水平。如果是单侧检验,弃真错误的概率则为 α/2。

  • 第二类错误的影响因素

  通常情况下的做法只是控制犯第一类错误的概率α,而忽略第二类错误的概率β,但有些情况下,第二类错误不可忽视,为了实现对两类错误的控制,需要剖析两类错误的关系以及影响因素。

施行特征函数
  定义若C是参数θ\thetaθ某检验问题的一个检验法,β(θ)=Pθ(接受H0)\beta(\theta)=P_{\theta}(接受H_0)β(θ)=Pθ​(接受H0​),称为检验法C的施行特征函数或者OC函数,其图形称为OC曲线。
  若假定检验法的显著性水平α,即犯第一类错误的概率为Pθ∈H0≤α,则当P_{\theta \in H_0}≤α,则当Pθ∈H0​​≤α,则当θ∈H0\theta \in H_0θ∈H0​时,做出正确判断的概率为:Pθ∈H0(接受H0)=β(θ)P_{\theta \in H_0}(接受H_0)=\beta(\theta)Pθ∈H0​​(接受H0​)=β(θ) ≥ 1-α;则当$θ∈H1\theta \in H_1θ∈H1​时,犯第二类错误的概率为Pθ∈H0(接受H0)=β(θ)=βP_{\theta \in H_0}(接受H_0)=\beta(\theta)=\betaPθ∈H0​​(接受H0​)=β(θ)=β ,做出正确判断的概率为:Pθ∈H1(拒绝H0)=1−β(θ)P_{\theta \in H_1}(拒绝H_0)=1-\beta(\theta)Pθ∈H1​​(拒绝H0​)=1−β(θ) 。
  在检验的过程中希望α与β都尽可能小,即做出正确判断的概率Pθ∈H0(接受H0)=β(θ)P_{\theta \in H_0}(接受H_0)=\beta(\theta)Pθ∈H0​​(接受H0​)=β(θ) ≥ 1-α与Pθ∈H1(拒绝H0)=1−β(θ)P_{\theta \in H_1}(拒绝H_0)=1-\beta(\theta)Pθ∈H1​​(拒绝H0​)=1−β(θ)都越大越好,但这种期望能否达到呢?
  设总体X∼N(u,σ2)X\sim N(u,\sigma^2)X∼N(u,σ2),其中u未知,σ已知,X1,X2,...,XnX_1,X_2,...,X_nX1​,X2​,...,Xn​是来自X的样本。在显示性水平α下,对u进
行左侧检验:
H0:u≥u0H_0:u≥u_0H0​:u≥u0​ vs H1:u<u0H_1:u<u_0H1​:u<u0​,拒绝域Xˉ−u0σ/n≤−zα\frac{\bar X-u_0}{\sigma/ \sqrt n}≤-z_ασ/n​Xˉ−u0​​≤−zα​
  此检验的OC函数为:
β(u)=Pu(接受H0)=Pu(Xˉ−u0σ/n>−zα)=Pu(Xˉ−u0σ/n>−zα−u−u0σ/n)=ϕ(zα+λ)\beta(u)=P_u(接受H_0)=P_u(\frac{\bar X-u_0}{\sigma/ \sqrt n}>-z_α)=P_u(\frac{\bar X-u_0}{\sigma/ \sqrt n}>-z_α-\frac{ u-u_0}{\sigma/ \sqrt n})=\phi(z_\alpha+\lambda)β(u)=Pu​(接受H0​)=Pu​(σ/n​Xˉ−u0​​>−zα​)=Pu​(σ/n​Xˉ−u0​​>−zα​−σ/n​u−u0​​)=ϕ(zα​+λ)
其中,λ=u−u0σ/n\lambda=\frac{ u-u_0}{\sigma/ \sqrt n}λ=σ/n​u−u0​​,其OC曲线如图所示:

β(u)\beta(u)β(u)函数性质如下:

  • 是λ\lambdaλ的连续单调递增函数;
  • lim⁡u→∞ˉβ(u)=1\displaystyle\lim_{u \rightarrow \bar \infty}\beta(u)=1u→∞ˉlim​β(u)=1,lim⁡u→u0β(u)=1−α\displaystyle\lim_{u \rightarrow u_0}\beta(u)=1-\alphau→u0​lim​β(u)=1−α

  由检验的OC函数,β(u)可知,β=Pu<u0(接受H0)=ϕ(zα+u−u0σ/n)β=P_{u<u_0}(接受H_0)=\phi(z_α+\frac{u-u_0}{\sigma/\sqrt n})β=Pu<u0​​(接受H0​)=ϕ(zα​+σ/n​u−u0​​)。因此,β的大小与显著性水平α、u的真实值、总体标准差σ、样本容量n有关。

  • 显著性水平α

  由分布函数的性质以及正态分布上的α分位可知,当其它条件不变时,α大,则β小;反之α小,必导致β大。故犯两类错误的概率α于β存在“此消彼长”的关系。

  • u的真实值

  由OC函数的性质,lim⁡u→uˉ0β(u)=1−α\displaystyle\lim_{u \rightarrow \bar u_0}\beta(u)=1-\alphau→uˉ0​lim​β(u)=1−α可知,当u的真实值趋于uˉ0\bar u_0uˉ0​时,不管其它量如何变化,只要α取值较小,β几乎等于1-α。即对所有的u∈H1u\in H_1u∈H1​,控制β=Pu∈H1(接受H0)\beta=P_{u\in H_1}(接受H_0)β=Pu∈H1​​(接受H0​)都很小是不可能实现的。只有当u与u0的差距较大时,方可有办法将β控制在一定范围之内。

  • 总体标准差σ

  σ是离散趋势的主要度量指标,σ越大,抽取的随机样本的代表性相对较差,由β=Pu<u0(接受H0)=ϕ(zα+u−u0σ/n)β=P_{u<u_0}(接受H_0)=\phi(z_α+\frac{u-u_0}{\sigma/\sqrt n})β=Pu<u0​​(接受H0​)=ϕ(zα​+σ/n​u−u0​​)可知,在其他量一定的情况下,β是σ的增函数。因此,总体的标准差σ越小,β会越小。

  • 样本容量n
      样本容量n越大,抽选的随机样本所提供的有关总体的信息越多。由β=Pu<u0(接受H0)=ϕ(zα+u−u0σ/n)β=P_{u<u_0}(接受H_0)=\phi(z_α+\frac{u-u_0}{\sigma/\sqrt n})β=Pu<u0​​(接受H0​)=ϕ(zα​+σ/n​u−u0​​)可知,在u与u0的差距较大,其他量不变的情况下,β是n的减函数。因此,在此条件允许的情况下,增大样本容量n,β会随之减少。

  犯β错误的概率的计算是比较复杂的,由于β错误的出现原因是属于逻辑上的,所以在总体参数不知道的情况下是无法计算它出现概率的大小的。

3、如何控制两类错误

  犯第一类错误的概率α\alphaα可以通过适当改变检验的拒绝域来进行调整。

  由上文可知,β的大小与显著性水平α、u的真实值、总体标准差σ、样本容量n有关。这四个因素中,u未知,σ通常已知,因此没有办法通过这两个因素来有效控制β;在一定条件下,显著性水平σ与β存在“此消彼长”的关系,并且β是样本容量n的减函数,但是即使增大α或者增大n,也无法实现对β量化。一般情况下,无法直接控制β,但是可以通过间接的措施达到对β的控制的目的。

  结合假设检验的基本思想,H0与H1的不对等性、假设检验的目的以及检验结果的解释,具体措施入如下:

  • 巧妙建立假设

  成功的假设检验策略,以拒绝H0为检验目的,假设检验只能证明H0的伪,而不能证明H0的真。因此,在假设的建立过程中要谨慎小心。一般把传统的,原始的观念设立为H0;H0中应包含等号;后果严重的错误设定为第一类错误

  • 谨慎解释检验的结果

  检验统计量的观测值落入接受域,仅仅表明所构建的小概率事件没有发生,但是不能证实其它与H0相矛盾的小概率事件不发生。因此,但检验统计量的观测值落入接受域时,不能断定认为H0是正确的,此时犯第二类错误的概率β是未知。此时把检验的结果严谨解释为“没有发现充足的证据拒绝H0”。

  • 恰当设置显著性水平α

  不一味的追求α尽可能小,结合具体的问题仔细斟酌两类错误后果的严重性。若第一类错误的后面比较严重(判断一个人是否患病),而第二类错误的后果无足轻重,则可以选择较小的α;否则,需要放大α的取值;

统计基础:3.2_假设检验的两类错误相关推荐

  1. R语言效用分析 ( 效能分析、Power analysis)确定样本量、假设检验与两类错误、pwr包进行效用分析 ( 效能分析、Power analysis)的常用函数列表

    R语言效用分析 ( 效能分析.Power analysis)确定样本量.假设检验与两类错误.pwr包进行效用分析 ( 效能分析.Power analysis)的常用函数列表 目录

  2. 假设检验中两类错误及最小样本量计算

    ​ 脚注: 以下内容均为个人总结,便于日后查阅.如有不对地方,还请及时指正. 案例:   在互联网等行业中,大家会对产品.排序模型.机制策略等模块不断迭代/创新,来提升整个App的用户体验.那么,怎样 ...

  3. 【统计类知识】区间估计(置信区间)、假设检验(两类错误、P值)

    统计推断的三大基本形式: 抽样分布 参数估计(点估计.区间估计) 假设检验(参数检验.非参数检验) 一. 置信区间 在实际中,我们通常得不到总体在某方面的真值,比如总体均值.或者说,如果我们现在要估计 ...

  4. 假设检验的两类错误及功效

    一.为什么会有假设检验的两类错误? 由于假设检验是根据有限的样本信息对总体作推断,不论做出哪种推断结论(拒绝原假设H0和不拒绝原假设H0),都由可能因为抽样等原因发生错误. 二.假设检验的两类错误 1 ...

  5. 统计学假设检验的两类错误

    1.两类错误的解释 我们之前探讨了假设检验的基本思想,现在我们来介绍下两类错误. 假设检验的最终目的是:去伪存真, 那么它对应的两类错误就是弃真存伪. 接受或拒绝H0,都可能犯错误 I类错误--弃真错 ...

  6. 一文详解假设检验、两类错误和p值

    我们在生活中会遇到很多带有不确定性的问题,比如什么样的男孩子更容易找到女朋友,拥有什么样的品质更易成功.科学方法告诉我们,面对这些问题,要"大胆假设,小心求证".而假设检验就是这样 ...

  7. 深入理解假设检验的两类错误和功效

    假设包含原假设Null Hypothesis和备择假设Alternative Hypothesis,原假设也称为零假设,记为 H 0 H_0 H0​,备择假设也称为对立假设,记为 H a H_a Ha ...

  8. 假设检验中的两类错误

    假设检验中的两类错误 假设检验及其两类错误是数理统计学中的名词.在进行假设检验时提出原假设和备择假设,原假设实际上是正确的,但我们做出的决定是拒绝原假设,此类错误称为第一类错误.原假设实际上是不正确的 ...

  9. 在统计学中_我来尝试给你讲清统计学中的假设检验和两类错误

    学习过统计的同学一定对"两类错误"不会陌生,但是否已经完全理清了其中的逻辑,想必要打一个问号了.希望我今天能"不辱使命",用你听得懂的语言给你讲清楚这整套内容. ...

最新文章

  1. Win8:Snap 实现
  2. 查看IE浏览器安装的插件
  3. c++ primer 5th ,习题11.23自己编写答案
  4. rdd后面[]中的数字是啥意思
  5. linux PHP ppt 转图片,php(thinkphp)在linux系统下pdf转png图片【转】
  6. 在线HTML网页小窗口复制不了,教你一招:解决某些网页不能复制的文字的N种方法!...
  7. rem和mod的区别
  8. 发现一篇不错的学习隐马尔可夫模型的文章
  9. 图神经网络-论文精读-“A Gentle Introduction to Graph Neural Networks“
  10. java 生成2位随机数_java生成随机数保留数点后两位
  11. C++实现24点算法
  12. springboot和springMVC
  13. 开源中Web开发的各种资源
  14. 《论工业社会及其未来》—泰德.卡辛斯基
  15. 【蓝桥杯省赛】冲刺练习题【第十二届省赛2套题】倒计时【02】天(准考证组委会已下发,请查询)
  16. 图扑软件入局工业元宇宙,加速部署数字孪生新生态
  17. C语言文件操作笔记-1
  18. 痞子衡嵌入式:恩智浦i.MX RT1xxx系列MCU启动那些事(1)- Boot简介
  19. FTP的协议分析实验
  20. java/php/net/python果蔬在线销售和配送系统设计

热门文章

  1. java类成员变量初始化_探讨Java类中成员变量的初始化方式
  2. 8. fastApi请求错误处理方式与示例
  3. pycharm注释代码的快捷键失效解决办法
  4. Centrifugal Chiller - Fundamentals
  5. Redis集群技术架构
  6. Mac出现程序闪退的解决方案
  7. 万字详解 | SQL 多表联合查询方法,收藏直接起飞!
  8. 【深入学习51单片机】二、一个极简RTOS源码分析
  9. AttributeError: ‘LTP‘ object has no attribute ‘init_dict‘解决方案
  10. 美白--中药配方(转)