一、什么是假设检验?——以双边检验为例

用大白话来讲,假设检验就是检验(判断)某个假设是否正确,并且说出这个判断出错的概率,(判断出错包括了这个假设原本是对的,你判断它是错的;或者这个假设是错的,你判断它是对的)。

这里我引用书本上的一个例子作为说明。

例1 某车间用一台包装机包装葡萄糖.袋装糖的净重是一个随机变量,它服从正态分布.当机器正常时,其均值为0.5kg,标准差为0.015kg.某日开工后为检验包装机是否正常,随机地抽取它所包装的糖9袋,称得净重(kg)

0.497 0.506 0,518 0.524 0.498 0.511 0.520 0.515 0.512

问机器是否正常?

以μ\muμ,σ\sigmaσ分别表示这一天袋装糖的净重总体X的均值和标准差.由于长期实践表明标准差比较稳定,我们就设σ\sigmaσ=0.015.于是XN(μ,0.0152)X~N(\mu,0.015^2)X N(μ,0.0152),这里a未知,问题是根据样本值来判断μ\muμ=0.5还是μ\muμ≠0.5.为此,我们提出两个相互对立的假设
H0:μ=μ0=0.5H1:μ≠μ0\begin{aligned} &H_{0}: \mu=\mu_{0}=0.5 \\ &H_{1}: \mu \neq \mu_{0} \end{aligned}​H0​:μ=μ0​=0.5H1​:μ​=μ0​​

既然假设是说总体均值等于某个值(0.5),一个很自然的想法就是抽一组样本,看样本均值和假设的总体均值相差多少。如果∣xˉ−μ0∣|\bar{x}-\mu _0|∣xˉ−μ0​∣相差很多,我们就考虑拒绝这个假设。

现在就面临了两个问题,一个是当两者相差多少时我们拒绝这个假设H0H_0H0​, 当拒绝这个假设时我们所作的判断错误概率是多少(也就是假设为真我们反而拒绝了的概率是多少?,因为在检验时要给出出错的概率,别人才会相信你的检验结果)

之前我们介绍了中心极限定理

中心极限定理是说:
样本的平均值约等于总体的平均值。
不管总体是什么分布,任意一个总体的样本平均值都会围绕在总体的整体平均值周围,并且呈正态分布。

这里我们可以用上,考虑到H0H_0H0​为真时,由中心极限定理得,X‾−μσ/n=X‾−μ0σ/n∼N(0,1)\frac{\overline{X}-\mu}{\sigma / \sqrt{n}}=\frac{\overline{X}-\mu_{0}}{\sigma / \sqrt{n}} \sim N(0,1)σ/n​X−μ​=σ/n​X−μ0​​∼N(0,1)。可以看到这条式子给出了与∣xˉ−μ0∣|\bar{x}-\mu _0|∣xˉ−μ0​∣有关的一个概率分布,因此我们可以知道当∣xˉ−μ0∣|\bar{x}-\mu _0|∣xˉ−μ0​∣相差为某个数时所作判断出错的概率——我们不妨设X‾−μσ/n≥k\frac{\overline{X}-\mu}{\sigma / \sqrt{n}} \geq kσ/n​X−μ​≥k时拒绝假设H0H_0H0​,也就是∣X‾−μ∣≥kσ/n|\overline{X}-\mu|\geq k\sigma/ \sqrt{n}∣X−μ∣≥kσ/n​拒绝假设H0H_0H0​, 否则就接受H0H_0H0​。

那么此时实际上H0H_0H0​为真却被拒绝的决策的概率为:

P{当H0为真拒绝H0}=Pμ0{∣X‾−μ0σ/n∣⩾k}≤αP\{当H_0为真拒绝H_0\}=P_{\mu_{0}}\left\{\left|\frac{\overline{X}-\mu_{0}}{\sigma / \sqrt{n}}\right| \geqslant k\right\} \leq \alphaP{当H0​为真拒绝H0​}=Pμ0​​{∣∣∣∣​σ/n​X−μ0​​∣∣∣∣​⩾k}≤α
(同样可以固定出错的概率求相差的数,因为它的概率分布已知),这就能够回答我们上述提出的两个问题了。
并且我们希望这个误判的概率不大于α\alphaα,此时我们就可以确定我们应该设定的k为多大(如下所示)。

一般来说,我们希望我们对假设做出的判断发生错误的概率越小越好,一般取为0.01,0.05。.数α\alphaα称为显著性水平,上面xˉ与μ0\bar{x}与\mu _0xˉ与μ0​有无显著差的判断是在显著性水平α\alphaα之下作出的。

统计量Z=Xˉ−μ0σ/nZ=\frac{\bar{X}-\mu_{0}}{\sigma / \sqrt{n}}Z=σ/n​Xˉ−μ0​​称为检验统计量。

二、什么是显著性检验?

由于检验法则是根据样本作出的,总有可能作出错误的决策.如上面所说的那样,在假设H0H_0H0​实际上为真时,我们可能犯拒绝H0H_0H0​的错误,称这类“弃真”的错误为第Ⅰ类错误.又当H0H_0H0​实际上不真时,我们也有可能接受H0H_0H0​, 称这类“取伪”的错误为第Ⅱ类错误.

为此,在确定检验法则时,我们应尽可能使犯两类错误的概率都较小.但是,进一步讨论可知,一般来说,当样本容量固定时,若减少犯一类错误的概率,则犯另一类错误的概率往往增大.若要使犯两类错误的概率都减小,除非增加样本容量.在给定样本容量的情况下,一般来说,我们总是控制犯第I类错误的概率,使它不大于α\alphaα. α\alphaα的大小视具体情况而定,通常α\alphaα取0.1,0.05,0.01,0.005等值.这种只对犯第I类错误的概率加以控制,而不考虑犯第Ⅱ类错误的概率的检验,称为显著性检验

三、单边检验

设总体X∼N(μ,σ2)X \sim N\left(\mu, \sigma^{2}\right)X∼N(μ,σ2), μ\muμ未知,σ\sigmaσ已知,X1,X2,...,XnX_1,X_2,...,X_nX1​,X2​,...,Xn​是来自X的样本,给定显著性水平α\alphaα,我们来求检验问题:
H0:μ≤μ0,H1:μ≥μ0H_0:\mu \leq \mu _0,H_1: \mu \geq \mu _0H0​:μ≤μ0​,H1​:μ≥μ0​
的拒绝域。

从严格的标准来讲,如果我们取样的样本均值大于μ0\mu _0μ0​,我们就会拒绝H0H_0H0​,但是这是不符合实际情况的,因为样本均值是围绕总体均值波动的,如果一次采样恰好采集到样本值都是比较大的,我们就拒绝这个假设,这是不合适的。

因此,就像前面的双边检验一样,我们允许样本均值X‾\overline XX有在μ\muμ周围一定的波动。这里单边检验和双边检验所不同的是,双边检验的X‾\overline XX在概率密度曲线的两边都不能波动得太多,因为双边检验的假设是一个点。相反,单边检测可以在μ\muμ左边任意地波动,而在右边不能波动地太多,因为单边检验地假设是小于等于号(如下图所示)。

通过下面的图可以更直观的看到μ\muμ所允许的波动范围(白色区域)以及拒绝域(黑色区域),其中左侧为双边检验,右侧为单边检验。如果X‾\overline XX没有经过标准化,那么它服从N(μ,σ)N(\mu,\sigma)N(μ,σ);如果经过标准化后变成Xˉ−μσ/n\frac{\bar{X}-\mu}{\sigma / \sqrt{n}}σ/n​Xˉ−μ​,它服从N(0,1)N(0,1)N(0,1)

从图中可以很清楚地看到,对于单边检测来说,如果我们希望发生误判的错误率不高于α\alphaα, 那么我们应该在统计检验量z满足:
z=X‾−μσ/n≥zαz = \frac{\overline{X}-\mu}{\sigma / \sqrt{n}} \geq z_{\alpha}z=σ/n​X−μ​≥zα​

时拒绝假设H0H_0H0​.

但是这里有一个问题,我们并不知道μ\muμ的具体值,但是在假设H0H_0H0​成立的情况下,我们有以下推导
Xˉ−μσ/n≥Xˉ−μ0σ/n\frac{\bar{X}-\mu}{\sigma / \sqrt{n}} \geq \frac{\bar{X}-\mu _0}{\sigma / \sqrt{n}}σ/n​Xˉ−μ​≥σ/n​Xˉ−μ0​​
此时如果Xˉ−μ0σ/n≥zα\frac{\bar{X}-\mu _0}{\sigma / \sqrt{n}} \geq z_{\alpha}σ/n​Xˉ−μ0​​≥zα​,则必有Xˉ−μσ/n≥zα\frac{\bar{X}-\mu}{\sigma / \sqrt{n}}\geq z_{\alpha}σ/n​Xˉ−μ​≥zα​。因此如果在假设H0H_0H0​成立的情况下,我们仍抽样发现不太支持H0H_0H0​的X‾\overline{X}X出现,我们拒绝H0H_0H0​的理由更充分了(有点类似反证法思维)。当然这里不是完全充分,我们仍有α\alphaα的概率误判。

至此,我们可以总结道:在误判率不超过α\alphaα的情况下,单边检测的拒绝域应该为{X‾:X‾−μ0σ/n≥zα}\{\overline X : \frac{\overline{X}-\mu _{0}}{\sigma / \sqrt{n}}\geq z_{\alpha}\}{X:σ/n​X−μ0​​≥zα​}

笔者认为这样的讲解思路更容易懂(在不需要应试的情况下完全可以这样理解),但在需要应试的情况下,可以参考下下面的东西:


四、正态总体均值的假设检验

1. Z检验

上面所讨论的正态总体N(μ,σ2)N(\mu, \sigma ^2)N(μ,σ2)当标准差σ\sigmaσ已知的情况,使用统计量Z=X‾−μ0σ/nZ=\frac{\overline X - \mu _0}{\sigma/\sqrt{n}}Z=σ/n​X−μ0​​来确定拒绝域的检验方法称为Z检验。

2. t检验

正态总体N(μ,σ2)N(\mu, \sigma ^2)N(μ,σ2)当标准差σ\sigmaσ未知时,使用样本标准差sss替代总体标准差σ\sigmaσ并使用统计量Z=X‾−μ0s/nZ=\frac{\overline X - \mu _0}{s/\sqrt{n}}Z=s/n​X−μ0​​来确定拒绝域的检验方法称为t检验。

概率论:假设检验、显著性检验相关推荐

  1. 推断统计学 假设检验 显著性检验 第一类错误 第二类错误

    项目github地址:bitcarmanlee easy-algorithm-interview-and-practice 欢迎大家star,留言,一起学习进步 1 描述统计学与推断统计学 上大学的时 ...

  2. 【考研数学】数一-数学概念anki卡片合集-547张-23000字-22电子科大考研上岸整理

    样本空间的定义 定义:一切基本事件的集合 样本空间的表示方法 记做Ω 事件的表示方式 表示方式:字母A,B,C- 随机事件与样本空间的关系 随机事件可视为样本空间的子集 事件A发生的含义 事件A发生 ...

  3. 2023年计算机考研数学一考试大纲

    2022年计算机考研数学一考纲对外公布时间在2021年11月30日,2022年考研之前考纲基本使用的是2017年版本的考研数学大纲,预计2023年计算机考研数学一也会继续使用2022年考纲,下文就是2 ...

  4. 数理统计复习笔记一——统计中常用的抽样分布(卡方分布,t分布,F分布)

    前言:   总结一下数理统计中的基本概念,一些用python的实现在这里.不断持续更新. 1. 几个基本概念  1.1 次序统计量  1.2 样本偏度与样本峰度  1.3 经验分布函数  1.4 抽样 ...

  5. python数据挖掘 百度云,常用数据挖掘算法总结及Python实现高清完整版PDF_python数据挖掘,python数据分析常用算法...

    常用数据挖掘算法总结及Python实现 高清完整版PDF 第一部分数据挖掘与机器学习数学基础 第一章机器学习的统计基础 1.1概率论 l概率论基本概念 样本空间 我们将随机实验E的一切可能基本结果组成 ...

  6. A/B 测试的统计学原理及用例详解

    统计学在 A/B 测试中的作用 A/B 测试是一种对比试验(下文中对比试验特指 AppAdhoc 平台上的 A/B 测试),而试验就是从总体中抽取一些样本进行数据统计,进而得出对总体参数的一个评估.可 ...

  7. 深入解读A/B 测试的统计学原理

    了解一些统计学知识对正确地进行 A/B 测试和研判试验结果是很有帮助的,本篇文章深入介绍了A/B 测试的原理和背后的统计学依据.完全理解本文中提到的数学计算需要你掌握概率方面的一点基础知识. 统计学在 ...

  8. 学习报告21-02-28

    1.prolog 2.回归分析法 3.matlab神经网络 Prolog 声明式编程语言,它与我们平时最常遇到的命令式编程语言有很大的不同.命令式语言需要你精确地告诉计算机如何完成一项工作,而声明式语 ...

  9. 【定量分析、量化金融与统计学】各种检验的H0假设与p-value究竟是什么含义

    目录 一.各种检验的分类 二.事前检验 1.正态性检验 2.方差齐次性检验 3.共线性检验 4.协方差齐次性检验 三.事后检验 1.Turkey检验 2.tamhaneT2 检验 3.交叉图检验 4. ...

最新文章

  1. ## *将以下学生成绩数据,存放在Hdfs上,使用Spark读取完成下面分析**
  2. 【HDOJ】1058 Humble Numbers
  3. 深入理解HTML协议
  4. php排字符串的高低位怎么区分,PHP-根据字符串和所用字体计算字符串所占宽高...
  5. 作业帮云原生降本增效实践之路
  6. django的orm指定字段名,表名 verbose_name_plural
  7. 95-290-360-源码-内存管理-Buffer-ByteBufferPool简介
  8. Spring源码解析 -- SpringWeb请求参数获取解析
  9. 使用migration创建表时,出错的解决方法
  10. 电视hdr测试软件,HDR是什么意思 如何打开电视机的HDR10模式
  11. VTK学习笔记(三十四)VTK简介
  12. Linux版本加载过程异响,完美解决Ubuntu Linux关机异响[SATA硬盘]
  13. JVM参数-X和-XX的区别
  14. elasticsearch minimum_should_match
  15. 新海诚没有参与制作的作品_还未开始!新海诚的下一部作品还是白纸
  16. 什么样的公司程序员待遇好?
  17. ROS 初学入门学习及资源推荐
  18. 【辅助驾驶】Python在Windows系统下实现TTS(文字转语音)
  19. 《评人工智能如何走向新阶段》后记(再续17)
  20. 关于RC阻容复位电路的问题

热门文章

  1. 动态修改drawable里的背景颜色
  2. Ubuntu18.04设置动态ip详细步骤(可视化)
  3. 32位ORACLE10G升级到 64位的ORACLE10G
  4. 计算机信息量单位kbit,计算机网络中传输介质传输速率的单位是bps,其含义是什么...
  5. 超值抢票攻略新鲜出炉!
  6. android paopao窗口+gridview 的实现底部菜单
  7. android 软启动功能,软启动器的主要功能是什么?
  8. Kevin Mitnick的网站 Gotz owned!
  9. oracle中 990.90,麒麟990+90Hz屏是什么样的体验?旗舰手机游戏性能实测
  10. VB.net:VB.net编程语言学习之基于VS软件利用VB.net语言实现对SolidWorks进行二次开发的简介、案例应用之详细攻略