作者|GUEST 编译|VK 来源|Analytics Vidhya

介绍

检验是统计学中最基本的概念之一。不仅在数据科学中,假设检验在各个领域都很重要。想知道怎么做?让我们举个例子。现在有一个lifebuoy沐浴露。

沐浴露厂商声称,它杀死99.9%的细菌。他们怎么能这么说呢?必须有一种测试技术来证明这种说法是正确的。所以假设检验用来证明一个主张或任何假设。

目录

  1. 假设检验的定义

  2. 零和替代假设检验

  3. 简单假设检验和复合假设检验

  4. 单尾和双尾检验

  5. 临界区

  6. I型和II型错误。

  7. 统计学意义

  8. 信心水平

  9. 重要程度

  10. P值

这个博客将这些概念分解成小部分,这样你就能理解它们的动机和用途。当你读完这个博客,假设检验的基础知识就会很清楚了!!

假设检验的定义

假设是关于参数值(均值、方差、中值等)的陈述、假设或主张。

假设是对你周围世界的某件事的有根据的猜测。它应该可以通过实验或观察来测试。

比如说,如果我们说“多尼是有史以来最好的印度队长”,这是一个假设,我们是根据他担任队长期间球队的平均输赢情况做出的。我们可以根据所有的匹配数据来测试这个语句。

零假设和替代假设检验

零假设是在假设为真的前提下,检验假设是否可能被拒绝。类似无罪的概念。我们假定无罪,直到我们有足够的证据证明嫌疑人有罪。

简单地说,我们可以把零假设理解为已经被接受的陈述,例如,天空是蓝色的。我们已经接受这个声明。

用H0表示。

替代假设补充了零假设。它与原假设相反,替代假设和原假设一起覆盖了总体参数的所有可能值。

用H1表示。

让我们用一个例子来理解这一点:

一家肥皂公司声称他们的产品平均杀死99%的细菌。为了检验这家公司的主张,我们将提出零和替代假设。

零假设(H0):平均值等于99%

替代假设(H1):平均值不等于99%。

注意:当我们检验一个假设时,我们假设原假设是真的,直到样本中有足够的证据证明它是假的。在这种情况下,我们拒绝原假设而支持替代假设。

如果样本不能提供足够的证据让我们拒绝零假设,我们不能说零假设是真的,因为它仅仅基于样本数据。零假设成立需要研究整个总体数据。

简单假设检验和复合假设检验

当一个假设指定了参数的精确值时,这是一个简单的假设,如果它指定了一个值的范围,则称为复合假设。例如

  • 某电单车公司声称某车型每升平均行驶里程为100公里,这是一个简单假设的案例。

  • 一个班学生的平均年龄大于20岁。这是一个复合假设。

单尾和双尾假设检验

如果替代假设在两个方向(小于和大于)给出了在零假设中指定的参数值的替代,则称为双尾检验。

如果替代假设只在一个方向(小于或大于)给出了在零假设中指定的参数值的替代,则称为单尾检验。例如

  • H0:平均值等于100
  • H1:平均值不等于100

根据H1,平均值可以大于或小于100。这是一个双尾检验的例子

同样,

  • H0:平均值>=100
  • H1:平均值<100

在这里,平均值不到100。这叫做单尾检验。

拒绝域

拒绝域是样本空间中的拒绝区域,如果计算值在其中,那么我们就拒绝零假设。

让我们用一个例子来理解这一点:

假设你想租一套公寓。你从不同的真实国家网站列出了所有可用的公寓。你的预算是15000卢比/月。你不能再花那么多钱了。你所订的公寓清单的价格从7000/月到30000/月不等。

你从列表中随机选择一个公寓,并假设以下假设:

  • H0:你要租这套公寓。

  • H1:你不会租这套公寓。

现在,既然你的预算是1.5万,你必须拒绝所有高于这个价格的公寓。

在这里所有价格超过15000成为你的拒绝域。如果随机公寓的价格在这个区域,你必须拒绝你的零假设,如果公寓的价格不在这个区域,你就不能拒绝你的零假设。

根据替代假设,拒绝域位于概率分布曲线的一条或两条尾巴上。拒绝域是与概率分布曲线中的截止值相对应的预定义区域。用α表示。

临界值是将支持或拒绝零假设的值分隔开的值,并根据alpha进行计算。

稍后我们将看到更多的例子,我们将清楚地知道如何选择α。

根据另一种假设,拒绝域出现了三种情况:

案例1)这是一个双尾检验。

案例2)这种情况也被称为左尾检验。

案例3)这种情况也被称为右尾检验。

I型和II型错误

因此,第一类和第二类错误是假设检验的重要课题之一。让我们把这个话题分解成更小的部分来简化它。

一个假正例(I型错误)——当你拒绝一个真的零假设时。

假负性(II型错误)——当你接受一个错误的零假设时。

  • 犯I型错误(假正例)的概率等于临界区α的显著性水平或大小。

    α=P[当H0为真时拒绝H0]

  • 犯II型错误(假阴性)的概率等于β。

    β=P[当H1为真时不拒绝H0]

例子:

这个人因犯有入室盗窃罪而被捕。由法官组成的陪审团必须裁定有罪或无罪。

H0:人是无辜的

H1:人有罪

第一类错误是如果陪审团判定某人有罪[拒绝接受H0],尽管此人是无辜的[H0是真的]。

第二类错误将是当陪审团释放该人[不拒绝H0]虽然该人有罪[H1是真的]。

统计学意义

为了理解这个话题,让我们考虑一个例子:假设有一家糖果厂每天生产500克的糖果。工厂维修后的一天,一名工人声称他们不再生产500克的糖果,可能是少了或多了。

那么,这名工人凭什么宣称这一错误?那么,我们应该在哪里画一条线来决定糖果条重量的变化呢?这一决定/界限在统计学上具有重要意义。

置信水平

顾名思义,我们有多自信:我们在做决定时有多自信。LOC(置信水平)应大于95%。不接受低于95%的置信度。

显著性水平(α)

显著性水平,用最简单的术语来说,就是当事实上是真的时,错误地拒绝零假设的临界概率。这也称为I型错误率。

这是I类错误的概率。它也是拒绝域的大小。

一般来说,在测试中,它是非常低的水平,如0.05(5%)或0.01(1%)。

如果H0在5%的显著性水平上没有被拒绝,那么我们可以说我们的零假设是正确的,有95%的把握。

P值

假设我们在1%的显著性水平上进行假设检验。

H0:平均值<X(我们只是假设一个单尾检验的情况。)

我们得到临界值(基于我们使用的测试类型),发现我们的测试统计值大于临界值。因此,我们必须在这里拒绝零假设,因为它位于拒绝域。

如果零假设在1%时被拒绝,那么可以肯定的是,在更高的显著性水平上,比如5%或10%,它会被拒绝。

如果我们的显著性水平低于1%,那么我们是否也必须拒绝我们的假设呢?

是的,有可能发生上述情况,而“p值”正在发挥作用。

p值是可以拒绝零假设的最小显著性水平。

这就是为什么现在很多测试都给出p值,而且它更受欢迎,因为它给出的信息比临界值更多。

  • 对于右尾检验:

    p值=P[检验统计量>=检验统计量的观察值]

  • 对于左尾检验:

    p值=p[检验统计量<=检验统计量的观察值]

  • 对于双尾检验:

    p值=2*p[检验统计量>=|检验统计量的观察值|]

p值决策

我们比较p值和显著性水平(alpha)对零假设做出决定。

  • 如果p值大于alpha,我们不拒绝零假设。

  • 如果p值小于alpha,我们拒绝零假设。

原文链接:https://www.analyticsvidhya.com/blog/2020/07/hypothesis-testing-68351/

欢迎关注磐创AI博客站: http://panchuang.net/

sklearn机器学习中文官方文档: http://sklearn123.com/

欢迎关注磐创博客资源汇总站: http://docs.panchuang.net/

假设检验:使用p值来接受或拒绝你的假设相关推荐

  1. 假设检验之p值(probability value)

    假设检验与参数估计时统计推断的两个组成部分,它们都是利用样本对总体进行某种推断,但推断的角度不同. 参数估计是在总体参数未知的前提下,通过样本统计统计量估计参数的方法,得到总体参数的一个点估计或区间估 ...

  2. R语言使用pwr包的pwr.t.test函数对分组样本数相同的t检验进行效用分析(power analysis)、在已知效应量(effect size)、显著性水平、样本量的情况下计算假设检验的效用值

    R语言使用pwr包的pwr.t.test函数对分组样本数相同的t检验进行效用分析(power analysis).在已知效应量(effect size).显著性水平(sig).样本量(sample s ...

  3. UA MATH566 统计理论5 假设检验:p值

    UA MATH566 统计理论5 假设检验:p值 p-value 做实证研究的paper大多数都要汇报p值,并且几乎是只看p值的.2016年ASA做了一个关于p值的statement,指出了关于p值的 ...

  4. 统计学中假设检验有关P值的讨论

    摘要: 统计检验能有效确定从样本统计推断至总体时所犯错误的概率,其在医学.临床试验.观察性研究方面有着重要意义.近年来期刊编辑和统计顾问越来越关注医学文献中显着性检验和P值的过度使用和误解.为了澄清对 ...

  5. Spire.XLS教程:在 Java 中接受或拒绝所有跟踪更改

    启用了"修订"的 Excel 文档知道自作者保存文档以来对文档进行了哪些更改.如果对文档拥有完全权限,则可以接受或拒绝每次修订.本文介绍如何使用Spire.XLS for Java ...

  6. 03【应届生精准求职】如何准备面试?校招流程,零经验如何面对?看穿面试官背后的套路?面试类型?如何谈薪资?接受或拒绝offer?

    应届生如何准备面试? 如何准备面试?校招流程,零经验如何面对?看穿面试官背后的套路?面试类型?如何谈薪资?接受或拒绝offer? 第一节 校招选拔流程 1,互联网公司为例 研发类:技术,产品 非研发类 ...

  7. R语言使用epiDisplay包的shapiro.qqnorm函数执行Shapiro-Wilk检验并可视化QQ图、整合假设检验和可视化结果判断数据是否符合正态分布(图中包含假设检验的p值)

    R语言使用epiDisplay包的shapiro.qqnorm函数执行Shapiro-Wilk检验并可视化QQ图.整合假设检验和可视化结果判断数据是否符合正态分布(图中包含假设检验的p值) 目录

  8. ttest求pvalue_T检验和其他假设检验的P值怎么理解

    关于T检验以及各种假设检验的操作方法,网络上有很多详细讲解.今天我们不谈具体的步骤,而是通过案例全方面地将T检验的逻辑和思想,掰开揉碎,尝试用白话讲一步,增进大家的理解,不知知足欢迎指出讨论. 案例: ...

  9. 统计学假设检验中 p 值的含义具体是什么?

    一.作者:李可乐 链接:https://www.zhihu.com/question/23149768/answer/23745483 来源:知乎 著作权归作者所有.商业转载请联系作者获得授权,非商业 ...

最新文章

  1. 网站架构之统一数据服务平台技术
  2. Oracle-绑定变量binding variable解读
  3. C++ Primer 5th笔记(chap 15 OOP)虚函数
  4. 变量不同作用域的测试
  5. jenkins java常用插件下载,Jenkins简单介绍以及插件入门
  6. python并发处理机制_Python并发编程—同步互斥
  7. jquery-1.10.2_d88366fd.js和jquery-3.1.0.min.js 在用touch事件时候, event.changedTouches[0]报错的问题。...
  8. 如何一周过计算机二级java篇
  9. Java项目——个人博客系统
  10. 反编译exe文件并替换图片资源
  11. 高通QFIL烧录错误解决方法
  12. 飞Young任意路由器连接[破解路由器限制]
  13. 线性代数的本质-基向量部分理解
  14. C# 报错 provisional headers are shown learn more
  15. rdl报表 mysql_SSRS报表服务随笔(rdl报表服务)-报表参数
  16. guid分区怎么装win7_GUID分区是否可以装Win7?
  17. 跨部门不配合工作_跨部门对接很难?同事不配合你?来,我教你怎么搞定!
  18. 学会这样用Excel,你也可以月薪三万!
  19. WIN键 锁定、解锁
  20. Hadoop生态圈(十六)- HDFS Snapshot快照详解

热门文章

  1. mysql 5.6 免安装版_mysql 5.6.15的免安装版 安装
  2. Hadoop源代码分析
  3. 照片的35x45,300dpi怎么弄
  4. 串口console乱码_串口打印机不能打印或打印乱码
  5. 室内定位:基于NB/LTE Cat.1蜂窝网络的穿戴设备定位 BLE-4
  6. 程序员2016年4月:Spark核心技术与实践
  7. 智能家居的春天来临 曾经共患难的集成商如今能同享福吗?
  8. R语言 时间序列arima模型
  9. vlookup匹配的文字显示0_VLOOKUP函数用法大全
  10. http //t cn/xx 等链接的生成与还原