讲概率、论统计,肯定要从抛硬币说起啊,这才是正确打开姿势嘛。

1 什么是假设检验?

你说你的硬币是公平的,也就是“花”和“字”出现的概率是差不多的。

然后,你想和我打赌,作为一个资深的理智赌徒,我怎能听信你的一面之词,我提出要检查下你的硬币到底是不是公平的,万一是两面“花”怎么办?电影里面不是经常出现这样的桥段?

你神色紧张,死活不让我检查,后来我们提出了折衷的方案,抛几次硬币,看看结果是不是公平的。

总共扔了两次,都是“花”朝上,虽然几率是

,但是也正常,继续扔。

总共扔了四次,也都是“花”朝上,几率是

,感觉有点不正常,但是万一是运气呢?继续扔。

总共扔了十次,也都是“花”朝上,那我就认为很可能你这枚硬币不是公平的。

这就是假设检验:你提出假设:说你的硬币是公平的

我提出要检验你的假设:扔十次,看实验的结果是不是和你的假设相符

2 P值

为了完成假设检验,需要先定义一个概念:P值。我们这里就来解释什么是P值?

根据上面的描述,这里假设检验的思路就是:假设:硬币是公平的

检验:认为假设是成立的,然后扔十次,看结果与假设是否相符

反复扔硬币应该符合二项分布(这就不解释了),也就是:

其中,

代表扔硬币的次数,

代表“花”朝上的概率。

在我们认为硬币是公平的前提下,扔10次硬币应该符合以下分布:

下图表示的就是,假如硬币是公平的情况下的分布图:

我扔了十次之后得到的结果是,有八次正面:

这个时候有个数学大佬出来定义了一个称为

值(p-value)的概念:罗纳德·艾尔默·费希尔爵士(1890-1962)

把八次正面的概率,与更极端的九次正面、十次正面的概率加起来:

得到的就是(单侧P值):

其实,出现两次正面、一次正面、零次正面的概率也是很极端的:

所以(双侧P值):

2.1 为什么要把更极端的情况加起来?

根据扔硬币这个例子,可能你会觉得,我知道八次正面出现不正常就行了,干嘛要把九次、十次加起来?

我觉得有这么一个现实原因,比如我要扔1000次硬币来测试假设是否正确。

扔1000次硬币用二项分布来计算很麻烦,根据中心极限定理,我们知道,可以用正态分布来近似:

比如,我扔了1000次,得到了530次正面,用正态分布来计算就比较简单。

但是,对于正态分布,我没有办法算单点的概率(连续分布单点概率为0),我只能取一个区间来算极限,所以就取530、以及更极端的点组成的区间:

我上面只取了单侧P值,说明下:取单侧还是双侧,取决于你的应用

什么叫做更极端的点,也取决于你的应用

3 显著水平

总共扔10次硬币,那么是出现7次正面之后,可以认为“硬币是不公平的”,还是9次正面之后我才能确认“硬币是不公平的”,这是一个较为主观的标准。

我们一般认为

就可以认为假设是不正确的。

0.05这个标准就是显著水平,当然选择多少作为显著水平也是主观的。

比如,上面的扔硬币的例子,如果取单侧P值,那么根据我们的计算,如果扔10次出现9次正面:

表示出来如下图所示:

我们可以认为刚开始的假设错的很“显著”,也就是“硬币是不公平的”。

如果扔10次出现出现8次正面:

呃,这个和我们的显著水平是一样的啊,我们也可以拒绝假设,只是没有那么“显著”了。

4 与置信区间的关系

知识要联系起来看,理解更深刻。

置信区间,目的是根据样本构造一个区间,然后希望这个区间可以把真值包含进去,但是并不知道这个真值是多少?具体可以参考 如何理解 95% 置信区间?

而假设检验,则是假设真值是多少,然后检验这个假设是否可能为真。

之所以觉得它们有关系,大概是因为它们都提到了0.05。

它们之间的关系也简单,如果我们提出来的假设

在样本

的置信区间内,就可以通过测试:

反之,就不能通过:

统计学中sp_统计学假设检验中 p 值的含义具体是什么?相关推荐

  1. css中position的4个取值的含义

    css中position的4个取值的含义 一.在我们书写css代码的时候,position取值有4个,分别是: 1. Absolute:绝对定位,是相对于最近的且不是static定位的父元素来定位 2 ...

  2. 统计学中sp_统计学名词解释

    一.名词解释 总体: 指在同一组条件下所有成员的某种状态变量的集合: 或者说是某一变数的全部可 能值的集合:或性质相同的个体组成的整个集团. 样本:从总体中取出来用作分析.研究的个体称样本. 随机样本 ...

  3. 统计学中假设检验有关P值的讨论

    摘要: 统计检验能有效确定从样本统计推断至总体时所犯错误的概率,其在医学.临床试验.观察性研究方面有着重要意义.近年来期刊编辑和统计顾问越来越关注医学文献中显着性检验和P值的过度使用和误解.为了澄清对 ...

  4. 【生信】基因组学中的统计学应用

    [生信]基因组学中的统计学应用 本文图片来源网络或学术论文,文字部分来源网络与学术论文,仅供学习使用. 目录 [生信]基因组学中的统计学应用 1.生物统计学相关概念 2.统计学概念补充 统计描述和统计 ...

  5. 假设检验中的P值 与显著性水平的联系

    欢迎关注本人: 推荐系统公众号:Tiany_RecoSystem 知乎主页:https://www.zhihu.com/people/shen-xiao-ming-77 假设检验是推断统计中的一项重要 ...

  6. 假设检验中的P 值 (P value)

    假设检验是推断统计中的一项重要内容. 用SAS.SPSS等专业统计软件进行假设检验,在假设检验中常见到P 值( P-Value,Probability,Pr),P 值是进行检验决策的另一个依据. P ...

  7. 统计|假设检验中的P值(pvalue)如何看/怎样理解

    本博文源于<商务统计>,之前在做matlab编程和spss统计分析中,对p值的理解就是懵懵懂懂,无法确定出真正含义.今天就以新生儿的例子来观看p值是如何看的,并且了解假设检验的5个步骤. ...

  8. 机器学习中的统计学基础

    一.什么是统计学 是一门收集.整理和分析统计数据的方法科学 其目的是探索数据内在的数据规律性,以达到对客观事物的科学认识 统计学研究随机现象,以推断为特征,"由部分及全体"的思想贯 ...

  9. 基于R语言极值统计学及其在相关领域中的应用

    受到气候变化.温室效应以及人类活动等因素的影响,自然界中极端高温.极端环境污染.大洪水和大暴雨等现象的发生日益频繁:在人类社会中,股市崩溃.金融危机等极端情况也时有发生:今年的新冠疫情就是非常典型的极 ...

最新文章

  1. iframe,window,滚动栏的一些问题
  2. Ardino基础教程 4_交通灯
  3. 推荐一款基于SpringBoot+Vue开发的分布式网盘系统(附源码)
  4. 「offer来了」快来关注这些性能优化问题
  5. Java中如何获取字符串的Unicode编码
  6. 五、工作量证明链解决拜占庭将军问题之模拟程序(Objective-C)
  7. java解析简历_java:解析word文档(前程无忧简历),最好有代码案例?poi或者jacob解析都可以,有jar资源,求急。感谢...
  8. 如何在form初始化时自动隐藏FOLDER列
  9. 「代码随想录」518. 零钱兑换 II 【动态规划】力扣详解!
  10. VS2008开发Silverlight程序用到的插件
  11. 雷人:微软CEO鲍尔默因员工用iPhone动怒
  12. 瑞友天翼服务器系统资源不足,瑞友天翼问题处理
  13. 华硕fx60vm拆机图解_华硕fx60vm安装macOS10.13.6和Windows10双系统
  14. springboot整合postgresql
  15. redis在CentOs服务器上的安装和设置开机自启动
  16. 微信公众号推广分享二维码,关联扫码关注的客户
  17. 80老翁谈人生(198):老翁谈人生系列短文目录索引
  18. 生僻字存不到mysql_数据库存储生僻字存在的问题
  19. 指数的计算方法介绍!
  20. QLearning和DQN

热门文章

  1. android adb 控制手机
  2. Cathy学习Java——GUI与正则表达式
  3. 高校实验室预约系统功能简介及解决方案
  4. Jetson Nano入门教程:硬件篇+视频学习教程
  5. 路由设置代理ip的作用
  6. JAVA删除pdf空白页_【教程】Spire.PDF 教程:在C# 删除 PDF 中的空白页
  7. android如何实现用户注册功能,Android 实现简单的登录注册功能(SharedPreferences和SQLite)...
  8. 编写一程序从键盘输入圆锥体的半径r 高度h 并计算其体积
  9. ECharts - 15.旭日图
  10. python解一元二次方程虚根_Python编程实现数学运算求一元二次方程的实根算法示例...