最近和一个老同学讨论统计中的p-value检验问题,其中涉及到为什么需要用p-value来做假设检验的判断依据,上网查到了一个很好的例子:

教室里四位同学将装了若干数量的白球和黑球的箱子放在了课桌上,然后他们叫来了他们的小伙伴小花同学。

他们对小花说:“小花,我们来玩个猜猜猜的游戏吧,你在这个箱子里摸5次球,每次摸完都要放回去再摸下一次,然后你猜里面的白球和黑球是不是一样多。”,小花就愉快地同意了。

小花按照要求摸了三次球,每一次都是白球,这时她的心里已经有点怀疑白球和黑球是不是各一半了,她又继续摸,又摸了两次,还都是白球,这时她就大声地说:“箱子里面的白球和黑球肯定不是一样多的”。

小伙伴们打开箱子,发现果然大部分的球都是白球。

小花的判断为什么会对呢?来做个简单的概率计算,如果白球和黑球数量一样多的话,那么每次都摸到白球的概率是1/2。

她连摸三次都是白球的概率是:1/2*1/2*1/2=1/8=12.5%,这种事件发生的概率已经很低。她连摸五次都是白球的概率是:1/2*1/2*1/2*1/2*1/2=1/32=3.125%,这种事件发生的概率已经极低。

这就是假设检验的原理:在一定的统计假设的前提下,如果发生了小概率事件,我们就有理由怀疑假设的真实性,从而拒绝接受该假设。

小概率事件不会发生,是假设检验的前提。

在这个摸球故事中,假设是白球与黑球数量相同,但是小花摸了5次都是白球,概率是3.125%属于小概率事件,因此我们拒绝假设,也就是拒绝认为白球与黑球数量相同。

最后一个问题,概率低到多少会被认为是小概率事件呢?英国的统计学家Ronald Fisher把1/20作为小概率标准,也就是0.05,从此0.05或者比0.05小就叫做小概率事件。这个0.05就是P Value.

这个例子说明,在做判断的时候,是很难做出很好的决策的,因为有些时候,样本数据中提供的信息量很少,因此需要通过假设的方式,提供额外的信息,然后在提供这些额外信息的基础上,做进一步的分析,看得出的结论是否与这个假设矛盾,如果矛盾则反推出这个假设是错误的,否则接受这个假设。

统计中的p-value检验相关推荐

  1. 消解原理推理_什么是推理统计中的Z检验及其工作原理?

    消解原理推理 I Feel: 我觉得: The more you analyze the data the more enlightened, data engineer you will becom ...

  2. t检验自由度的意义_在统计中自由度是什么?

    大约一年前,一位读者问我是否可以试着解释自由度在统计学中的意义.从那时起,我一直在思考因为请求非常谨慎,像某种野兽,我不确定我是否可以安全地把它打倒在地. 自由度不容易解释,他们在统计中的一些先进和复 ...

  3. 统计中的f检验和t检验的区别

    统计中的f检验和t检验的区别 参考:http://emuch.net/html/201102/2841741.html 首先是目的不同.F检验用于比较两种分析方法是否存在显著差异(单边检验)或者两种方 ...

  4. Matlab在概率统计中的应用问题及解决方案集锦

    前言 关于MATLAB系列的精品专栏大家可参见 MATLAB-30天带你从入门到精通 MATLAB深入理解高级教程(附源码) 喜欢的小伙伴可自行订阅,你的支持就是我不断更新的动力哟! Matlab在概 ...

  5. 2018.11:大数据在政府统计中的应用、瓶颈及融合路径(余芳东)

    内容摘要:应用大数据是未来政府统计发展的必然趋势.本文系统梳理当前政府统计应用大数据的基本类型,研究探索大数据统计应用实践和基本方法思路,剖析大数据统计应用面临的困难和瓶颈,提出推进大数据与政府统计工 ...

  6. spss回归分析_回归分析中的简单斜率检验:用SPSS或jamovi实现

    哈哈,不简单的"简单效应",How old are you? 之前的两篇文章,我们已经深入探讨了如何用SPSS做方差分析中的简单效应检验,并且最终得到结论:要用GLM语句,不需要再 ...

  7. 数理统计复习笔记一——统计中常用的抽样分布(卡方分布,t分布,F分布)

    前言:   总结一下数理统计中的基本概念,一些用python的实现在这里.不断持续更新. 1. 几个基本概念  1.1 次序统计量  1.2 样本偏度与样本峰度  1.3 经验分布函数  1.4 抽样 ...

  8. 干货|SPSS方差分析中的简单效应检验(上)

    Hello,大家好! 这里是壹脑云科研圈,我是喵君姐姐~ 今天和大家分享的是包寒吴霜博士生介绍的 SPSS 方差分析中的简单效应检验系列中的第一部分 -- SPSS 方差分析中的简单效应检验:完整教程 ...

  9. 大数据在统计中的应用初探

    大数据是信息时代的必然产物,是人们在日常工作.学习.生活中,使用以现代网络.特别是以互联网为特征的现代信息技术和其他各种电子计量设备而产生的海量信息.对海量信息的采集.存储.分析.整合.控制而得到的数 ...

最新文章

  1. CFA将人工智能列入考试内容折射啥
  2. script标签中的async和defer
  3. 工具分享 --- 分享一个在线制作ico的网站
  4. linux防火墙开启某端口命令行,linux上防火墙 开启某个端口
  5. python根据文件路径获取上级目录路径
  6. 移动开发在路上-- IOS移动开发系列 多线程二
  7. 产品工作中/阅读中的涓滴意念
  8. ElasticSearch 学习(二)—— IK 分词器和 Kibana
  9. 消消乐android 源代码,【消消乐】源代码
  10. Java类加载机制,类加载过程,类加载器以及双亲委派详解
  11. 爬虫之-bilibili视频下载-下载链接获取
  12. Matplotlib自定义图例(多张独立图共享图例)
  13. 深度图像基础知识(一)
  14. windows安装IIS不成功的原因
  15. 抖音播放量为什么那么少?如何提升抖音账号权重?
  16. J2EE程序框架学习总结
  17. 关于csdn写的博文未显示,待审核状态
  18. 2008.05.25 读华为前执行副总裁李玉琢的《我与商业领袖的合作与冲突》有感(一)
  19. N卡和A卡怎么设置高性能模式|独立显卡怎么设置最佳
  20. 用c++实现职工管理系统

热门文章

  1. ERP需求和销售管理 概念
  2. 鹊华秋色(2009-06-10)
  3. 财富500强排名(2010)
  4. mysql字段值是什么_什么是数据库字段值
  5. 轻量级 Kubernetes 集群发行版 K3s 完全进阶指南
  6. ISP一键下载电路分析+74HC1G66GW(信号图)
  7. 世界战争2HTML5小游戏,[娱乐][PCD]SkyWarsReloaded —— 天空战争小游戏全新归来![1.8-1.13.2]...
  8. 我的世界java免费云电脑,云电脑app下载_云电脑官方版下载-我的世界中文网
  9. 基于python的梯度下降法的实现代码
  10. 零基础学习WEB前端开发(十六):font-family字体系列