上次写了统计学里面的置信度与置信区间以后,文章反响还不错,这次再来试着写写统计学里面的假设检验。点击查看:聊聊置信度与置信区间

假设检验的核心其实就是反证法。反证法是数学中的一个概念,就是你要证明一个结论是正确的,那么先假设这个结论是错误的,然后以这个结论是错误的为前提条件进行推理,推理出来的结果与假设条件矛盾,这个时候就说明这个假设是错误的,也就是这个结论是正确的。以上就是反证法的一个简单思路。

了解完反证法以后,我们开始正式的假设检验,这里还是引用一个大家都很熟悉的一个例子『女士品茶』。

女士品茶是一个很久远的故事,讲述了在很久很久以前的一个下午,有一群人在那品茶,这个时候有位女士提出了一个有趣的点,就是把茶加到奶里和把奶加到茶里面最后得到的『奶茶』的味道是不一样的。大部分人都觉得这位女士在瞎说,只有其中一位男士提出了要用科学的方法去证明到底一样不一样(牛人想问题角度永远都是那么独特,多想想别人为什么那么说,而不是一上来就不经思考的拒绝)。

接下来,我们具体看一下这一位男士是怎么去证明的。首先他假设了把茶加到奶里和把奶加到茶里面得出来的『奶茶』味道是一样的。然后随机把这两种『奶茶』端给女士,让女士品,是先加的奶还是先加的茶,如果女士都能品对,说明确实有差异,如果要是品不对,说明是没差异的。这里面就涉及到一个问题,让女士品多少杯呢,品一杯肯定是不行的,因为任意一杯猜对(瞎蒙)的概率都有50%。下面是不同杯数对应的猜对的概率(注意,这里是猜对而不是品对)。

通过上表我们可以看出,连续4杯都猜对的概率不足0.1,连续10杯都猜对的概率不足0.001。如果把奶加到茶里和把茶加到奶里面得到的『奶茶』真没有差别,也就是女士要想品对,基本全靠猜,但是10杯全部猜对的概率不足0.001,我们把这种概率很小很小(这里需要定义一下,具体多小算小概率事件)的事件称为小概率事件。我们认为小概率事件一般是不会发生的,如果发生了,说明我们的认知就是错误的,也就是说女士品茶不是靠猜的,也就是把奶加到茶里和把茶加到奶里面得到的『奶茶』的确是有差别的。

我们把上面这个过程就叫做假设检验

了解完假设检验的思想以后,我们来看一下具体步骤:

step1:提出零假设和备择假设;

零假设(H0)一般是我们要推翻的论点,备择假设(H1)则是我们要证明的论点。拿上面的女士品茶例子来讲。

H0:把茶加到奶里和把奶加到茶里面得到的『奶茶』是一样的。
H0:把茶加到奶里和把奶加到茶里面得到的『奶茶』是不一样的。

step2:构造检验统计量,并找出在H0假设成立的前提下,该统计量所服从的分布;

检验统计量是根据样本观测结果计算得到的样本统计量,并以此对零假设和备择假设做出决策。

图片来源于网络

上面图片中是三种不同的统计量以及其对应的分布,分别叫做Z检验、T检验、卡方检验。

Z检验:一般用于大样本(即样本容量大于30)平均值差异性检验的方法。它是用标准正态分布的理论来推断差异发生的概率,从而比较两个平均数的差异是否显著。在国内也被称作u检验。
T检验:主要用于样本含量较小(例如n < 30),总体标准差σ未知的正态分布。T检验是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。
卡方检验:卡方检验是统计样本的实际观测值与理论推断值之间的偏离程度,实际观测值与理论推断值之间的偏离程度就决定卡方值的大小,如果卡方值越大,二者偏差程度越大;反之,二者偏差越小;若两个值完全相等时,卡方值就为0,表明理论值完全符合。

下面为三种检验对应的分布图:

正态分布

T分布,与正态类似

卡方分布,n为自由度

根据不同检验的特征,我们可以根据下图来进行选择合适的检验方式:

step3:根据要求的显著性水平,求临界值和拒绝域

还记得我们在前面提到的小概率事件吗?如果小概率事件发生了,就表示我们的零假设是错误的,可是具体多小的概率才算是小概率呢?一般这个概率为0.05,也就是5%,如果一件事情发生的概率小于等于5%,我们就认为这是一个小概率事件,0.05就是显著性水平,用α表示。显著性水平把概率分布分为两个区间:拒绝区间和接受区间,最后计算出来的结果落在拒绝区间,我们就可以拒绝零假设;如果落在了接受区间,我们就需要接受零假设。1-α称为置信水平(置信度)。

现在我们知道了显著性水平了,然后就可以根据显著性水平求得临界值和拒绝域了。那具体怎么求呢?这里的临界值就是z值(正太分布用z值)或t值(t分布用t值),以临界值为端点的区间称为拒绝域。z值和t值直接根据显著性水平然后到对应的z值表和t值表中查询即可。

下图为双侧检验和单侧检验对应的α、1-α、临界值、拒绝域、接受域的情况,其中α是表示阴影部分的面积,而不是x轴的值。

双侧检验

单侧检验

到这里显著性水平对应的临界值和拒绝域就算出来了。

step4:计算检验统计量

根据我们在前面选择检验统计量类型,计算对应的检验统计量的值。除此之外我们还可以根据样本量得出P值,P值就是实际样本中小概率事件的具体概率值。

step5:决策

比较计算出来的检验统计量与临界值和拒绝域,如果值落在了拒绝域内,那我们就要拒绝零假设,否则接受零假设。

比较计算出来的P值和显著性水平α值,如果P值小于等于α,则拒绝零假设,否则接受原假设。

上面两种方法分别叫做统计量检验和P值检验。

以上就是假设检验的一般流程。除此之外,假设检验里面还有两种错误,第一类错误叫做弃真错误,通俗一点就是漏诊,就是本来是生病了(假设是正确的),但是你没有检测出来,所以给拒绝掉了;第二类错误是取伪错误,通俗一点就是误诊,就是本来没病(假设是错误的),结果你诊断说生病了(假设是正确的),所以就把假设给接受了。

最终判断 H0本来正确 H0本来错误
拒绝H0假设 犯I型错误 正确
接受H0假设 正确 犯II错误

I型错误的值一般为0.05,II型错误的值一般为0.1或0.2,除此之外还有一个指标叫做功效(power),power = 1 - II型错误的值,power 表示你有多大把握能够正确的拒绝你的零假设H0。

关于假设检验我们就讲到这里,后面会分享统计学里面的其他知识,如果有想看的内容,可以评论区留言。

基于《女士品茶》分享统计学中假设检验的那些知识和应用相关推荐

  1. 统计学中假设检验有关P值的讨论

    摘要: 统计检验能有效确定从样本统计推断至总体时所犯错误的概率,其在医学.临床试验.观察性研究方面有着重要意义.近年来期刊编辑和统计顾问越来越关注医学文献中显着性检验和P值的过度使用和误解.为了澄清对 ...

  2. 统计学中假设检验的原假设问题

    平均数比较的原假设是:平均数相等. 单样本t检验中原假设是观测者与检验值没有显著差异 正态分布的原假设是:服从正态分布. 方差齐次性检验的原假设是:方差相等. 相关性检验的原假设是:不相关. 差异性检 ...

  3. Python智慧农业之将数据存储在表格中并从图表中获取见解,基于 Google 表格和 Neo4j 中维护伴随植物知识图谱(教程含源码)

    即使有足够 100 亿人的食物,世界上仍有 10% 的人经常饿着肚子上床睡觉.气候变化加剧了粮食危机.虽然养活世界人口(2022 年为 80 亿)已经足够困难,但为未来人口(2050 年为 98 亿) ...

  4. 假设检验|第三章:统计学中的显著性水平α和P

    文章来自微信公众号:发现Minitab 概述 在假设检验中,我们很多时候对显著性水平α和P值理解不透彻?在这篇文章中,我将继续关注概念和图形,以帮助您更直观地理解假设检验在统计学中的工作原理. 为了实 ...

  5. 数据分析师必备知识点:统计学的假设检验

    上次写了统计学里面的置信度与置信区间以后,文章反响还不错,这次再来试着写写统计学里面的假设检验. 假设检验的核心其实就是反证法.反证法是数学中的一个概念,就是你要证明一个结论是正确的,那么先假设这个结 ...

  6. 统计学的假设检验/置信区间计算

    假设检验的核心其实就是反证法.反证法是数学中的一个概念,就是你要证明一个结论是正确的,那么先假设这个结论是错误的,然后以这个结论是错误的为前提条件进行推理,推理出来的结果与假设条件矛盾,这个时候就说明 ...

  7. 统计学中数据分析方法大全!

    来源:数据派THU 我是小z 之前有断断续续讲过统计学中的数据分析方法,今天分享的这篇更加全面.系统,涉及到18个方面,收藏就完事儿了~ Part1描述统计 描述统计是通过图表或数学方法,对数据资料进 ...

  8. 蓬莱小课:史上最全,统计学中常用16个数据分析方法大总结

    统计学是一种利用数学理论来进行数据分析的技术,通过统计学我们可以用更富有信息驱动力和针对性的方式对数据进行操作. 在数据分析工作中,利用统计学,我们可以更深入.更细致地观察数据是如何进行精确组织的,并 ...

  9. 统计计量 | 统计学中常用的数据分析方法汇总

    来源:数据Seminar本文约10500字,建议阅读15+分钟 统计学中常用的数据分析方法汇总. Part1描述统计 描述统计是通过图表或数学方法,对数据资料进行整理.分析,并对数据的分布状态.数字特 ...

  10. 统计学中p值计算公式_大学统计学白上了?800 多科学家联名反对 “统计学意义”,P 值该废了...

    [新智元导读]三位统计学家在 Nature 上发布公开信,号召科学家放弃追求 "统计学意义",这封公开信一周之内吸引了超过 800 名研究人员共同签署.大学里好不容易听懂的统计学, ...

最新文章

  1. Vue 中的作用域插槽
  2. WINDOWS XP SP2 NTFS EFS加密文件的解密案例
  3. aws ec2时间_AWS中自动化的三大领域,以避免支付过多的云账单
  4. java 加载class文件路径_动手实现MVC: 1. Java 扫描并加载包路径下class文件
  5. 排队接水(洛谷-P1223)
  6. 查询本地内存的栈大小_Js的内存问题
  7. Oracle插入时间
  8. delphi 的 pos 函数 对中文支持不好。
  9. 大数据分析可视化工具怎么选
  10. PHP常用正则类(全)
  11. SuperWebSocket发布了第一个测试版
  12. oracle模糊查询用法
  13. 【数字信号调制】基于matlab 16QAM信号调制解调【含Matlab源码 2050期】
  14. CUDA10,Torch安装解决NOTFOUND CUDA_cublas_device_LIBRARY,Ubuntu16.04安装torch遇到的错误
  15. 多元异方差检验 怀特检验 white检验python实现
  16. php实现12306验证码,PHP仿12306点图验证码
  17. 气相色XD谱灵敏度解析及载气不纯解决方案
  18. 企业中爬虫问题(来自网易公开课)
  19. YApi接口管理平台远程代码执行漏洞(含批量POC)
  20. vue H5(移动端)双指放大图片,单指拖动图片,等图片操作,使用viewerjs

热门文章

  1. 塞班手机刷linux,向 诺基亚 塞班手机中 批量导入 通讯录(csplit iconv)
  2. 【持续更新】Eclipse使用教程
  3. 分享一下老型号macbook pro在win10下安装BootCamp6.0驱动的方法
  4. 64位计算机安装xp,xp系统一键安装64位win7
  5. Visual Studio2017 MSDN安装
  6. 关于protel99和99se的系统字体设置问题
  7. C语言小项目——电子秒表(毫秒级)
  8. 模拟器计算机内存不足,网易mumu模拟器
  9. 合成大西瓜小游戏微信小程序源码/微信游戏小程序源码
  10. java我行我素购物系统_用java怎么编写 我行我素shopping购物管理体统