提出问题:想知道北京大学所有男生的平均身高是否等于1.8米

1、抽样(比如抽取100人作为样本)。

2、做出假设,假设北京大学男生总体的平均身高等于1.8米。(零假设,null hypothesis)。

这里用假设检验来判断样本所代表的总体的均数是否等于1.8米,本质是判断零假设成立的前提下(假设总体均数等于1.8米),是否有可能抽到目前这个样本及更极端的样本。

关于假设检验的基本思想,读一下这篇你就懂了:我来尝试给你讲清统计学中的假设检验和两类错误

3、基于当前零假设和当前样本,计算 z score (z值)或t score(t值),通过z值 / t值及比该数值更极端的值出现的概率来代表抽到目前这个样本及更极端的样本的概率。其计算公式如下。



总体标准差已知则计算z值即可,但大多数情况下总体标准差是未知的,此时用样本标准差代替,计算t值。

在本例中,先计算样本均数和样本标准差,即sample mean和sample standard deviation,也就是说z值和t值都是在当前抽到的样本的基础上计算得到的,如果重新抽样,z值和t值可能会变化;

true mean under null hypothesis就是我们零假设中设定的1.8米,也就是说z值和t值都是在零假设成立的前提下计算得到的数值;

true standard deviation是北京大学所有男生这个总体身高的标准差,需根据实际情况判断是否能够获得这一数据进而决定用z值还是t值。

4、在计算完z值或t值之后,如何判断z值 / t值及比该数值更极端的值出现的概率有多大?什么叫做『更极端的值』?概率小到多少就认为是不可能发生呢?

z值服从标准正态分布,t值服从t分布(近似正态分布的一簇曲线,均数为零),某一段分布曲线下的面积就是某一取值范围的z值 / t值出现的概率。

注意:这里的表达必须是『某一取值范围的z / t值出现的概率』,因为z分布和t分布分别是z值和t值的概率分布,单个数值对应的概率是0。

在z分布或t分布中,随着曲线向两端延伸,其对应的z值 / t值的绝对值越来越大,此时我们认为z / t的取值越来越极端,z值 / t值及更极端的值出现的概率越来越小。

通常假设检验中认为概率小于5%的事件在一次抽样中是不可能发生的。

如下图。

z分布或t分布曲线
双侧检验
红色箭头所指的横轴区域表示z值/t值及更极端的值
灰色阴影部分表示z值/t值及更极端的值发生的概率,为5%
也就是说,在零假设成立前提下,基于目前抽到的样本,我们的检验思路如下:

计算得出的z值/t值落在红色箭头范围内 → 在一次抽样中,抽中目前样本及更极端的样本的概率小于5% → 在一次抽样中,目前样本及更极端的样本不可能被抽中 → 拒绝零假设

由计算公式可知,z值和t值就是目前抽到的这个样本的均数与零假设中规定的总体均数之间的差异。

我们通常说:想判断这个差异有没有统计学意义,其实是想判断在零假设成立的前提下(假设总体均数等于1.8米),是否有可能得到目前这个样本并计算出目前这个差异。

『有可能得到』就是我们常说的差异没有统计学意义,还没有理由拒绝零假设;『不可能得到』就是差异有统计学意义,拒绝零假设。

本例是双侧检验,单侧检验的结论推断方法和双侧检验一样,大家可自行练习。

z分布或t分布曲线
单侧检验的两种情况
红色箭头所指的横轴区域表示z值/t值及更极端的值
灰色阴影部分表示z值/t值及更极端的值发生的概率,为5%

5、最后,根据目前得到的z值或t值是否落在红色箭头的范围内,得到假设检验的结论。

如果你计算得到的z或t值落在了非红色箭头的范围内,就意味着零假设成立的前提下,目前样本是有可能被抽中的(目前的样本已经被抽中了,这是事实),也就是说零假设是符合事实的,所以我们没有理由拒绝零假设。

相反,如果z或t值落在了红色箭头的范围内,就意味着零假设成立的前提下,目前的样本在一次抽样中是不可能发生的(这是违反事实的),那么你就有理由怀疑零假设的真实性,从而拒绝零假设。

注意:z检验和t检验的关键在于,z值和t值分别服从标准正态分布和近似正态分布的t分布。所以为了保证你计算出来的z值/t值服从上述分布,就要保证样本所来自的总体服从正态分布或近似正态分布。这是单样本z检验/t检验的前提条件。

5个步骤,掌握单样本z检验 / t检验相关推荐

  1. 假设检验/T检验/F检验/Z检验/卡方检验

    ****显著性水平: 一个概率值,原假设为真时,拒绝原假设的概率,表示为 alpha 常用取值为0.01, 0.05, 0.10 ****什么是P值? p值是当原假设为真时样本观察结果及更极端结果出现 ...

  2. 格兰杰因果关系检验r语言_R语言系列第四期:R语言单样本双样本差异性检验

    之前详细介绍了利用R语言进行统计描述,详情点击:R语言系列第三期:①R语言单组汇总及图形展示.R语言系列第三期:②R语言多组汇总及图形展示.R语言系列第三期:③R语言表格及其图形展示 从这个部分我们就 ...

  3. 卡方检验、T检验+F检验、方差分析、Z检验

    卡方检验.T检验+F检验.方差分析.Z检验

  4. t检验.医学统计实例详解-医学统计助手★卡方检验,t检验,F检验,秩和检验,方差分析

    t检验是医学统计学中常用的一种假设检验方法,用于比较两个样本均值是否有显著差异.它可以帮助医学研究者确定一个治疗方法或药物是否显著地改善了患者的症状或生理指标. 在医学研究中,t检验常被用来: 比较两 ...

  5. R语言中的均值差异检验/t检验的结果解读

    T 检验是用于小样本(样本容量小于 30)的两个平均值差异程度的检验方法.它是用 T 分布理论来推断差异发生的概率,从而判定两个平均数的差异是否显著,常被应用于小样本判断的置信度. 最常用 t 检验的 ...

  6. SAP PP 系统怎么知道某个工单release触发的过程中检验的检验类型是03?

    SAP PP 系统怎么知道某个工单release触发的过程中检验的检验类型是03? 在SAP QM模块中,对于生产过程的检验有提供标准的检验类型03予以支持.实际上项目实践中,还有可能复制03检验类型 ...

  7. python生成白噪声与纯随机检验——Ljung-Box检验

    生成白噪声 生成白噪声的代码请参考:https://blog.csdn.net/sinat_24259567/article/details/93889547 import numpy as npde ...

  8. lm做自相关做几阶_lm检验(lm检验怎么判断是几阶自相关)

    LM检验自相关性的方法是什么?它的判断标准是什么? LM检验即拉格朗日乘数检验,用来检验模型残差序列是否存在序列相关.原假设是不存在序列相关:备选假设是:存在p阶自相关.检验统计量渐进服从卡方分布,如 ...

  9. R语言使用cph函数和rcs函数构建限制性立方样条cox回归模型、使用cox.zph函数执行PH检验、检验模型是否满足等比例风险

    R语言使用cph函数和rcs函数构建限制性立方样条cox回归模型.使用cox.zph函数执行PH检验.检验模型是否满足等比例风险 目录

最新文章

  1. 窃喜,第一次修改开源的东西
  2. ibatis运行流程
  3. 机器学习笔记 (聚类) 层次聚类 Agglomerative Clutsering(Single-linkage、Complete-linkage,Group average)
  4. sparksql保存数据常见操作
  5. 交换字典的key和value
  6. 昨天看了华星巨幕《海神号》
  7. switchyomega规则列表备份_一键备份微博并导出生成PDF,顺便用Python分析微博账号数据...
  8. 深度森林实现时间序列预测(Python)
  9. MySQL配置+SQLyog安装教程
  10. 如何保护自己的机器不受“网络执法官”盗用IP地址及密码
  11. 计算机表格画斜线,word表格斜线_Word2010怎么绘制斜线表头-太平洋IT百科手机版...
  12. word中图片为嵌入式格式时显示不全_电脑中Word图片显示不全的六种处理方法
  13. 本科学计算机大学学金融工程,2020年金融工程专业排名
  14. 名利如过往云烟,知足就好
  15. <hr> 标签:定义水平线
  16. Java毕业设计 JSP+MySQL幼儿园信息管理系统
  17. 计算机基础知识文件的复制移动,如何复制文件
  18. 解决百度云非限速版本被封下载问题
  19. 使用百度天气API制作天气组件
  20. 通俗解释乔姆斯基文法体系

热门文章

  1. 【微信小程序丨第二篇】小程序的基本目录结构与文件作用剖析
  2. Java 验证日期/时间的有效性
  3. python中forward是什么意思_Python 中 fd 表示什么?
  4. 是谁在偷窥我们的网络隐私?
  5. 马上七夕了程序员如何给爱人一个浪漫表白?
  6. 侄女是一名教师已结婚,节假日旅游顺路探望远嫁姨妈,不买任何东西是单纯还是不懂礼?
  7. ctf web5 练习_Writeup - CTF - WEB - 练习平台(123.206.31.85)
  8. 百度隐藏“快照”功能:原因未知
  9. 数据运营的整个过程是怎么样的
  10. python高斯求和