关于T检验以及各种假设检验的操作方法,网络上有很多详细讲解。今天我们不谈具体的步骤,而是通过案例全方面地将T检验的逻辑和思想,掰开揉碎,尝试用白话讲一步,增进大家的理解,不知知足欢迎指出讨论。

案例:5年前,全国男性的平均身高是1.75米(普查得到的总体均值),现在我们想知道如今男性的平均身高是否发生了改变。

思路:从全国男性群体中随机抽取1000名样本,获得样本均值和样本标准差,进行假设检验。

此处需要提醒的是,在进行假设检验时,我们的关注点在样本均值上,即我们不太关注原始样本的情况,而是关注由这个样本计算的样本均值了。

现在,在脑海中重复上面的操作:比如我们随机抽取100次,每次都抽取1000名,所以,我们会得到100个样本均数,将这100个样本均数放在一起再求均数和标准差,得到的均数会更加接近全国这个总体的均数,而这个标准差就是你听过的“标准误”。

然而,现实情况中我们只会抽取一次,只会得到一个样本均数和一个样本标准差,虽然这一个样本均数不如上面由100个样本均数平均后计算地精确,但在数学上仍可以证明,这一个样本均数也可以用来很好地估计总体均数。所以,问题的关键就变成了,不抽取100次,怎么计算“标准误”?好在我们也能证明,只抽样一次获得的样本标准差(S),除以根号N就可以得到“标准误”的估计值了,于是抽样一次就可以简单算出“标准误”,再次提醒,这个“标准误”实际上就是均数的标准差。

现在我们正式开始T检验的思路。上文提到了,我们关注的随机变量已经不是原始的身高了,而是身高的均数,身高的均数,身高的均数(重要的话,讲三遍)。所以,身高均数成为了我们研究的随机变量,它也存在总体与样本的区分,它也有均值和标准差,而且我们还可以确定无论身高是否真正服从正态分布,身高均值这个变量总是近似服从正态分布(中心极限定理),由此我们就可以利用这些性质进行假设检验。

回到上面的问题,5年前全国男子身高的总体均值是1.75米(μ),我们想知道现在是否有变化,其实就是想检验,5年后的现在全国男子身高的总体均值是否还是1.75米。因为我们不进行普查,所以我们希望通过随机抽取一个1000人的样本来进行推断和检验。得到样本后,我们可以计算出样本均数、样本标准差以及标准误。

假设样本均数为 1.77,显然我们不能因为1.77和1.75这两个数字的不同就判断说现在全国男子的平均身高要大于5年前了。因为即使现在的身高没有变化,你随机抽取一个1000人的样本得到的样本均数也不可能就恰好等于1.75,这很好理解,抽样是有误差的。于是,我们就要搞清楚现在得到的这个样本均数(1.77)和5年前的总体均数(1.75)的差异仅仅是因为抽样误差,还是确实是因为现在人们的平均身高发生了变化,这里的“变化”用数学的语言表达就是:现在全国男子身高的总体均数到底还是不是1.75,注意这里是“总体均数”,也就是说我们真正关心的是总体,样本只是用来获得总体信息的一个手段。

我们先假设,现在的总体均数没有变,仍等于1.75。所以,我们抽取的1000人就认为是在这个总体中抽取的一个样本。在零假设情况下,这个总体的均数是1.75,而我们获得的样本计算出来的样本均数是1.77,假设检验的问题就转换成了:在一个总体均数为1.75的总体中,抽到如今这个样本的概率是多少?

很明显,如果这样问,答案肯定就是0。在先前的文章中,我们知道一个样本相当于数轴上的一个点,而从一个数轴中抽取一个点的概率就是0。然后,你就看到了那句“永远让人费解的话”:P值是抽取到现有样本或更极端情况样本的概率。

如果把样本割裂来看,抽到一个样本的概率就是0,而“现有样本或更极端情况的样本”中的“或”字表明,P不是指的一个点的概率,而是一个区间的概率,也就是在μ为1.75的总体中,根据抽到的样本计算的样本均值比1.77还要大的样本(比如1.78或1.80),这些样本合起来的概率就是P,而这些样本相对均数为1.75的总体而言便是“更极端样本”了。看到这里,你可以想想这句话怎么用概率式子表示出来呢?

最后一个问题就是,如何计算P值?这里需要的基础知识是:知道一个变量服从正态分布,怎么计算这个变量在某个区间上的概率。比如,随机变量X服从均值为2.5,标准差为1.6的正态分布,如何求X<4的概率。这种问题的解法应该都学过,我们简单回顾一下。首先将X进行标准化处理(即将变量减去均数然后除以标准差),比如将4标准化:(4-2.5)/1.6=0.94,然后查标准正态概率分布表P(Z≤0.94)=0.8264,于是就得到P(X<4)=0.94。

了解概率的计算方法,我们就知道了,假设检验求P值就可以等价为求P(>1.77)(这里只考虑单侧检验,就是我们知道身高不可能比原来还矮,只可能不变或变高,更严谨的写法或者是双侧检验应该是:

,即P值是在零假设下得到那些值的概率,这些

值与μ的距离1.77与μ的距离更远,绝对值理解为“与均值的距离”)。这里的

跟上面的X一样看做一个变量,而1.77就是这个变量的一次取值。仿照上面的例子,

是近似服从正态分布的,如果知道其分布的均数(μ)和标准差(
),就可以计算出来P(
>1.77)。

需要区分的是,因为

所在分布的标准差(
,即上文提及的“标准误”)实际中经常是不知道的,所以需要用样本值来代替(
),而当用到样本值时,经过“标准化”后就不再服从标准正态分布,而是我们无比熟悉的t分布。通过我们的t检验公式(如下,把
当成“标准差”这个整体来看),不就是一个“标准化”吗:

将相关的数据代入,我们就可以得到一个t值,记为t0,通过查阅t分布(结合自由度),得出的P(t>t0)就是我们上面要求的P(

>1.77),也就是我们常说的P值。

至此,我们完整地还原了单样本t检验的整个过程。文章的目的是增进大家的理解,所以在某些细节方面笔墨较少(比如在单侧或双侧的问题等),但并不妨碍大家对检验原理和P值意义的认识。相信下次当你再看到P值的定义——抽取现有样本或更极端情况样本的概率,会有所了然。

我们今天虽仅仅讲解了单样本t检验,但其他检验(如两独立样本t检验、配对t检验,以及单样本方差分析、卡方检验)遵循的思路一致,仅仅只是样本的分布在发生变化。回顾一下,理解这些假设检验方法的精髓其实就在于:把样本均数而不是原始样本个体要当做一个随机变量来看,即我们研究的是

,不是X,在实际操作中,我们会得到很多X,只会得到一个

,但我们需要通过联想,想象出很多
,理解起来就会容易很多

t分布f分布与样本均值抽样分布_T检验和其他假设检验的P值怎么理解相关推荐

  1. t分布f分布与样本均值抽样分布_分布模拟1——MCMC抽样方法

    分布是一系列数字的规律组合.如果在收集了历史中的几百个数据后,我想知道这群数据背后的发射机制是什么,那么就得去寻找这个分布.当然这里的重点不是寻找分布,而是在已知分布的情况下,如何模拟这个机制发射出来 ...

  2. 各种各样的分布函数-t分布,F分布

    t-分布 设XXX~N(0,1)N(0,1)N(0,1),YYY ~ χ2(n)\chi^2(n)χ2(n),且XXX与YYY相互独立,则称随机变量T=XY/nT=\frac{X}{\sqrt{Y/n ...

  3. 概率论考点总结类型26 统计中的卡方分布 t分布F分布

  4. 数理统计复习笔记一——统计中常用的抽样分布(卡方分布,t分布,F分布)

    前言:   总结一下数理统计中的基本概念,一些用python的实现在这里.不断持续更新. 1. 几个基本概念  1.1 次序统计量  1.2 样本偏度与样本峰度  1.3 经验分布函数  1.4 抽样 ...

  5. python 实现抽样分布(T分布、F分布、卡方分布)

    标准正态分布 T分布 F分布 卡方分布

  6. 详解三大抽样分布:t分布、卡方分布、F分布

    转载自https://www.cnblogs.com/think-and-do/p/6509239.html T分布:温良宽厚 本文由"医学统计分析精粹"小编"Hiu&q ...

  7. t分布, 卡方x分布,F分布

    T分布:温良宽厚 本文由"医学统计分析精粹"小编"Hiu"原创完成,文章采用知识共享Attribution-NonCommercial-NoDerivative ...

  8. 卡方分布、t分布、F分布的期望与方差的计算

    文章目录 卡方分布 卡方分布的期望和方差 t分布 t分布的期望 t分布的方差 F分布 F分布的期望 F分布的方差 卡方分布 设 X 1 , X 2 , - - X

  9. t分布 u分布 卡方分布_重要抽样分布:卡方分布(χ2分布)、t分布和F分布

    冒泡~:最近在回顾一些以前学过的概率论和数理统计的知识 发现这三个抽样分布经常出现,在参数估计和假设检验也会运用到,所以做一下整理. [首先,这三个抽样分布都是来自正态总体的常用的分布 可以根据情况应 ...

  10. [考研数学]概率论难点总结:样本标准差,样本均值,均值的期望和方差,与t分布、卡方分布和F分布的关系及推导

    首先需要清楚一件事情,样本均值为X拔(上面有个棍) 样本的均值是讲从总体中抽样,这些样本的均值,而均值是指所有样本的真实均值. 后面部分很好推导,将括号展开后,由三部分组成,中间的部分为2倍的样本和样 ...

最新文章

  1. centos中ifcfg-eth0配置ip后,重启network服务提示地址已被使用
  2. 【转载】Linux命令-自动挂载文件/etc/fstab功能详解[转]
  3. 多线程中Local Store Slot(本地存储槽)[转]
  4. execve系统调用_Linux系统编程——进程替换:exec 函数族
  5. 开环直流电机的机械特性_无刷直流电动机的开环调速机械特性研究
  6. 常用Python文件
  7. linux系统如何管理文件
  8. coreos 搭建PHP,Linux_用Mac在CoreOS上搭建WordPress的教程,作者以自己的Mac笔记本为例, - phpStudy...
  9. 微信公众平台开发(75) 语音识别
  10. AMQ学习笔记 - 16. 确认机制的测试
  11. 搜狗站群之搜狗验证推送工具
  12. 微服务实践(七):从单体式架构迁移到微服务架构 - DockOne.io
  13. ROS学习记1——玩弄小海龟
  14. Html table边框重叠存在空隙的问题
  15. 数据链路层的主要功能与服务
  16. 游戏服务器内三类线程池的划分与使用
  17. MaskFormer
  18. AR发展简史(未完待续)
  19. 【剑指offter】【C++】【二叉树】27. 二叉树的镜像
  20. js学习笔记--了解promise

热门文章

  1. 因特尔显卡自定义分辨率_Win10创建自定义分辨率的方法教程
  2. 数据库 - 数据字典及其使用
  3. adb快速截图小脚本
  4. Linux curl 命令详解
  5. SpringBoot实现Excel导出并设置表格属性(easyExcel)
  6. 计算机加入域后的用户名和密码,Windows自动改计算机名和加入域工具
  7. 域用户创建和计算机加入域
  8. 赤裸裸的逆袭:小学生都用大数据分析苏轼了!
  9. ddr4 dqs 频率_ddr4
  10. SharePoint CAML 查询时间类型