一、t检验的概念

以 t 分布(未知)为基础的一类比较均数的假设检验方法,t 分布的发现使得小样本统计推断成为可能。

二、t  检验的应用条件

  • 随机样本;
  • 来自正态分布总体(小样本时);
  • 两独立样本比较时,要求两总体方差相等(方差齐性),单样本不需要方差齐性。

三、t检验的分类

1、单样本资料的t 检验

推断样本所属总体的均数是否已知值有差异。

某研究人员在东北某县抽取36名儿童,得到前囟门闭合月龄的均值()和标准差(),要研究该县儿童前囟门的闭合月龄是否大于一般儿童(一般儿童总体的均值已知)?

检验的假设:              :  (双侧)

统计量:

分子:样本均数与的差距

分母:样本均数的标准误

:用标准误来度量样本均数与的差距,没有量纲

理论依据: 成立时,统计量

理论:成立时,统计量服从自由度为分布,根据这一知识来计算相应的值 。

统计推断:  事先规定一个“小”的概率(检验水准),

值小于,拒绝零假设;

值不小于,则不拒绝零假设。

2、配对设计资料(特殊的单样本检验)的t 检验

配对设计资料其实是一种特殊的单样本资料,配对设计资料的检验,实际上就是检验配对资料差值的总体均值是否为0。

配对设计(paired design)是一种特殊的设计方式,能够很好地控制非实验因素对结果的影响,有自身配对和异体配对之分。

自身配对:

(1)某组同质被试对象接受两种不同的处理。例如,抽取一个年级的同学作为被测试对象,分别取得他们的身高和体重数据,试问他们的平均身高和体重是否存在显著差异?

(2)某组同质被试对象接受处理前后是否存在差异。例如,某公司推广了一种新的促销方式,实施前后分别统计了员工的业务量,得到数据,试问这种促销方式是否有效?

异体配对(同源配对)

同源配对也就是同质的被测试对象分别接受两组不同的处理。例如,为了验证某种记忆方法对改善儿童对词汇的记忆是否有效,先随机抽取40名学生,再随机分为两组。一组使用该训练方法,一组不使用,3个月后对这两组学生进行词汇测验,得到数据。试问该训练方法是否对提高词汇记忆量有效?

在配对的t检验中,强调被测试对象一定要同质,其目的就是为了消除额外变量的影响,更能反映自变量和因变量之间的关系。配对样本t检验的过程,是对两个同质的样本分别接受两种不同的处理或一个个体先后接受不同的处理来判断不同的处理是否有差别。这种检验的目的在于根据样本数据对样本来自的配对总体的均值是否有显著差异进行判断的。

配对设计资料的分析着眼于每一对观察值之差,这些差值构成一组资料,用检验推断“差值的总体均数是否为 0”。

为研究孪生兄弟中, 先出生者的出生体重与后出生者的出生体重是否相同,共收集了15对孪生兄弟的出生体重:

检验的假设: ,即差值的总体均数为 0

:  (双侧) ,即差值的总体均数不为 0

其中:等于两个配对样本的总体均值之差

确定检验水准:

统计量:,此题中=15,,计算出

分子:样本均差值的均值与0的差距

分母:样本均差值的均值的标准误

:对子数

理论依据: 成立时,统计量

理论:成立时,统计量服从自由度为分布,根据这一知识来计算相应的值 。

统计推断:  事先规定一个“小”的概率(检验水准),

值小于,拒绝零假设;

值不小于,则不拒绝零假设。

故此题中,查 t 界值表,0.02< <0.05,在=0.05 的水准上拒绝,可认为孪生兄弟的出生体重与出生顺序有关,先出生者的体重大于后出生者。

3、两独立样本资料的t 检验

python实现检验均值差检验-《统计推断——假设检验——python代码检验两均值差(置换法)》

中心思想:当两个总体分布分别为和,时,两样本均值差的抽样分布仍为正态分布。

3.1、抽样

从同一对象群,随机抽取两组,各接受不同处理。

或者,从两个对象群,各随机抽取一组,接受相同处理。

3.2、数据

两独立样本的资料

3.3、目的

检验两个总体均数是否相等

3.4、假定

①两个总体均服从正态分布,方差相等(方差齐性)

例   某医师要观察两种药物对原发性高血压的疗效,将诊断为Ⅱ期高血压的 20 名患者随机分为两组 (两组患者基线时血 压之间的差别没有统计学意义);

一组用卡托普利治疗,另一组用尼莫地平治疗;  3 个月后观察舒张压下降的幅度(mmHg)

结果如下:

试比较两药平均降压效果(总体的均值)有无差异。

经检验,  两组舒张压下降值均服从正态分布、方差齐性。

建立假设,确定检验水准

 或

 或

计算统计量

检验统计量为:,其中表示两组标准误平方之和。

其中是利用两样本联合估计的方差(两组方差的加权平均),表示第一组的方差,表示第二组的方差。

已知,当成立时,统计量服从自由度分布。

确定 P 值,作出推断

按照的水准,(双侧检验);,不拒绝 ,差异无统计学意义;

结论:尚不能认为这两种药物降压效果有差别。

注意:“尚不能”的含义,很可能现状样本量不够,样本量增大之后得到的t值又不一样,则得到的值也不一样,则样本可能存在差别。

②两样本所属总体方差不等——>> 近似 t 检验(Satterthwaite近似法)

为比较特殊饮食与药物治疗改善血清胆固醇 (mmol/L)的效果,将 24 名志愿者随机分成两组,每组 12 人,甲组为特殊饮食组,乙组为药物治疗组。 

受试者试验前后各测量一次血清胆固醇,差值见下表

请比较两种降血清胆固醇措施的效果是否相同?

方差齐性检验(统计量遵循F分布)——后面章节有详细的齐性检验步骤

建立检验假设,确定检验水准

                                             

计算统计量

确定值,作出推断

查F分布的双侧临界值表,,  <0.05, 在 =0.05的水准上拒绝,两个样本方差的差异具有统计学意义(即样本方差的差异反映了总体方差的差异)。

结论:可以认为两个总体方差不相等。

两组血清胆固醇差值均服从正态分布条件,经以上方差齐性检验;此资料视为总体方差不相等。

                       

统计量 

成立时,的分布比较复杂,需要对自由度进行校正,校正之后的分布近似为分布。

,分子是两组样本均数标准误平方之和的平方。

据此近似的得到相应的值。

建立检验假设,确定检验水准

                                            

计算统计量

确定 P 值,作出推断

界值表,得(双侧检验),时,值为犯假阳性错误的概率。

故在水平上拒绝

两组样本降血清胆固醇效果的差异具有统计学意义;

结论:可以认为两种降血清胆固醇措施的效果不同。

③两独立样本资料的方差齐性检验 

某口腔医院选择所在城市 40­50 岁慢性牙周炎患者 36 例,测得吸烟组(18 人)菌斑指数(PLI)均值为 84.71、标准差为 8.14;非吸烟组(18 人)菌斑指数的均值为 82.20、标准差为  6.18,试检验两总体方差是否相等?

,     ,     

建立检验假设,确定检验水准

                                             

计算统计量

(有两个自由度:分子自由度和分母自由度),表示较大方差。

确定值,作出推断

查F分布的双侧临界值表,, >0.05, 在 =0.05的水准上不能拒绝,两个样本方差的差异不具有统计学意义。

结论:不能认为两个总体方差不相等。

统计推断——假设检验——t 检验(总体的标准差未知)相关推荐

  1. 假设检验 - 区间估计(总体标准差未知)

    背景知识: u分布:指标准正态分布,是以0为平均值,以1为标准差的正态分布 z分布:泛指正态分布,是以u为平均值,以西格玛为标准差的正态分布.对于z分布中的所有变量X,转换为(X-U)/西格玛时,其服 ...

  2. 统计推断——假设检验——两变量关联性分析

    一.线性相关描述 问题:两变量间是否存在相关或关联? 身高与体重 尿铅排出量与血铅含量 凝血时间与凝血酶浓度 血压与年龄 1.线性相关 例 在某地一项膳食调查中,随机抽取了14名40~60岁的健康妇女 ...

  3. 假设检验-U检验、T检验、卡方检验、F检验

    一.假设检验 假设检验是根据一定的假设条件,由样本推断总体的一种方法. 假设检验的基本思想是小概率反证法思想,小概率思想认为小概率事件在一次试验中基本上不可能发生,在这个方法下,我们首先对总体作出一个 ...

  4. 假设检验/T检验/F检验/Z检验/卡方检验

    ****显著性水平: 一个概率值,原假设为真时,拒绝原假设的概率,表示为 alpha 常用取值为0.01, 0.05, 0.10 ****什么是P值? p值是当原假设为真时样本观察结果及更极端结果出现 ...

  5. 假设检验——Z检验、t检验

    假设检验,也称为显著性检验,通过样本的统计量来判断与总体参数之间是否存在差异(差异是否显著).即我们对总体参数进行一定的假设,然后通过收集到的数据,来验证我们之前作出的假设(总体参数)是否合理.在假设 ...

  6. 问卷 假设检验 t检验_真实问题的假设检验

    问卷 假设检验 t检验 A statistical Hypothesis is a belief made about a population parameter. This belief may ...

  7. 标准差σ未知_均值的置信区间估计(σ未知)

    最常见的置信区间估计包括对总体均值的估计.在实际情况下,用样本均值和样本标准差已知,而总体标准差未知的样本数据来估计总体均值.在这种情况下,统计学家提出了一种称为t分布来对均值的置信区间进行估计.通过 ...

  8. 统计推断——假设检验——线性回归——R的平方可以为负数

    在<统计推断--假设检验--简单线性回归分析>,我们学到了一个回归模型评价指标:决定系数. 回顾一下决定系数的公式:,其中代表离差总平方和,代表残差平方和,代表回归平方和,各指标计算如下所 ...

  9. 假设检验 - 区间估计 (总体标准差σ已知)

    标准正态分布表(带x) 1.所谓的正态分布表都是标准正态分布表(n(0,1) [标准差=1,平均值=0],通过查找实数x的位置,从而得到p(z<=x). 2.表的纵向代表x的整数部分和小数点后第 ...

  10. 基于单样本单统计推断-假设检验

    目录 假设检验单的要素 假设检验中的概率 假设检验的步骤 1. 确定目标检验参数 2.确定原假设H0和备选假设Ha 3. 计算检验统计量 4. 根据显著性水平α确定拒绝域 5. 将检验统计量计算值与拒 ...

最新文章

  1. 5G NGC — PCF 策略控制功能
  2. 深度学习-Tensorflow2.2-图像处理{10}-UNET图像语义分割模型-24
  3. 少儿编程100讲轻松学python(四)-python如何判断是否为数字字符串
  4. WINCE6.0 DM.EXE 激活驱动失败的原因之一
  5. MySQL基本指令汇总
  6. 【已作废】基于Freeswitch的ASTPP计费系统的安装 (CentOS 7)
  7. 工信部:不得利用“携号转网”实施恶性竞争行为
  8. 2. mysql 基本命令
  9. 机器学习中的数学系列
  10. 西门子224XP源码,包括pcb,原理图,224xp源码
  11. CRM客户管理系统源码,基于ThinkPHP开发
  12. 微信开放平台申请方法与用途
  13. 离线百度地图,添加按钮点击切换卫星地图和街道地图(纯JS)
  14. 美林投资时钟策略如何运用?
  15. BERT通俗笔记:从Word2Vec/Transformer逐步理解到BERT
  16. 教士、神父、教父、牧师有什么区别?
  17. Word文档中styles分析
  18. ACE库中ACE_Msg_Log日志对象浅论
  19. 出租车不需要司机了?带你体验无人驾驶出租车!|『智能产品家』第三期
  20. 工业螺旋齿轮行业调研报告 - 市场现状分析与发展前景预测(2021-2027年)

热门文章

  1. android去掉锁屏界面,android怎么去掉锁屏界面
  2. 二阶带通滤波器电路设计
  3. 杭电OJ 1720 进制处理
  4. concurrent包的实现示意图
  5. 胡晓明的“出埃及记”,他将带领支付宝驶向何方?
  6. 基于javaweb+jsp的企业人事管理系统(java+SSM+jsp+mysql+maven)
  7. complie myplayer on svn source code
  8. video.js使用方法
  9. Firebug插件:
  10. VSPE虚拟串口关机蓝屏(BSOD)的解决办法