• T检验通常分为三种:单样本T检验双样本T检验配对样本T检验
  • 原理可以参考:一文详解t检验
  • 本文主要介绍使用python实现T检验的过程,内容主要是参考这篇博文:利用python库stats进行t检验

文章目录

  • 一、单样本T检验
  • 二、独立样本t检验(双样本T检验)
  • 三、配对样本T检验

一、单样本T检验

  • 目的:检验单样本的均值是否和已知总体的均值相等

  • 前提条件
    (1)总体方差未知,否则就可以利用 Z Z Z 检验(也叫 U U U 检验,就是正态检验);
    (2)正态数据或近似正态;
    (3)连续变量

  • 原假设和备择假设
    H 0 : 样 本 均 值 ( X ‾ ) 和 总 体 均 值 ( μ ) 相 等 H 1 : 样 本 均 值 ( X ‾ ) 和 总 体 均 值 ( μ ) 不 相 等 \begin{aligned} & H_{0}: 样本均值(\overline{X})和总体均值( \mu )相等\\ & H_{1}: 样本均值(\overline{X})和总体均值( \mu )不相等 \end{aligned} ​H0​:样本均值(X)和总体均值(μ)相等H1​:样本均值(X)和总体均值(μ)不相等​

  • 例子:假设已知我国男青少年的平均身高是1.73,那么取某高校50名男生的身高(本文采用随机数据),想比较该高校与我国男青少年的平均身高是否存在差异。

ttest_1samp 函数参数可参考:Python scipy.stats.ttest_1samp实例讲解

from scipy import statsrvs = stats.norm.rvs(loc=1.5, scale=1, size=(50)) # 生成均值为1.5,标准差为1的50个样本
t, p = stats.ttest_1samp(rvs, 1.73)               # 进行单样本T检验print(" T-test: %f\n"%t,"P-vlaue: %f"%p)# T-test: -3.087647
# P-vlaue: 0.003317

结论:T值小于0,说明样本均值小于总体均值;P值小于0.05,说明该高校与我国男青少年的平均身高存在差异。

  • 单侧检验 :scipy库中stats只提供了双侧检验,如果需要单侧检验只需要将计算出来的P值除于2即可,这里参考文章:利用python进行单边T检验

  • 置信区间:采用 scipy.stats.norm.interval() 函数计算

import numpy as npstats.norm.interval(alpha = 0.95,loc = np.mean(rvs),scale = stats.sem(rvs)
)

二、独立样本t检验(双样本T检验)

  • 目的:检验两组独立样本均值是否相等
  • 前提条件
    (1)两组总体方差相等,如果不相等,先利用levene检验,检验两总体是否具有方差齐性;
    (2)正态数据或近似正态;
    (3)连续变量
  • 原假设和备择假设
    H 0 : 两 独 立 样 本 均 值 相 等 H 1 : 两 独 立 样 本 均 值 不 相 等 \begin{aligned} & H_{0}: 两独立样本均值相等\\ & H_{1}: 两独立样本均值不相等 \end{aligned} ​H0​:两独立样本均值相等H1​:两独立样本均值不相等​

场景1: 想比较可口可乐饮料在沃尔玛、大润发两个超市的销量是否存在差异
场景2: 想比较南、北方人的平均身高、体重是否存在差异

需要注意的是:前期需要检验两组方差是否相等,如不相等, scipy.stats.ttest_ind() 函数中的参数 equal_var 需要设置成 False

  • levene 检验P值 > 0.05,接受原假设,认为两组方差相等
from scipy import statsrvs_1 = stats.norm.rvs(loc=1.5, scale=1, size=(50)) # 生成均值为1.5,标准差为1的50个样本
rvs_2 = stats.norm.rvs(loc=2, scale=1, size=(50))   # 生成均值为2,标准差为1的50个样本levene = stats.levene(rvs_1, rvs_2)                 # 进行 levene 检验t, p = stats.ttest_ind(rvs_1,rvs_2,equal_var=True) # 独立样本t检验print("levene 检验P值: %f"%levene.pvalue,'\n')print("独立样本t检验")
print(" T-test: %f\n"%t,"P-vlaue: %f"%p)

  • T值小于0,说明第一组数据的均值小于第二组
  • 单侧检验:同上

三、配对样本T检验

  • 目的:比较同一组样本在不同场景下,均值是否存在差异
  • 前提条件
    (1)两组总体方差相等,如果不相等,先利用levene检验,检验两总体是否具有方差齐性;
    (2)正态数据或近似正态;
    (3)连续变量
  • 原假设和备择假设
    H 0 : 两 配 对 样 本 均 值 相 等 H 1 : 两 配 对 样 本 均 值 不 相 等 \begin{aligned} & H_{0}: 两配对样本均值相等\\ & H_{1}: 两配对样本均值不相等 \end{aligned} ​H0​:两配对样本均值相等H1​:两配对样本均值不相等​

场景1: 将小白鼠配对为两组,分别接受不同的处理,检验处理结果的差异
场景2: 对于一批血清样本,将其分为两个部分,利用不同的方法接受某种化合物的检验,检验结果的差异
场景3: 检验癌症患者术前、术后的某种指标的差异
场景4: 可口可乐饮料今年与去年在沃尔玛超市销售额均值是否存在差异

与独立样本t检验相比,配对样本T检验要求样本是配对的,两个样本的样本量要相同

python 实现有两种方式:
(1)两组数据做差,再对差值进行单样本T检验,检验均值为0;
(2)利用 scipy.stats.ttest_rel() 函数进行配对样本T检验

from scipy import statsrvs_1 = stats.norm.rvs(loc=1.5, scale=1, size=(50)) # 生成均值为1.5,标准差为1的50个样本
rvs_2 = stats.norm.rvs(loc=2, scale=1, size=(50))   # 生成均值为2,标准差为1的50个样本levene = stats.levene(rvs_1, rvs_2)          # 进行 levene 检验
t1, p1 = stats.ttest_1samp(rvs_1 - rvs_2, 0) # 单样本T检验
t2, p2 = stats.ttest_rel(rvs_1,rvs_2)        # 配对样本t检验print("levene 检验P值: %f"%levene.pvalue,'\n')print("单样本T检验")
print(" T-test: %f\n"%t1,"P-vlaue: %f"%p1)print("\n配对样本t检验")
print(" T-test: %f\n"%t2,"P-vlaue: %f"%p2)

  • T值小于0,说明第一组数据的均值小于第二组
  • 单侧检验:同上

python T检验相关推荐

  1. python方差检验分析(ANOVA)

    python方差检验分析(ANOVA) 方差分析(Analysis of Variance,简称ANOVA),又称"变异数分析",是R.A.Fisher发明的,用于两个及两个以上样 ...

  2. Python | KS检验以及其余非参数检验的实现

    Python | KS检验以及其余非参数检验的实现 1 什么是KS检验 2 KS检验分类? 3 KS检验的Python实现 3.1 检验指定的数列是否服从正态分布 3.2 检验指定的两个数列是否服从相 ...

  3. python t检验_讲讲统计学中T检验的种类

    这一篇给大家介绍一下T检验的种类以及具体的Python实现代码.T检验是比较两个均值差异的,不同种类T检验的差别其实在于均值的计算差异. 1.单样本T检验 单样本T检验是用来检验一组样本的均值A与一个 ...

  4. python单位根检验看结果_Python ADF 单位根检验 如何查看结果的实现

    如下所示: from statsmodels.tsa.stattools import adfuller print(adfuller(data)) (-8.14089819118415, 1.028 ...

  5. python 相关性检验怎么计算p值_不会Python进行时间序列预测?不要紧,大神来教你...

    作者:Leandro Rabelo译者:李洁整理:Lemonbit本文内容较长,较为详细的阐述了进行时间序列预测的步骤,有些内容可能暂时用不到或者看不懂,但不要紧,知道有这么一个概念,后续碰到的时候, ...

  6. python 单位根检验代码_python时间序列分析

    什么是时间序列 时间序列简单的说就是各时间点上形成的数值序列,时间序列分析就是通过观察历史数据预测未来的值.在这里需要强调一点的是,时间序列分析并不是关于时间的回归,它主要是研究自身的变化规律的(这里 ...

  7. python 相关性检验怎么计算p值_收藏 | 大神教你用Python预测未来:一文看懂时间序列...

    (由Python大本营付费下载自视觉中国) 作者 |  Leandro Rabelo 译者 | 李洁 整理 | Lemonbit 出品 | Python数据之道 本文内容较长,较为详细的阐述了进行时间 ...

  8. python adf检验_python做adf检验

    adf检验是用来检验序列是否平稳的方式 一般来说是时间序列中的一种检验方法 python中可使用现成的工具statsmodels来实现adf检验 import numpy as np import s ...

  9. python白噪声检验结果查询_使用python实现时间序列白噪声检验方式

    白噪声检验也称为纯随机性检验, 当数据是纯随机数据时,再对数据进行分析就没有任何意义了, 所以拿到数据后最好对数据进行一个纯随机性检验 acorr_ljungbox(x, lags=None, box ...

  10. python 白噪声检验-python之时间序列分析(一)

    公式只能传图片?,好多公式都没写上,但是,不管有没有公式,写得一样无趣至极,在中国人民大学出版社出版的王燕编著的<<应用时间序列分析(第三版)>>的基础上写的,文中说的第几页都 ...

最新文章

  1. chrome浏览器不能录音:Uncaught TypeError: Cannot read property ‘getUserMedia‘ of undefined解决方法
  2. 奇怪吸引子---Dadras
  3. 【转】如何选好Android开发书籍和教程[总结]
  4. mysql控制台增加一个用户_MySQL 纯命令行添加用户
  5. 通用路由封装(GRE)×××配置
  6. 什么是框架?spring mvc框架
  7. python怎么把变量付给数组_使用Python将数组的元素导出到变量中(unpacking)
  8. StringUtils 的常用方法
  9. C#:根据特定分隔符分割字符串
  10. 史上最迷你人脸数据集olivettifaces基于卷积神经网络模型+迁移学习构建人脸识别模型实战
  11. Mosets Tree开发笔记
  12. 千图成像_两分钟教你玩转千图成像Part1~
  13. Learun,已开源,一个.net web快速开放工具
  14. 基于php+mysql的企业人事管理系统
  15. 安徽省2019c语言二级答案,2019年全国计算机二级C语言练习及答案二
  16. SpringBoot + React汽车租赁管理系统 附带详细运行指导视频
  17. vue实例中调用外部js_js文件中引用vue实例对象
  18. Nexperia |超低电容 ESD 保护二极管保护汽车数据接口基础半导体器件
  19. 番茄钟工作法--我们天生爱分享
  20. 模拟信号或数字(4-20MA或485)转PWM频率可选、可达5A

热门文章

  1. STM32 | C语言对寄存器的封装
  2. SRAM与SDRAM的比较
  3. 定义一个类,并且在测试类中使用
  4. python 行列式_python 中leastsq 中的雅可比行列式的作用是什么
  5. 万众瞩目的BAISS公链将如何彻底改变区块链现状?
  6. 测量,信号处理中的精度分析 误差传播理论
  7. ks 曲线_ROC、KS曲线及AUC、KS值
  8. 财务部门服务器操作系统,中型企业如何选择财务系统服务器?
  9. scratch编程——画笔模块画各种同心图案
  10. scratch(图形化编程工具)使用画笔绘制雪绒花!真的太美了!