有的时候新方法有效果提升,但是为了验证这种提升是否是显著的(防止有的方法具有随机性),需要进行ttt检验,根据计算的ppp-valuevaluevalue来决定两种方法的均值是否真的存在显著差异。

ttt检验通常有

1. 单样本ttt检验

本次不涉及

2. 独立样本ttt检验

两独立样本t检验要求两样本所代表的总体服从正态分布 , 且两总体方差相等。计算时只需要两样本的均值、方差、样本数即可。

from scipy import statsstats.ttest_ind_from_stats(mean1,std1,nobs1,mean2,std2,nobs2,equal_var=True,
)

参数解释:

  • mean1, std1, mean2, std2: 第一组样本的均值和方差,第二组样本的均值和方差。
  • nobs1, nobs2: 第一组和第二组样本的数量。
  • equal_var: 如果为True(默认),执行一个标准的独立2样本测试,假设总体方差相等。 如果为假,执行Welch−tWelch-tWelch−t检验,它不假设总体方差相等。

如果两组样本的具体样本值已知,则可以使用以下方法:

from scipy import statsstats.ttest_ind(a, b, axis=0, equal_var=True, nan_policy='propagate')

参数解释:

  • a, b: 两组样本,长度必须相同。
  • equal_var: 如果为True(默认),执行一个标准的独立2样本测试,假设总体方差相等。 如果为假,执行Welch−tWelch-tWelch−t检验,它不假设总体方差相等。

如果我们观察来自相同或不同人群的两个独立样本,例如男孩和女孩或两个民族的考试成绩,我们可以使用这个测试。 测试衡量的是样本之间的平均值(期望值)是否存在显著差异。 如果我们观察到一个大的p值,例如大于0.05或0.1,那么我们不能拒绝相同平均分数的零假设。 如果p值小于阈值,例如1%、5%或10%,那么我们拒绝等平均值的原假设。

3. 配对ttt检验(paired t-test)

用于分析配对定量数据之间的差异对比关系。与独立样本t检验相比,配对样本T检验要求样本是配对的。两个样本的样本量要相同;样本先后的顺序是一一对应的。

```python
from scipy import statsstats.ttest_rel(a, b, axis=0, nan_policy='propagate')

参数解释:

  • a, b : 长度必须相同.
  • axis : int or None, 计算ttt-testtesttest所沿着的轴。 如果为None,则计算整个数组 。

4. 根据返回值的到结构

以上计算返回类scipy.stats.stats.Ttest_relResult的对象,其有两个属性,可据此获得ppp值:

res = stats.ttest_rel(a, b)
print("t-statistic:", res.statistic)
print("p-value:", res.pvalue)

python计算p-value相关推荐

  1. 使用OpenCV和Python计算图像的“彩色度”

    使用OpenCV和Python计算图像"彩色度" 1. 效果图 2. 炫彩度量方法是什么? 3. 源代码 参考 你是否尝试过计算每个图像的炫彩值,并根据炫彩值对自己的图像数据集进行 ...

  2. Python计算训练数据集(测试集)中某个分类变量阴性(阳性)标签样本的不同水平(level)或者分类值的统计个数以及比例

    Python计算训练数据集(测试集)中某个分类变量阴性(阳性)标签样本的不同水平(level)或者分类值的统计个数以及比例 目录

  3. Python计算两个numpy数组的交集(Intersection)实战:两个输入数组的交集并排序、获取交集元素及其索引、如果输入数组不是一维的,它们将被展平(flatten),然后计算交集

    Python计算两个numpy数组的交集(Intersection)实战:两个输入数组的交集并排序.获取交集元素及其索引.如果输入数组不是一维的,它们将被展平(flatten),然后计算交集 目录

  4. Python使用datetime中的timedelta模块实现时间增减:python计算100天后是哪年那月那日?

    Python使用datetime中的timedelta模块实现时间增减:python计算100天后是哪年那月那日? 目录

  5. python计算特征的统计值并文本输出

    python计算特征的统计值并文本输出 # 输出统计分位数 df.describe(percentiles=[0.05, 0.25, 0.5, 0.75, 0.95]) featname:A => ...

  6. python计算特征与目标的相关性并可视化

    python计算特征与目标的相关性并可视化 pandas计算相关性 # 相关性 tips.corr() Out[2]: total_bill tip size total_bill 1.000000 ...

  7. python计算时间差

    python计算时间差 # 使用datetime 和 timedelta import datetime old_time = datetime.datetime.now() print(old_ti ...

  8. python计算两个字典的相同点(从key、value、item角度)

    python计算两个字典的相同点(从key.value.item角度) 字典是由一个一个的 key-value 构成的,key 是找到数据的关键,Python 对字典的操作都是通过 key 来完成的. ...

  9. python计算两个向量之间的欧氏距离

    python计算两个向量之间的欧氏距离 代码: import numpy as np # 向量的值 feature_1 = np.array([1,2,3]) feature_2 = np.array ...

  10. python计算文件md5值_用python 正确计算大文件md5 值

    python 计算文件的md5值很方便,但如果只是简单的把文件都入到内存中,大文件会导致问题,一般采用切片的方式分段计算,下面的几个函数可以很好的解决这个问题. 使用 hashlib import h ...

最新文章

  1. 前端路由(一) 路由,hash,history
  2. oracle的java路径,oracle学习----访问路径
  3. 使用jsp打印HTTP请求头部所有字段的值
  4. 如何在一个页面添加多个不同的kindeditor编辑器
  5. 宝塔 开启_宝塔面板安装完的一些列操作
  6. 循环序列模型 —— 1.8 带有神经网络的梯度消失
  7. js new Date()
  8. spark学习-52-Spark的org.apache.spark.SparkException: Task not serializable
  9. c语言取字节高四位低四位,C语言取一个数的最高位
  10. mysql重复你数据标识_MySQL 处理重复数据
  11. 应用层TCP三次握手及各种协议简介telnet【笔记】
  12. 推荐几款不错的Chrome 插件
  13. 中小型企业网络IP地址规划案例
  14. 带时效性的条形码_条形码
  15. 英语作文中常见的连接词
  16. Xposed原理分析
  17. 用tagcloud插件制作的超炫酷“云标签”(3D旋转和平铺),附前后台代码及标签配置页面
  18. C语言中对字符串的加密和解密
  19. uniapp拨打电话
  20. Linux路由表的抽象扩展应用于nf_conntrack

热门文章

  1. Python if语句嵌套
  2. 【ML】线性回归的吉布斯采样(Gibbs Sampling)实现(python)
  3. 字符串转化为艺术字图片
  4. 论php常见的问题[转载自原乌云]
  5. 离线数仓和实时数仓的区别
  6. vulnhub-BBS (CUTE): 1.0.1-cute
  7. n皇后问题 递归和非递归
  8. 智慧企微导购系统-渠道活码玩法带来的好处
  9. 从原理剖析带你理解Stream
  10. Java API学习(二)javax包