python计算p-value
有的时候新方法有效果提升,但是为了验证这种提升是否是显著的(防止有的方法具有随机性),需要进行ttt检验,根据计算的ppp-valuevaluevalue来决定两种方法的均值是否真的存在显著差异。
ttt检验通常有
1. 单样本ttt检验
本次不涉及
2. 独立样本ttt检验
两独立样本t检验要求两样本所代表的总体服从正态分布 , 且两总体方差相等。计算时只需要两样本的均值、方差、样本数即可。
from scipy import statsstats.ttest_ind_from_stats(mean1,std1,nobs1,mean2,std2,nobs2,equal_var=True,
)
参数解释:
- mean1, std1, mean2, std2: 第一组样本的均值和方差,第二组样本的均值和方差。
- nobs1, nobs2: 第一组和第二组样本的数量。
- equal_var: 如果为True(默认),执行一个标准的独立2样本测试,假设总体方差相等。 如果为假,执行Welch−tWelch-tWelch−t检验,它不假设总体方差相等。
如果两组样本的具体样本值已知,则可以使用以下方法:
from scipy import statsstats.ttest_ind(a, b, axis=0, equal_var=True, nan_policy='propagate')
参数解释:
- a, b: 两组样本,长度必须相同。
- equal_var: 如果为True(默认),执行一个标准的独立2样本测试,假设总体方差相等。 如果为假,执行Welch−tWelch-tWelch−t检验,它不假设总体方差相等。
如果我们观察来自相同或不同人群的两个独立样本,例如男孩和女孩或两个民族的考试成绩,我们可以使用这个测试。 测试衡量的是样本之间的平均值(期望值)是否存在显著差异。 如果我们观察到一个大的p值,例如大于0.05或0.1,那么我们不能拒绝相同平均分数的零假设。 如果p值小于阈值,例如1%、5%或10%,那么我们拒绝等平均值的原假设。
3. 配对ttt检验(paired t-test)
用于分析配对定量数据之间的差异对比关系。与独立样本t检验相比,配对样本T检验要求样本是配对的。两个样本的样本量要相同;样本先后的顺序是一一对应的。
```python
from scipy import statsstats.ttest_rel(a, b, axis=0, nan_policy='propagate')
参数解释:
- a, b : 长度必须相同.
- axis : int or None, 计算ttt-testtesttest所沿着的轴。 如果为None,则计算整个数组 。
4. 根据返回值的到结构
以上计算返回类scipy.stats.stats.Ttest_relResult
的对象,其有两个属性,可据此获得ppp值:
res = stats.ttest_rel(a, b)
print("t-statistic:", res.statistic)
print("p-value:", res.pvalue)
python计算p-value相关推荐
- 使用OpenCV和Python计算图像的“彩色度”
使用OpenCV和Python计算图像"彩色度" 1. 效果图 2. 炫彩度量方法是什么? 3. 源代码 参考 你是否尝试过计算每个图像的炫彩值,并根据炫彩值对自己的图像数据集进行 ...
- Python计算训练数据集(测试集)中某个分类变量阴性(阳性)标签样本的不同水平(level)或者分类值的统计个数以及比例
Python计算训练数据集(测试集)中某个分类变量阴性(阳性)标签样本的不同水平(level)或者分类值的统计个数以及比例 目录
- Python计算两个numpy数组的交集(Intersection)实战:两个输入数组的交集并排序、获取交集元素及其索引、如果输入数组不是一维的,它们将被展平(flatten),然后计算交集
Python计算两个numpy数组的交集(Intersection)实战:两个输入数组的交集并排序.获取交集元素及其索引.如果输入数组不是一维的,它们将被展平(flatten),然后计算交集 目录
- Python使用datetime中的timedelta模块实现时间增减:python计算100天后是哪年那月那日?
Python使用datetime中的timedelta模块实现时间增减:python计算100天后是哪年那月那日? 目录
- python计算特征的统计值并文本输出
python计算特征的统计值并文本输出 # 输出统计分位数 df.describe(percentiles=[0.05, 0.25, 0.5, 0.75, 0.95]) featname:A => ...
- python计算特征与目标的相关性并可视化
python计算特征与目标的相关性并可视化 pandas计算相关性 # 相关性 tips.corr() Out[2]: total_bill tip size total_bill 1.000000 ...
- python计算时间差
python计算时间差 # 使用datetime 和 timedelta import datetime old_time = datetime.datetime.now() print(old_ti ...
- python计算两个字典的相同点(从key、value、item角度)
python计算两个字典的相同点(从key.value.item角度) 字典是由一个一个的 key-value 构成的,key 是找到数据的关键,Python 对字典的操作都是通过 key 来完成的. ...
- python计算两个向量之间的欧氏距离
python计算两个向量之间的欧氏距离 代码: import numpy as np # 向量的值 feature_1 = np.array([1,2,3]) feature_2 = np.array ...
- python计算文件md5值_用python 正确计算大文件md5 值
python 计算文件的md5值很方便,但如果只是简单的把文件都入到内存中,大文件会导致问题,一般采用切片的方式分段计算,下面的几个函数可以很好的解决这个问题. 使用 hashlib import h ...
最新文章
- 前端路由(一) 路由,hash,history
- oracle的java路径,oracle学习----访问路径
- 使用jsp打印HTTP请求头部所有字段的值
- 如何在一个页面添加多个不同的kindeditor编辑器
- 宝塔 开启_宝塔面板安装完的一些列操作
- 循环序列模型 —— 1.8 带有神经网络的梯度消失
- js new Date()
- spark学习-52-Spark的org.apache.spark.SparkException: Task not serializable
- c语言取字节高四位低四位,C语言取一个数的最高位
- mysql重复你数据标识_MySQL 处理重复数据
- 应用层TCP三次握手及各种协议简介telnet【笔记】
- 推荐几款不错的Chrome 插件
- 中小型企业网络IP地址规划案例
- 带时效性的条形码_条形码
- 英语作文中常见的连接词
- Xposed原理分析
- 用tagcloud插件制作的超炫酷“云标签”(3D旋转和平铺),附前后台代码及标签配置页面
- C语言中对字符串的加密和解密
- uniapp拨打电话
- Linux路由表的抽象扩展应用于nf_conntrack