【DA】单侧T检验p值与双侧T检验p值的关系
在阅读前,建议看:t检验、t分布、t值
先深入理解ttt检验、ttt分布、ttt统计量的数学意义
在编程的时候,不少语言或者编程包只有现成的双侧T检验的函数,我想知道怎么根据双侧T检验的 ppp 值来得到单侧T检验的 ppp 值。或者更广一点来说,单侧T检验 ppp 值与双侧T检验的 ppp 值是什么关系?
双侧T检验
零假设H0:μ=0H0:μ=0H0:μ=0,对立假设H1:μ≠0H1:μ≠0H1:μ=0。
简单理解:
我们假设了H0:μ=0H0:μ=0H0:μ=0,并要去检验此假设下H0成立的概率高不高。
因为是双侧,如下图所示,只要算出来的ttt统计量-tscoretscoretscore在95%的区域中,都是能够证明H0成立的。
P−valueP-valueP−value
在原假设为真时,检验统计量的观察值>=其计算值的概率:
双侧检验为分布中两侧的面积之和PPP越小,拒绝H0H0H0 的理由越充分。PPP可看作H0H0H0是正确的概率,或拒绝了H0H0H0会犯错的概率,所以PPP越小说明,犯错的风险越小。
对某一给定的样本,PPP越小,说明犯第一类错误(弃真)的概率越小,如果P<=α(可接受的最大第一类错误风险)P<=α(可接受的最大第一类错误风险)P<=α(可接受的最大第一类错误风险),则拒绝原假设H0H0H0;相反如果P>αP>αP>α,则认为第一类错误(弃真)的风险太大,于是接受原假设H0H0H0。
决策规则:P<αP<αP<α,拒绝H0H0H0
单侧T检验
零假设H0:μ<=0H0:μ<=0H0:μ<=0,对立假设H1:μ>0H1:μ>0H1:μ>0。
简单理解:
我们假设了H0:μ<=0H0:μ<=0H0:μ<=0,并要去检验此假设下H0成立的概率高不高。
因为是右侧检验(拒绝域在右边),如下图所示,只要算出来的ttt统计量-tscoretscoretscore在95%的区域中,都是能够证明H0成立的。
零假设H0:μ>=0H0:μ>=0H0:μ>=0,对立假设H1:μ<0H1:μ<0H1:μ<0。
简单理解:
我们假设了H0:μ>=0H0:μ>=0H0:μ>=0,并要去检验此假设下H0成立的概率高不高。
因为是左侧检验(拒绝域在左边),如下图所示,只要算出来的ttt统计量-tscoretscoretscore在95%的区域中,都是能够证明H0成立的。
单尾、双尾T检验的p值关系
双侧检验的p值=双侧分布中两端面积的总和双侧检验的p值=双侧分布中两端面积的总和双侧检验的p值=双侧分布中两端面积的总和
Excel-TDIST函数
在Excel中使用TDIST函数 计算p值p值p值:
TDIST(x,degreesfreedom,tails)TDIST(x,degrees_freedom,tails)TDIST(x,degreesfreedom,tails)
X
:为需要计算分布的数字。Degrees_freedom
:为表示自由度的整数。Tails
:指明返回的分布函数是单尾分布还是双尾分布。如果tails
= 1,函数 TDIST 返回单尾分布。如果tails
= 2,函数 TDIST 返回双尾分布。
TDIST函数适用于:Excel2003、Excel2007、Excel2010、Excel2013、Excel2016。
- 如果任一参数为非数值型,函数 TDIST 返回错误值 #VALUE!。
- 如果
degrees_freedom
< 1,函数 TDIST 返回错误值 #NUM!。 - 参数
degrees_freedom
和tails
将被截尾取整。 - 如果
tails
不为 1 或 2,函数 TDIST 返回错误值 #NUM!。 - 如果 x < 0,TDIST 返回错误值 #NUM!。 当 x < 0 时要使用 TDIST:
TDIST(−x,df,1)=1–TDIST(x,df,1)=P(X>−x)TDIST(-x,df,1) = 1 – TDIST(x,df,1) = P(X > -x)TDIST(−x,df,1)=1–TDIST(x,df,1)=P(X>−x)
TDIST(−x,df,2)=TDIST(x,df,2)=P(∣X∣>x)TDIST(-x,df,2) = TDIST(x,df,2) = P(|X| > x)TDIST(−x,df,2)=TDIST(x,df,2)=P(∣X∣>x)。 - 如果 tails = 1,TDIST=P(X>x)TDIST = P( X>x )TDIST=P(X>x),其中 X 为服从 t 分布的随机变量。
- 如果 tails = 2,TDIST=P(∣X∣>x)=P(X>xorX<−x)TDIST = P(|X| > x) = P(X > x\ or\ X < -x)TDIST=P(∣X∣>x)=P(X>x or X<−x)。
上述第5-7点对于x<0时的p值讨论,针对左侧检验和右侧检验都是一样的,同样适用!
TDIST函数 计算可知:
- p双侧=TDIST(x,df,2)=TDIST(−x,df,2)=P(∣X∣>x)=P(X>xorX<−x)p双侧=TDIST(x,df,2)=TDIST(-x,df,2)= P(|X| > x) = P(X > x \ or\ X < -x)p双侧=TDIST(x,df,2)=TDIST(−x,df,2)=P(∣X∣>x)=P(X>x or X<−x)
- 当ttt统计量>0时,p单侧=p双侧/2=P(X>x)p单侧=p双侧/2=P(X >x)p单侧=p双侧/2=P(X>x)
- 当ttt统计量<0时,p单侧=1−p双侧/2=P(X>−x)p单侧=1-p双侧/2=P(X > -x)p单侧=1−p双侧/2=P(X>−x)
Python-ttest等函数
H0:μ=μ0,H1:μ≠μ0H0:μ=μ0,H1:μ≠μ0H0:μ=μ0,H1:μ=μ0
T检验涉及的函数:ttest_1samp
进行双侧检验
# 导入包
from scipy import stats
import numpy as np# 1.单一样本T检验-ttest_1samp
# step1:生成数据,生成50行×2列的数据
np.random.seed(120) # seed 保证每次运行得到的结果是一样的rvs=stats.norm.rvs(loc=41000,scale=5000,size=20) # 均值为5,方差为10,50行×2列的数据# step2:检验两列数的均值差异是否显著
stats.ttest_1samp(rvs,40000)
返回结果 :Ttest_1sampResult(statistic=2.481538955443869, pvalue=0.02260211710111142)
此处的 ttt 统计量statistic=2.481538955443869
,p双侧p双侧p双侧pvalue=0.02260211710111142
# step3:单尾检验,H0:u>u0
def ttest_onesided(sample,u0):(t, p) = stats.ttest_1samp(sample,u0)if t > 0:onesided_p = 1 - p / 2else:onesided_p = p / 2return onesided_p
ttest_onesided(rvs,40000)
0.9886989414494443
# step4:单尾检验,H0:u<u0
def ttest_onesided(sample,u0):(t, p) = stats.ttest_1samp(sample,u0)if t < 0:onesided_p = 1 - p / 2else:onesided_p = p / 2return onesided_p
ttest_onesided(rvs,40000)
0.01130105855055571
ttt 统计量在双尾和单尾检测中的区别:
- ttt 统计量不管是双尾检验还是单尾检验,算出来的 ttt 值都是一样的,唯一的区别在于双尾中的是 ∣t∣|t|∣t∣ ,而单尾中的 ttt 是包含+、-符号的。
- 另一区别在于,查 ttt 分布表得出的临界值是不一样的。
双尾查的是 t−α/2(df)t-α/2(df)t−α/2(df) ,对比的是 p双侧p双侧p双侧 和 t−α/2(df)t-α/2(df)t−α/2(df) ;
单尾查的是t−α(df)t-α(df)t−α(df),对比的是 p单侧p单侧p单侧 和 t−α(df)t-α(df)t−α(df)
1)当ttt统计量>0时,p单侧=p双侧/2=P(X>x)p单侧=p双侧/2=P(X >x)p单侧=p双侧/2=P(X>x)
2)当ttt统计量<0时,p单侧=1−p双侧/2=P(X>−x)p单侧=1-p双侧/2=P(X > -x)p单侧=1−p双侧/2=P(X>−x)
更多应用:【DA】常见的假设检验
总结
单侧检验和双侧检验是等价的。没有谁更严格之说。
选择单尾和双尾检验时,就先根据实际问题确定正确的H0和H1,这样验证的思路也会更清晰。
实际上,同一个单尾检验问题,根据关注点的不同(提问方向的不同),既可以用左侧检验,也可以用右侧检验。两种检验得到的 ttt 统计量的值是一样的,区别在于拒绝域在哪一侧。
【DA】单侧T检验p值与双侧T检验p值的关系相关推荐
- 数据分析之【渐近显著性(双侧)】与【精确显著性[2*(单侧显著性)]】的异同
渐近显著性(双侧)和精确显著性(双侧)都是在统计学中用于判断检验结果是否显著的统计量. 相同点: 都是用于判断检验结果是否显著的方法. 都是以α作为显著性水平,即在α水平下,得出的检验结果显著. 不同 ...
- 概率统计Python计算:单个正态总体均值双侧假设的卡方检验
对正态总体的方差 σ 2 = σ 0 2 \sigma^2=\sigma_0^2 σ2=σ02进行显著水平 α \alpha α下的假设检验,检验统计量 n − 1 σ 0 2 S 2 \frac{ ...
- 带你搞明白单侧双侧T检验
双侧T检验 零假设H0: μ=0,对立假设Ha: μ≠0(p value可以通俗的理解为同时满足tscore和对立假设的概率,所以越小越支持原假设) 如果t score=1.96,此时p value就 ...
- 概率统计Python计算:单个正态总体均值双侧假设的T检验
正态总体的方差 σ 2 \sigma^2 σ2未知的情况下,对总体均值 μ = μ 0 \mu=\mu_0 μ=μ0进行显著水平 α \alpha α下的双侧假设检验,检验统计量 X ‾ − μ 0 ...
- 概率统计Python计算:双正态总体未知总体方差总体均值差双侧假设的T检验
对两个独立正态总体 X X X~ N ( μ 1 , σ 2 ) N(\mu_1,\sigma^2) N(μ1,σ2)及 Y Y Y~ N ( μ 2 , σ 2 ) N(\mu_2,\sigma^ ...
- 关于驰骋表单引擎中字段扩展设置对文本框Pop窗体返回值的升级说明 2012/11/13...
为什么80%的码农都做不了架构师?>>> 关于驰骋表单引擎中字段扩展设置对文本框Pop窗体返回值的升级说明 2012/11/13 现有功能: 以前版本仅支持自己定义url,返回 ...
- c语言(int)x 100,【单选题】下列语句执行后,变量a、c的值分别是( ) int x=182;
int a,c;c=x/100;a=x%10;...
[单选题]下列语句执行后,变量a.c的值分别是( ) int x=182; int a,c;c=x/100;a=x%10; 更多相关问题 阅读下面短文,掌握其大意,然后从36-55各题所给的四个选项( ...
- 正态分布、单 (双) 样本 T 检验
本次来说说连续变量与分类变量(二分)之间的检验. 通俗的来讲,就是去发现变量间的关系. 连续变量数量为一个,分类变量数量为两个. 总体:包含所有研究个体的集合. 样本:经过抽样总体中的部分个体. 均值 ...
- 假设检验是单侧还是双侧
H 0 : a = a 0 , H 1 : a ≠ a 0 H_0: a = a_0, H_1:a \neq a_0 H0:a=a0,H1:a=a0 H 0 : a ≥ a 0 , H 1 ...
- scala 分支控制 (单分支、双分支、多分支)、 分支判断的返回值
文章目录 1. 单分支.双分支.多分支 2. 分支判断的返回值 2.1 Scala中的表达式均有返回值 2.2 分支判断中返回值类型 3.Scala语言中没有三元运算符 1. 单分支.双分支.多分支 ...
最新文章
- css变成块级元素_探讨行内元素转换为块级元素_html/css_WEB-ITnose
- servlet输出html
- 代码小结:时区的时间问题
- CountDownLatch线程同步辅助
- 数据结构 5-0 树与二叉树总结
- $.ajax()方法详解(转)
- Spring属性编辑器解读(转载)
- 朱敏:美国往事---硅谷第一代中国大陆创业家的20年
- md文件如何打开,如何转html(无需破解)typora下载
- Windows10 启动 Docker Desktop 时报错 Containers feature is disabled
- 批量修改bilibili下载视频的文件名
- Android 代码设置默认输入法
- 大数据常用非关系型数据库汇总(NoSQL)
- Unity Gate Fit
- 【mac】【转发】Mac系统升级后,按大小写键没反应了,切换大小写的灯不亮了
- 前端网格布局grid
- win10安装mujoco
- HTML预格式化文本pre标签
- 如何利用wireshark抓取手机包
- 马斯克“超级高铁”成功测速355km|h,不过仅比我国“复兴号”快5km|h