置信区间、P值那点事
在假设检验中,我们常常看到跟P值形影不离的一对区间值, 就是大名鼎鼎的置信区间了。 这置信区间和P值是怎么得来的,我想大多数盆友都不会有什么直观的概念,只会注意P值是否小于0.05或者0.01(根据显著性水平确定)。
为了给大伙说清楚置信区间和P值的梗,小编以比较常见的两独立样本t检验为例进行分析。样本数据如下:
使用SPSS进行t检验后结果如下:
在检验结果中, 可以容易找到置信区间和P值, 下面我们一步一步来实现得到这两组值, 并且配合R语言代码来实践一遍, 诸位可以跟着一起做哦。
第一步:确定两样本的统计量
参考Group Statistics表,可以看到
样本量都是 5
样本均值分别是 33.00 和 44.60
样本标准差分别是 3.87298 和 3.84708
其中, 样本量、样本均值、样本方差都是比较基础的统计量,相信看官都明白怎么来的,不是很清楚的请翻看统计学入门书籍即可。
对于样本均值标准差(Std.Error Mean), 就不那么常见了,这里解释一下:
虽然统计学学过总体均值方差, 但是真实情况下很少能拿到总体数据, 大多数情况都是用抽样的方法对总体进行估计。对于例子中双样本t检验,并不是看两样本是否相互独立(样本均值是否差异显著),而是要估计两样本均值的总体分布是否有差异。比如,我们想知道学校男生女生身高是否有差异, 将所有男生女生进行测量分别求平均比较成本很高。因此各随机抽取男女生100名,测量身高, 然后通过这100对样本的假设检验来说明学校男女学生身高是否存在差异。
第二步:确定两样本均值抽样分布的统计量
现在已知样本的均值和标准差, 那怎么估计样本均值的抽样分布的统计量呢?
现在我们构造出了两样本均值抽样分布的统计量, 那么就可以用来进行假设检验了。
第三步:两样本均值抽样分布的假设检验
假设检验的零假设就是X1总体和X2总体的均值没有差异
则 X1-X2服从
t统计量为:-11.6/2.44131 = -4.752 服从自由度为8的t分布。
我们可以查找t分布表或者使用统计软件计算, 当统计量为 -4.752 时, 累积概率分布为 0.001,远小于显著性水平0.05,则拒绝零假设,接受备择假设:两样本均值抽样总体有显著差异。
根据显著性水平, 我们可以得到该水平下的上限为2.306004个标准差。 因此置信区间计算如下:
下限: -11.6 - 2.306004 * 2.44131 = -17.22967
上限: -11.6 + 2.306004 * 2.44131 = -5.97033
就这样, 我们将置信区间, 还有P值都计算出来了。有兴趣的朋友可以实践下单样本t检验,熟悉一下。
知识补充:
正态分布
正态分布(normal distribution)是数理统计中的一种重要的理论分布,是许多统计方法的理论基础。正态分布有两个参数,μ和σ,决定了正态分布的位置和形态。为了应用方便,常将一般的正态变量X通过u变换[(X-μ)/σ]转化成标准正态变量u,以使原来各种形态的正态分布都转换为μ=0,σ=1的标准正态分布(standard normal distribution),亦称u分布。
根据中心极限定理,通过上述的抽样模拟试验表明,在正态分布总体中以固定n,抽取若干个样本时,样本均数的分布仍服从正态分布,即N(μ,σ2/n)。所以,对样本均数的分布进行u变换,也可变换为标准正态分布N (0,1)
t分布
由于在实际工作中,往往σ是未知的,常用s作为σ的估计值,为了与u变换区别,称为t变换,统计量t 值的分布称为t分布。
假设X服从标准正态分布N(0,1),Y服从χ2(n)分布,那么Z=X/sqrt(Y/n)的分布称为自由度为n的t分布,记为 Z~t(n)。
置信区间、P值那点事相关推荐
- TTL值为什么有些事64有些事128和255
UNIX 及类 UNIX 操作系统 ICMP 回显应答的 TTL 字段值为 255 Compaq Tru64 5.0 ICMP 回显应答的 TTL 字段值为 64 微软 Windows NT/2K操作 ...
- python函数体中可以不写返回值语句_python让函数不返回结果的方法
1.简单介绍print和return的区别,print仅仅是打印在控制台,而return则是将return后面的部分作为返回值:作为函数的输出,可以用变量接走,继续使用该返回值做其它事. 2.函数需要 ...
- python 相关性检验怎么计算p值_不会Python进行时间序列预测?不要紧,大神来教你...
作者:Leandro Rabelo译者:李洁整理:Lemonbit本文内容较长,较为详细的阐述了进行时间序列预测的步骤,有些内容可能暂时用不到或者看不懂,但不要紧,知道有这么一个概念,后续碰到的时候, ...
- 统计相关系数r与r2的区别_什么是相关系数? 统计解释中的r值
统计相关系数r与r2的区别 Correlations are a great tool for learning about how one thing changes with another. A ...
- python 相关性检验怎么计算p值_收藏 | 大神教你用Python预测未来:一文看懂时间序列...
(由Python大本营付费下载自视觉中国) 作者 | Leandro Rabelo 译者 | 李洁 整理 | Lemonbit 出品 | Python数据之道 本文内容较长,较为详细的阐述了进行时间 ...
- 置信区间(已知样本均值和样本的方差,求总体均值的置信区间)(n 30)
当样本很小时 X¯¯¯\overline{X}服从T分布 T ~ t(v) 样本的数量为n时,v = n-1 T = (X¯¯¯\overline{X} - μ)/(s/n√\sqrt{n}) 与上篇 ...
- python中的返回值是什么意思_python中函数的返回值是什么
函数返回值简介 1.简单介绍print和return的区别,print仅仅是打印在控制台,而return则是将return后面的部分作为返回值:作为函数的输出,可以用变量接走,继续使用该返回值做其它事 ...
- 假设检验之p值(probability value)
假设检验与参数估计时统计推断的两个组成部分,它们都是利用样本对总体进行某种推断,但推断的角度不同. 参数估计是在总体参数未知的前提下,通过样本统计统计量估计参数的方法,得到总体参数的一个点估计或区间估 ...
- 站长在线Python精讲:Python中函数的返回值
欢迎你来到站长在线的站长学堂学习Python知识,本文学习的是<Python中函数的返回值>.本文的主要内容有:函数的返回值的含义.函数设置返回值的作用.return语句位置与多条 ret ...
- python:返回值
返回值 1.函数体:函数被调用时执行的代码(用于实现某些功能的代码),由一行或多行语句组成,一般以return语句结束 ⑴return语句是函数体的一部分 2.函数的作用一般是实现某种功能,在 ...
最新文章
- 《C#精彩实例教程》小组阅读07 -- C#字符与字符串
- JWT的使用及登录账号
- 美国商务部工业和安全局(BIS)发布《关于拟制定脑机接口技术出口管制规则的通知》...
- Linux Centos6.5 SVN服务器搭建 以及客户端安装
- 关于序列化的 10 几个问题,你顶得住不?
- Linux命令(10)——vim编辑器
- ubuntu下pip的安装、升级和使用
- 信息学奥赛C++语言:枪声问题
- postgresql 相关杂记
- 获取某一天前七天的数据(不包括某一天)
- 一步一步教你使用Jmail实现邮件的接收与发送
- spoolsv进程占用CPU近100%,电脑反应慢
- qt.qpa.plugin: Could not find the Qt platform plugin “xcb“ in ““ 详细解决办法
- 计算机管理打不开路径不存在,电脑打不开软件提示路径不正确如何解决
- ReportNG测试报告的定制修改
- Excel基础(14)条件格式与公式
- 攻击者可能会试图从item.taobao.com窃取您的信息 此服务器无法证明它是item.taobao.com;其安全证书来自*.tmall.com
- python 列表根据汉字拼音进行排序 / 查询结果集(列表嵌套字典)根据特定key字段拼音进行整体排序
- Erdaicms旅游网站程序微信和手机端分销系统正式上线发布啦
- 通信算法之149:EVM测量