引言

小伙伴们,今天我们要来聊聊置信区间和p值这两个看起来超级相关的概念。咱们先来说说置信区间,它是一种区间估计,相当于给你的样本数据画了一个“框框”,告诉你总体数据的真实值很可能在这个框框里。就好像你买了一个锅,看到商家说这锅有保修期为一年,那么你就知道这锅能用至少一年,但也有可能用到更长时间。置信区间就是统计学里的“保修期”,让你更准确地了解总体数据的真实情况。

然后是p值,它是假设检验的核心结果。简单来说,它是告诉你这个数据和你假设的结果是否匹配的东西。就像你约了个网友见面,结果发现长得和头像差远了,你就会开始怀疑这个人是不是骗子了。p值也是这个意思,当它小于一个预设的值(通常是0.05),就意味着你的数据和你的假设非常不匹配,很可能存在别的问题。

置信区间和p值之间有着千丝万缕的联系。有时候通过看置信区间的范围,我们也能得出和p值相同的结论。就像你买了一个牌子的衣服10来件,试了试发现比预期的都大了一号,那么你就可以推断这个品牌的衣服都偏大。置信区间也是这个道理,当它的范围很窄的时候,就说明数据很准确,也就意味着你的假设是可信的,与此同时p值也会非常小,这就说明数据和假设非常匹配,很难出现偏差。

单个样本与总体比较

统计学允许,我们通过猜测和验证的方式来探索事物的真相。而在猜想的世界里,我们经常需要进行一些“假设检验”的操作。

比如说,某个学校想要知道自己的初中女生平均身高是否和全市水平相同。这时候我们就需要假设一个值,比如说156.7cm,然后通过测量学校的30名女生身高来验证这个假设。

如果发现学校女生平均身高与全市水平相同,那么我们就可以高高兴兴地说“原来我们学校女生真的和市里的女生一样高啊!”,如果不同,那么我们就要面对“学校女生身高与市里不同”的残酷事实。

不过,别担心,我们还有一个非常重要的工具——置信区间,可以帮助我们更加准确地判断事物的真相。而计算置信区间的公式就是:“XXOOXXOO”。(这是我在开玩笑,实际上我知道计算置信区间的公式是:样本平均数±(t值×标准误))

计算出95%置信区间(144.25,168.67),观察到这个区间包括了一开始的假设值(μ),156.7cm。

在双向假设检验中,我们首先根据下面的公式计算统计量:

然后再将得到的t值与t分布比较,得到p值=0.83,没有统计差异。

通过交换分母项你可以发现这两个公式本质就是一回事。从统计的角度,解释了为什么我们可以用置信区间和假设检验得到同样的结论。(注意:这个等价关系只在双边检验(即判断“是否等于”)中存在,单边假设检验只能与不大常见的“单侧置信区间”做比较,此处不赘述。实际计算中,有时用正态分布Z值取代公式中的t值)

两个独立样本检验

在两个独立样本的比较检验中置信区间和有什么不同呢?

先看一个例子:

有个药物,判断服用药物是否会造成ALT水平变化。50位患者随机分配到实验组,另外50位患者接受安慰剂(对照组)。试验结束后,获得数据如下:

从图表可以看出,尽管实验组和对照组ALT的置信区间有重叠,假设检验的结果却是存在显著统计差异(p<0.05)。这是因为两个独立样本分析时,计算置信区间和假设检验数据的方法不再相同。简单来说,计算实验组和对照组各自的95%置信区间用的是各自的标准误,0.04,1.04这里就是把差值当样本计算置信区间,公式和上文单组分析一样:

于是假设检验时,用的是两组合并(pooled )的标准误,并且自由度也因两组合并而变大。因此,95%可信区间和p<0.05并不等价。仅仅看两组各自的置信区间,我们得出的结论却不一定和假设检验相同。

公式:

把t和标准t分布去比得到p。

在这个ALT的数据中,尽管p<0.05,从两组的差异来看,ALT水平的绝对差异并不是很大(∆=0.54),是否具有临床意义值得讨论。所以,仅仅因为p<0.05,就得出药物造成显著副作用的结论,未免有些操之过急。对于这样的结果,建议:同时报告p值和置信区间的结果,并且对可能造成结果不一致的原因(譬如绝对差异较小)进行讨论。在文献中读到这样的结果,也要保持警觉,看看结论是否片面。

总结

置信区间和p两者虽然非常常见,是统计依赖的科研(医学、心理学、社会学、经济学等虚头八脑的可惜)的基石,但也是被忽视的。

最后我用一个极端思维,概括两者不同:

一个抗高血压药物让100个病人每个人都降低了0.5个毫米汞柱的血压,在这个前后对照实验中,请问有显著治疗意义吗?脚趾头想想都知道,当然有,而且很显著!但是前后两个独立样本均值差别0.5正负tA/2个标准差/自由度,想想都是重合的!所以你得到截然相反的两个结论。

统计学基础:置信区间和p值知识相关推荐

  1. 800名科学家联名反对统计学意义,放弃P值“决定论”!

    大数据文摘出品 来源:Nature 编译:effy.籍缓 显著性这一概念是支撑统计学发展的大厦. 统计学课本中写到:没有统计显著性则不能'证明'零假设(关于两组之间无差或者两个实验组和对照组的假设). ...

  2. NumPy 快速入门系列:应用统计学基础概念、相关统计指标与NumPy的实现

    NumPy 快速入门系列:应用统计学基础概念.相关统计指标与NumPy的实现 前言: 统计学导论: 统计学定义: 统计学分类: 统计学基本概念: 统计过程: 统计指标与NumPy: 用 Python ...

  3. 统计学基础理论学习(1)

    统计学基础知识 统计学基础知识知识点包括: 1. 数据的集中趋势 在统计学中,集中趋势又叫中央趋势,表示一个机率分布的中间值. 常见的几种表示集中趋势的计量包括算数平均数,中位数及众数. 数值平均数: ...

  4. 数据分析与数据挖掘 - 05统计概率 一 统计学基础运算

    一 统计学基础运算 1 方差的计算 在统计学中为了观察数据的离散程度,我们需要用到标准差,方差等计算.我们现在拥有以下两组数据,代表着两组同学们的成绩,现在我们要研究哪一组同学的成绩更稳定一些.方差是 ...

  5. 统计学基础专栏02---数据和抽样分布

    统计学基础专栏02-数据和抽样分布 0.术语 0.2.数据和抽样分布 样本 大型数据集的一个子集 总体 一个大型数据集,或是一个构想的数据集 N(或n) 一般用N表示总体的规模,n表示样本的规模 随机 ...

  6. js基础--数据类型检测的相关知识

    欢迎访问我的个人博客:www.xiaolongwu.cn 前言 最近工作有点忙,好几天都没更新技术博客了. 周末起床打开有道云笔记,发现自己的博客todolist里躺了一堆只有名字的文件. 话不多说, ...

  7. 没有统计学基础可以学python-机器学习和Python怎样快速掌握?你一定需要这27张清单...

    原标题:机器学习和Python怎样快速掌握?你一定需要这27张清单 原文来源:unsupervised methods 作者:Robbie Allen 「机器人圈」编译:嗯~阿童木呀.多啦A亮 毫无疑 ...

  8. python开发需要掌握哪些知识-Python基础学习需要掌握哪些知识

    1.1Python的对象 python的内置对象类型有很多,包括数字,字符串,列表,集合,元组,字典等等,在Python中,一切皆对象 pickle腌制--在Python中,如果有一些对象需要持久性存 ...

  9. 在置信区间下置信值的计算_使用自举计算置信区间

    在置信区间下置信值的计算 嗨,大家好, (Hi everyone,) In this article, I will attempt to explain how we can find a conf ...

最新文章

  1. 第二课 --- git的(管理修改和撤销修改、删除文件)
  2. solr 分词过程基本介绍
  3. CF294C Shaass and Lights(排列组合)
  4. 数据绑定控件之DataList
  5. FileOutStream
  6. 第1-10个xhtml程序
  7. workbeach约束简称_AnsysWorkbenchFluidFlow(FLUENT)经典问题.docx
  8. Redis 如何处理已经过期的数据?
  9. eclipse查看git地址_在 IntelliJ IDEA 中使用 Git,太方便了
  10. 安卓打开第二个activity就崩溃_零基础安卓开发起步(三)
  11. 使用gdb调试运行时的程序小技巧 -转
  12. 基于LSTM的时间序列预测-原理-python代码详解
  13. 04_数字的处理方法(保留小数点两位、将数字转化为千分位格式)
  14. 形容计算机技术发展的词,形容技术发展的成语是什么_四字词语 - 成梦词典
  15. 麻烦大家给点C#的小程序的练习题做做,小女子谢谢了.......
  16. 【Java基础】· Java基本语法:程序流程控制习题总结
  17. netcore 动软三层架构-急速开发框架 winfrom demo
  18. ArcGIS JS之 4.23之IIS本地部署与问题解决
  19. HTTP、FTP状态码 (share)
  20. godaddy新建二级域名

热门文章

  1. Oracle 两字段连接
  2. 「更新方法」iOS16.4更新方法及固件下载
  3. Win7codecs解码包实现.avi等视频文件播放
  4. php代码审计第一阶段总结
  5. C#笔试题面试题锦集(全)总20篇
  6. 如何设置省略号对其序号 html,html 用css实现table中超长字符串省略号表示 - 天天好心情 - 博客园...
  7. 诺顿无法启动扫描处理办法
  8. CTA进网测试《5G消息 终端测试方法》标准依据:YDT 3958-2021
  9. 网址转化文二维码并识别
  10. python class 变量_python class 私有变量