UA MATH566 统计理论5 假设检验:p值

  • p-value

做实证研究的paper大多数都要汇报p值,并且几乎是只看p值的。2016年ASA做了一个关于p值的statement,指出了关于p值的六个错用与滥用:

Statement指出,p值表示统计数据与某个特定的统计模型之间兼容性的强弱,并不能衡量研究假说为真的概率。科学结论、政策评估不能偏信p值,合理的推断应该以试验结果的充分性与透明性为基础。p值或者说显著性更不能衡量某种效应的强弱或者某个结果的重要性,因此它并不是支撑研究假说的好论据。

下面是这个statement给出的合理的统计研究的一些特征:

Statement指出,合理的统计研究需要根据研究背景选择适当的模型、对原始数据做充分的可视化与描述性统计、正确使用统计模型、对模型结果做出合理的解释、保证试验结果具有可重复性。

这一讲介绍一下p值,帮助大家更好地理解statement的精神。

p-value

假设θ0\theta_0θ0​是真实的参数(也假设这个就是原假设),检验统计量T(X)T(X)T(X)(似然比检验那一篇会提到)的真实分布为FT(X)(t∣θ0)F_{T(X)}(t|\theta_0)FT(X)​(t∣θ0​),假设这个分布函数可逆。则p值等于
pvalue=1−FT(X)(T(X)∣θ0)pvalue = 1-F_{T(X)}(T(X)|\theta_0)pvalue=1−FT(X)​(T(X)∣θ0​)
做一般性分析的时候,T(X)T(X)T(X)是随机变量,因此p值本质上也是一个随机变量。假设u∈[0,1]u \in [0,1]u∈[0,1],计算
P(FT(X)(T(X)∣θ0)≤u∣θ0)=P(T(X)≤FT(X)−1(u∣θ0)∣θ0)=FT(X)(FT(X)−1(u∣θ0)∣θ0)=uP(F_{T(X)}(T(X)|\theta_0) \le u|\theta_0) = P(T(X) \le F_{T(X)}^{-1}(u|\theta_0)|\theta_0) \\ = F_{T(X)}(F_{T(X)}^{-1}(u|\theta_0)|\theta_0)=uP(FT(X)​(T(X)∣θ0​)≤u∣θ0​)=P(T(X)≤FT(X)−1​(u∣θ0​)∣θ0​)=FT(X)​(FT(X)−1​(u∣θ0​)∣θ0​)=u
也就是说FT(X)(T(X)∣θ0)F_{T(X)}(T(X)|\theta_0)FT(X)​(T(X)∣θ0​)服从均匀分布,所以p值也服从均匀分布。

假设显著性水平为α\alphaα,则备择假设下(简单点,假设为θ=θ1\theta=\theta_1θ=θ1​),拒绝域写成
C={X:T(X)≥kα}C=\{X:T(X) \ge k_{\alpha}\}C={X:T(X)≥kα​}
p值的分布为
P(1−FT(X)(T(X)∣θ0)≤α∣θ1)=P(FT(X)(T(X)∣θ0)≥1−α∣θ1)=P(FT(X)(T(X)∣θ0)≥FT(X)(kα∣θ0)∣θ1)=P(T(X)≥kα∣θ1)=1−β(α)P(1-F_{T(X)}(T(X)|\theta_0) \le \alpha |\theta_1) = P(F_{T(X)}(T(X)|\theta_0) \ge 1-\alpha|\theta_1) \\ =P(F_{T(X)}(T(X)|\theta_0) \ge F_{T(X)}(k_{\alpha}|\theta_0)|\theta_1) = P(T(X)\ge k_{\alpha}|\theta_1) = 1-\beta(\alpha)P(1−FT(X)​(T(X)∣θ0​)≤α∣θ1​)=P(FT(X)​(T(X)∣θ0​)≥1−α∣θ1​)=P(FT(X)​(T(X)∣θ0​)≥FT(X)​(kα​∣θ0​)∣θ1​)=P(T(X)≥kα​∣θ1​)=1−β(α)
正好是ROC。

结合这两部分推导,p值的本质是随机变量,在原假设下,p值服从均匀分布;在备择假设下,p值的分布就是ROC。一般报告出来的p值是对给出的统计量的值在原假设下计算出来的概率,这个概率的含义与用统计量和相应分位点比较的方法本质上是一回事,没有提供额外的信息。如果是能够在备择假设下计算p值反而会稍微有点帮助,因为这样能直接给出type II error的概率,但实际应用中这个概率应该是求不出来的。综上,p值的含义其实相当局限,我们要打破唯p值论!

UA MATH566 统计理论5 假设检验:p值相关推荐

  1. UA MATH566 统计理论5 假设检验简介

    UA MATH566 统计理论5 假设检验简介 Neyman-Pearson Lemma 一个例子 构造拒绝域 分析检验的势 ROC曲线 这一讲根据最简单的一类假设检验介绍假设检验的思想.假设θ0,θ ...

  2. UA MATH566 统计理论8 用Pivot构造置信区间

    UA MATH566 统计理论8 用Pivot构造置信区间 用Pivot构造置信区间 一般性方法 最优置信区间 置信区间的频率派解释 上一讲介绍的构造置信区间的方法是根据假设检验导出置信区间,但我们感 ...

  3. UA MATH566 统计理论7: Multiple Test

    UA MATH566 统计理论7: Multiple Test Bonferroni调整 Benjamini-Hochberg方法 Fisher方法 False Discovery Rate Mult ...

  4. UA MATH566 统计理论7 一个例子:推导T检验

    UA MATH566 统计理论7 一个例子:推导T检验 T检验在math 571A和math 571B中已经用的很多了,这里按前两讲介绍的假设检验的理论回顾一下T检验,看一下T检验是怎么用似然比检验的 ...

  5. UA MATH566 统计理论 用点估计构造置信区间

    UA MATH566 统计理论 用点估计构造置信区间 用点估计构造置信区间 置信区间(confidential interval,CI)也叫区间估计,是另一种做统计推断的方法,和假设检验密切相关.统计 ...

  6. UA MATH566 统计理论 截断数据

    UA MATH566 统计理论 截断数据 Truncated Left-Trancated Right-Truncated 一个例子:双截断正态分布 双截断正态分布的完备最小充分统计量 这一讲介绍随机 ...

  7. UA MATH566 统计理论1 充分统计量例题答案2

    UA MATH566 统计理论1 充分统计量例题答案2 例1.12 找N(θ,1)N(\theta,1)N(θ,1)的最小充分统计量 计算样本的联合密度 f(x∣θ)=∏i=1n12πexp⁡(−(x ...

  8. UA MATH566 统计理论4 贝叶斯统计基础1

    UA MATH566 统计理论4 贝叶斯统计基础1 贝叶斯公式 贝叶斯充分统计量 这一讲讨论贝叶斯统计的一些基础思想,会分成三个部分,第一部分讨论贝叶斯统计的设定:第二部分讨论贝叶斯统计的估计与假设检 ...

  9. UA MATH566 统计理论10 Bootstrap简介

    UA MATH566 统计理论10 Bootstrap简介 Bootstrap是用来替代基于CDF的一些统计计算的手段:当真实的CDF(记为F∈FF \in \mathbb{F}F∈F,F\mathb ...

最新文章

  1. ORM操作models一对多、多对多关系
  2. 自然语言处理ACL2020论文列表
  3. python中升序降序问题_飘逸的python - 有的升序有的降序的情况下怎么多条件排序...
  4. delete语句与reference约束冲突怎么解决_mysql update语句和原数据一样会更新么
  5. 【数据竞赛】盘点Kaggle中常见的AutoEDA工具库
  6. 【剑指offer】面试题31:栈的压入、弹出序列(Java)
  7. 在没有图片的情况下用css3实现一个圆形
  8. Python“制作”midi音乐“两只老虎”
  9. python selenium框架_python+selenium之框架设计
  10. 【转】用Setup Factory 7.0制作安装程序
  11. 【 地图系列 】 中国各省市县级 JSON 文件
  12. 广义线性混合模型GLMM
  13. 4.1.1认识计算机与程序,4.1.1-认识计算机与程序-课件.ppt
  14. 日天的终生大事(dp)
  15. 关于透明度混合blend
  16. 想问题思路总是不清晰,这个好用的脑图工具推荐给你
  17. Matlab使用中遇到的一些脑残问题。
  18. 利用“顺丰速运”下发GuLoader恶意软件的风险分析
  19. Python数据挖掘指南
  20. Laravel 上传文件大小改为200M

热门文章

  1. 线程本地存储器——Windows核心编程学习手札之二十一
  2. hive分区用2个字段有何限制_关于Hive使用动态分区插入数据详解
  3. uniapp时间戳转换
  4. 安装MySQL示例   docker pull mysql
  5. JAR软件转APK,在线转换器
  6. C++ leetcode 给你一个数组 nums 和一个值 val,你需要 原地 移除所有数值等于 val 的元素,并返回移除后数组的新长度。 不要使用额外的数组空间,你必须仅使用 O(1) 额外
  7. 《Android开发艺术探索》自定义View中关于“HorizontalScrollViewEx”的改进
  8. 4*4矩阵按键控制数码管显示0-F
  9. CTFshow 命令执行 web44
  10. 第10周项目实践 线索二叉树的建立及遍历