文章目录

  • 假设检验和P值那些事
    • 假设检验
    • P值
    • R中的实践
    • 参考文献

假设检验和P值那些事

记得大学时候学习概率论与数理统计的时候,学习过假设检验,但我不记得课本上有提到过P值。后来翻阅了一些资料,大概弄明白了它们之间的关系,本文旨在以浅显易懂的语言描述严密的数学知识。

假设检验

在《Head First Statistics》一书中,作者给假设检验的定义是“Hypothesis tests give you a way of using samples to test whether or not statistical claims are likely to be true”。其实定义不重要,重要的是我们需要知道假设检验能做什么:以概率统计的视角判别一个统计假说是否成立。

下面举一个烂大街的例子:我有一枚专门用于玩抛硬币猜正反面的游戏的硬币,我需要判断这枚硬币是否是正常的(抛硬币游戏中出现正反面的概率相等)。所以我做了一个假说:该枚硬币是正常的,即抛硬币游戏中出现正面的概率为0.5。

那我现在需要做实验去验证我说的对不对。我抛了20次,正面朝上11次,背面朝上9次(设正面朝上记为1,反面朝上记为0)。基于这个实验结果,我应该做怎样的判断呢?

根据假设检验的一般步骤:

  1. 建立假设

  2. 寻找检验统计量

  3. 确定显著性水平和拒绝域

  4. 做出判断

第一步中我们的原假设H0H_0H0​(null hypothesis)为该枚硬币是正常的,备择假设H1H_1H1​(alternate hypothesis)为该硬币不正常。

注:当原假设正确,而由于样本的随机性使得样本观测值落在拒绝域(critical region或rejection region)而拒绝原假设产生的错误称为第一类错误;当原假设错误,而样本观测值落在接受域而接受原假设产生的错误称为第二类错误。

第二步中根据中心极限定理可知随机变量Xˉ\bar{X}Xˉ服从正态分布。这里我们的检验统计量选择t=Xˉ−μ0S/nt=\frac{\bar{X}-\mu_0}{S/\sqrt{n}}t=S/n​Xˉ−μ0​​(这里的ttt服从自由度为n−1n-1n−1的ttt分布),所以我们使用ttt分布来估计投掷的均值(这里Xˉ\bar{X}Xˉ为样本均值,μ0\mu_0μ0​为原假设中的均值(期望),SSS为样本标准差,nnn为样本个数)。

t=Xˉ−μ0S/n=0.55−0.50.5104178/20=0.4380858t=\frac{\bar{X}-\mu_0}{S/\sqrt{n}} = \frac{0.55 - 0.5}{0.5104178 / \sqrt{20}} = 0.4380858t=S/n​Xˉ−μ0​​=0.5104178/20​0.55−0.5​=0.4380858

注:ttt分布用于根据小样本来估计呈正态分布且方差未知的总体的均值,称为ttt检验。如果总体方差已知(例如在样本数量足够多时),则应该用正态分布来估计总体均值,称为UUU检验。

第三步中显著性水平α\alphaα(significance level,拒绝原假设时概率阈值)我们一般采用0.05(当然,你也可以使用0.1或者其它)。这个0.05的意思是观测值落在拒绝域的概率为0.05,概率为0.05说明这是小概率事件,而在一次测试中发生了小概率事件,所以我们有足够的理由拒绝原假设。

接下来我们应该计算拒绝域了。对于ttt分布求0.025和0.975的分位数分别为-2.093024和2.093024(即ttt的上下界,左右两边各是0.025,合起来就是0.05的拒绝域),我们可以反推出Xˉ\bar{X}Xˉ的上下界为0.3111171和0.7888829(这个区间就是接受域)。

注:对于拒绝域来说,有单边和双边情况,我们这里显然是双边的情况。

第四步做出判断,我们实验的结果的均值是0.4380858,我们在0.05的显著性水平下得到的接受域是(0.3111171,0.7888829)(0.3111171, 0.7888829)(0.3111171,0.7888829),实验结果落在接受域,所以我们不能拒绝原假设H0H_0H0​。这里的不能拒绝指的是我们没有足够的理由推翻原假设,但是这并不代表原假设一定正确。

P值

上面讲了检验假设的一般过程,好像跟P值没什么关系?但是P值其实和检验假设息息相关的。上面的求解过程是通过判断样本观测值是否落在拒绝域而做出判断的,其实我们还可以通过计算P值直接进行判断。

那么什么是PPP值呢?《Head First Statistics》给出的定义是“A p-value is the probability of getting the results in the sample, or something more extreme, in the direction of the critical region.”。我的理解就是P值是在原假设成立的情况下,出现比当前样本观测值更极端(包括当前样本观测值)情况的概率。

其实这样说还是挺抽象的,我们通过计算来进行说明。

我们把检验假设步骤中的第三步修改为:确定显著性水平和计算P值

在我们的实验中t=Xˉ−μ0S/n=0.55−0.50.5104178/20=0.4380858t=\frac{\bar{X}-\mu_0}{S/\sqrt{n}} = \frac{0.55 - 0.5}{0.5104178 / \sqrt{20}} = 0.4380858t=S/n​Xˉ−μ0​​=0.5104178/20​0.55−0.5​=0.4380858

然后我们通过查表可以得到0.4380858对应的上侧分位数为 0.3331321(和-0.4380858对应的下侧分位数相同),因为我们的实验中是双边情况,所以P=0.4380858×2=0.6662642>0.05P = 0.4380858\times2 = 0.6662642 \gt 0.05P=0.4380858×2=0.6662642>0.05

在确定了显著性水平α\alphaα的情况下(α=0.05\alpha=0.05α=0.05),如果计算出的P≤0.05P\le0.05P≤0.05,说明观察值不合理,也就是样本均值离假设均值太远了,因此拒绝原假如果计算计算出的P>0.05P\gt0.05P>0.05,则我们不能拒绝原假设。

注:设连续型随机变量XXX的分布函数为F(x)F(x)F(x),密度函数为f(x)f(x)f(x),对于任意α(0&lt;α&lt;1)\alpha (0\lt\alpha\lt1)α(0<α<1),假如xαx_\alphaxα​满足条件

F(xα)=∫−∞xαf(x)dx=αF(x_\alpha) = \int_{-\infty}^{x_\alpha} f(x) dx = \alphaF(xα​)=∫−∞xα​​f(x)dx=α

则xαx_\alphaxα​称为XXX分布的α\alphaα分位数,或称为α\alphaα下侧分位数。假如xα′x^{\prime}_\alphaxα′​满足

1−F(xα′)=∫−∞xαf(x)dx=α1 - F(x^{\prime}_\alpha) = \int_{-\infty}^{x_\alpha} f(x) dx = \alpha1−F(xα′​)=∫−∞xα​​f(x)dx=α

则xα′x^{\prime}_\alphaxα′​称为XXX分布的α\alphaα分位数。

通俗地理解分位数就是对应某个概率面积的横坐标,如果是左侧面积(概率)叫下侧分位数,如果是右侧面积(概率)叫上侧分位数。

R中的实践

好的,下面我们来看如何在R中重复上面的实验:

产生一个随机的模拟序列(二项分布,生成0和1)

flips <- rbinom(20, 1, 0.4)

结果如下:1 0 1 0 1 1 1 0 1 0 1 0 0 0 0 1 1 0 1 1

使用R内置的ttt检验函数如下:

t.test (flips, mu=0.5)

输出结果如下:

 One Sample t-testdata:  flips
t = 0.43809, df = 19, p-value = 0.6663
alternative hypothesis: true mean is not equal to 0.5
95 percent confidence interval:0.3111171 0.7888829
sample estimates:
mean of x 0.55

如果需要我们手动计算上面这些值,我们是否可以计算出来呢?计算的过程就是上面讲解假设减压和P值的过程。

首先ttt值的计算很简单,使用公式t=Xˉ−μ0S/nt=\frac{\bar{X}-\mu_0}{S/\sqrt{n}}t=S/n​Xˉ−μ0​​即可,代码如下,结果为0.4380858

(mean(flips) - 0.5) / (sd(flips) / sqrt(length(flips)))

dfdfdf指代的是自由度n−1=20−1=19n-1=20-1=19n−1=20−1=19

接下来我们计算P值,通过计算-0.4380858的下侧分位数再乘以2可得,代码如下,结果为0.6662642

pt(-0.4380858, 19) * 2

在来看我们的置信区间,其实这里就是我们所要求的接受域

左侧计算代码:qt(0.025, 19) * (sd(flips) / sqrt(20)) + 0.55 结果为:0.3111171

右侧计算代码:qt(0.975, 19) * (sd(flips) / sqrt(20)) + 0.55 结果为:0.7888829

参考文献

[1] 茆诗松. 概率论与数理统计 (第二版)[M]. 2000.

[2] Griffiths D. Head first statistics[M]. Oreilly Vlg Gmbh & Co, 2009.

假设检验和P值那些事相关推荐

  1. 数据分析-------统计学-------假设检验和p值、单侧检验、双侧检验、z统计量、t统计量、第一类错误、第二类错误

    具体可看https://zhuanlan.zhihu.com/p/86178674 例:神经学家测试一种药物对反应时间的效果,分别对100只老鼠注射一单位剂量的药物,对其进行神经刺激,然后记录反应时间 ...

  2. R语言使用epiDisplay包的shapiro.qqnorm函数执行Shapiro-Wilk检验并可视化QQ图、整合假设检验和可视化结果判断数据是否符合正态分布(图中包含假设检验的p值)

    R语言使用epiDisplay包的shapiro.qqnorm函数执行Shapiro-Wilk检验并可视化QQ图.整合假设检验和可视化结果判断数据是否符合正态分布(图中包含假设检验的p值) 目录

  3. t检验中的t值和p值是什么关系_t检验和p值的关系

    t检验中的t值和p值是什么关系_t检验和p值的关系 t检验中通过样本均值 总体均值 样本标准差 样本量 可以计算出一个t值,这个t值和p值有什么关系? 根据界值表又会查出一个数,这个数和t值比较,得出 ...

  4. R语言使用epiDisplay包shapiro.qqnorm函数执行Shapiro-Wilk检验并可视化QQ图、整合假设检验和可视化结果判断数据是否符合正态分布、pch参数在可视化图中显示数据点标签

    R语言使用epiDisplay包的shapiro.qqnorm函数执行Shapiro-Wilk检验并可视化QQ图.整合假设检验和可视化结果判断数据是否符合正态分布.配置pch参数在可视化图中显示数据点 ...

  5. 简单理解:第一类错误,第二类错误,统计显著性,空假设和P值

    目录 第一类错误(Type I error) 第二类错误(Type II error) 统计显著性( Statistical significance) 空假设H0(Null hypothesis) ...

  6. 哈佛大学——差异表达分析(八)假设检验和多重检验校正

    文章目录 学习目标 DESeq2:模型拟合和假设检验 广义线性模型(Generalized Linear Model) 假设检验 Wald 检验 似然比检验(Likelihood ratio test ...

  7. RNA-seq 详细教程:假设检验和多重检验(8)

    学习目标 了解模型拟合的过程 比较两种假设检验方法(Wald test vs. LRT) 了解多重测试校正的重要性 了解用于多重测试校正的不同方法 1. 模型拟合和假设检验 DESeq2 工作流程的最 ...

  8. 在统计学中_我来尝试给你讲清统计学中的假设检验和两类错误

    学习过统计的同学一定对"两类错误"不会陌生,但是否已经完全理清了其中的逻辑,想必要打一个问号了.希望我今天能"不辱使命",用你听得懂的语言给你讲清楚这整套内容. ...

  9. 特征工程(二) :文本数据的展开、过滤和分块

    如果让你来设计一个算法来分析以下段落,你会怎么做? Emma knocked on the door. No answer. She knocked again and waited. There w ...

最新文章

  1. python批量改名_Python写个批量改名工具
  2. Android提醒:Dialog,Toast,Snackbar
  3. nginx的常规配置
  4. C++远征之封装篇——类和封装、实例化和对象成员访问
  5. webpack4打包工具
  6. xilinx芯片管脚使用限制_【转载】 Xilinx FPGA配置的一些细节
  7. 拉格朗日中值定理ξ怎么求_微分学核心定理——中值定理
  8. python实现的个人税后工资计算器
  9. type python django models_django新版本(2.x)踩坑记录
  10. 数学建模常用的四大模型
  11. CSS的样式与优先级
  12. 如何把wav转换为mp3?
  13. centos添加桌面快捷方式
  14. 曾鹏锦老师:具备这5种能力人生之路越来越好走越走越宽
  15. 用java实现判断回文
  16. 关于华为的高薪和华为的加班
  17. Unity_物体旋转方法归纳
  18. 【蓝桥】 历届试题 分考场(DFS,回溯,剪枝,无向图染色问题)
  19. 浅谈数据分析、大数据分析和大数据开发的区别
  20. 利用map和reduce编写一个str2float函数,把字符串'123.456'转换成浮点数123.456:

热门文章

  1. css去掉滚动条,修改滚动条样式
  2. 运行SSD-TensorFlow报错:tensorflow.python.framework.errors_impl.NotFoundError:
  3. 华为南研所校招软件技术岗几点建议
  4. 如何截取视频中的一部分制作成GIF动态图
  5. d1,d2,d3 error
  6. iptv登录系统 无法连接服务器,电信宽带电视连接到83%接入平台进不去什么情况-网络电视接入平台失败...
  7. Java——动态创建一维数组和二维数组
  8. MFC 的CList,CPtrList,CObList,CStringList 的用法之CList
  9. 粒子群算法(PSO)优化最小二乘支持向量机回归预测,PSO-LSSVM回归预测,多输入单输出模型。
  10. LRUCache的C++实现