假设检验理论的创立者 Fisher 在假设检验中首先提出了 P 值的概念。他认为假设检验是一种程序,人们依照这一程序可以对某一总体参数形成一种判断。换句话说,他认为假设检验是数据分析的一种形式,是人们在研究中加入的主观信息。

P 值就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率

如果原假设为真,P 值是抽样分布中大于或小于样本统计量的概率。当左侧检验时,P 值为曲线上方小于检验统计量部分的面积;当右侧检验时,P 值为曲线上方大于检验统计量部分的面积。P 值被称为观察到的( 或实测的) 显著性水平。

通过 P 值,可以知道在 P < α 的情况下犯第一类错误的实际概率是多少。如果 P > α,那么原假设不被拒绝,在这种情况下,第一类错误并不会发生。P 值也可以说是拒绝原假设的最小显著性水平,或观察到的( 实例的) 显著性水平,或显著性概率。P 值表示对原假设的支持程度,是用于确定是否应该拒绝原假设的另一种方法。

举个例子:
就从打赌开始说起。
一日闲机无聊,我与楼主会饮于望胡楼。饮罢,两人都不想主动买单,于是我提议以置硬币来决定谁买单。
规则是这样的:有二十个一元硬币,谁的菊花朝上多,谁就算赢。
然后楼主先投,有十一个硬币菊花朝上。
他就得意洋洋的看我。
然后我一扔,有十九个硬币个个菊花朝天。

楼主角色由红转白,由白转黑。
拍案而起,大吼一声,你丫作弊,硬币有问题!
我笑而不语问楼主:凭什么说硬币有问题?

难道二十个硬币中十九个硬币菊花朝上就根本不可能么?显然理论上是可能的,但是楼主依旧会认为我在作弊,实际上,任何人见到这个的场景都会怀疑背后有猫腻。

因为楼主或其他任何人都知道:假如这场打赌是公平的话,那么每一个硬币的两面都有相等的概率向上,所以每个硬币菊花朝上的概率都是1/2也就是0.5,那么十九个菊花朝上的概率是20/1048576,约等于0.00002。

这种概率太小了,楼主认为在假如我没有在硬币上做手脚以让结果有利于我的话是不可能发生这种情况的。

我立刻反驳说,你这是嫉妒我,那我要扔出二十个菊花朝上你还不是要说我也在作弊?

楼主说,没错,我既然认为你扔出十九个菊花朝上是在作弊,那二十个菊花朝上当然也是因为你对硬币动了手脚!

让我们用统计学的语言概括一下。

H0:我没有对硬币动手脚。
H1:我对硬币动了手脚,以让结果偏向于我。

(这里面的H0称之为检验假设,意思是说你要检验的这个假设,H1称之为备择假设。他们两的关系是不能兼容的。这两者只能且必须拒绝一个。假如拒绝H0的话,那么就不能拒绝H1了。)

于是我们做了一个实验(赌博)。

结果出现了十九个硬币菊花朝上的情况。假如赌博是公平的,那么出现这种情况的概率是20/1048576。而比这种情况更加极端的二十个硬币统统朝上的概率是1/1048576,这种概率更加低。

假如我们认为十九个硬币朝上是个小概率事件的话,那么比它更极端的二十个硬币朝上是一个更加极端的更小概率事件。

这两者的和是21/1048576。

于是楼主认为在这么一次实验(赌博)当中出现这么个小概率事件或者比它更极端的事件是不肯能的。

于是只能拒绝H0,于是不能拒绝H1。

也就是说我对硬币动了手脚,以让结果偏向于我。

以上就是假设检验的基本思想,里面涉及到了楼主的一个问题,什么是p值?

这里的p值等于21/1048576,p值就是假如赌博是公平的,那么出现这种情况和比这种情况更极端的概率值。

翻译成干巴巴的语言就是在H0成立的条件下,出现该实验结果或更极端情况的概率值。

显著性水平:拒绝零假设时候P值阈值。

虽然 p值不等价于原假设成立的概率,但可以看成判断原假设命题成立与否的一个客观指标。我们建议把 p 值翻译成“庇值”,意思是对原假设的庇护或者保护之意,读音也没有太大改变。另一个原因是因为在很多假设检验问题中的原假设往往是一个不会被轻易否定的命题,也有庇护和保护之意。所以“庇值”也能反映这层意思。

假设检验
假设检验(hypothesis testing),又称统计假设检验,是用来判断样本与样本、样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。
显著性检验
显著性检验是假设检验中最常用的一种方法,其基本原理是先对总体的特征做出某种假设,然后通过抽样样本的分析,对此假设应该被拒绝还是接受做出推断。常用的假设检验方法有t检验、卡方检验、F检验等。
检验的原理
基本思想是小概率事件,即小概率事件在一次试验中是几乎不发生的,但概率小到什么程度才能算作“小概率事件”,一般认为概率P在0.05以内就算小概率事件,所以通常算出来的P值都和0.05比较。
检验的步骤
1、提出原假设和备择假设。
原假设:是数理统计的专用术语,也叫无效假设,认为样本之间没有差异(或者说样本之间的差异是抽样误差引起的),原假设就必须认为没差异,没有为啥。
备择假设:就是原假设的对立面,认为样本之间有本质的差异。
说明:到底什么叫本质的差异?或者说到底什么叫没有差异?是样本一模一样吗?当然不是,也不可能。几个例子,高三1班和高三2班每个班50个人,组织了一场数学考试,那么每个班数学考试都会有50个人的成绩,那作为数学老师怎么判断这两个班的学生有没有差异呢(有差异的意思就是1班的能力就是比2班强,反之也可,都叫有本质的差异)?最简单的办法是判断平均值,但是太low了,平均值并不能够说明什么实质问题,在这里可以用方差分析。
2、选取适当的统计方法,计算对应的统计量,这里的统计方法有t检验、卡方检验、F检验等等。
3、求得P值(其实就是原假设发生的概率),确定结论
若P≤α(置信度,就是上述说的0.05),就拒绝原假设,意思就是样本之间没差异的概率小于5%,那就认为是小概率事件,因为小概率事件基本不发生(比如我买一次彩排就中奖了,我刚买一次,就中奖了,那说明中奖就不是小概率事件。同理样本之间没差异是小概率事件,我不可能这次样本就无差异),所以拒绝原假设,认为样本之间有显著性差异。
总之结论就是:P≤α,有差异;P>α,无差异。

例题:

统计检验P值代表什么及统计显著性检验方法原理相关推荐

  1. R语言检验相关性系数的显著性:使用cor.test函数计算相关性系数的值和置信区间及其统计显著性(如果变量来自正态分布总体使用皮尔森方法pearson)

    R语言检验相关性系数的显著性:使用cor.test函数计算相关性系数的值和置信区间及其统计显著性(如果变量来自正态分布总体使用皮尔森方法pearson) 目录

  2. fft函数图像横坐标是什么_频谱图中横坐标为频率,纵坐标的幅值代表什么

    展开全部 纵坐标的幅值代表信号的e69da5e6ba9062616964757a686964616f31333431353932振幅强度,单位为分贝(dB),采用线性分度. 在实际使用中,频谱图有三种 ...

  3. 中值滤波与高斯滤波的原理和应用场合

    中值滤波属于非线性滤波的一种,高斯滤波属于线性滤波的一种.在Opencv中有高斯滤波的函数,但是中值滤波需要通过排序实现. 一.中值滤波 原理:中值滤波使用一个围绕当前像素的矩形,查找区域内像素的中值 ...

  4. Shell脚本中$0、$?、$!、$$、$*、$#、$@等的意义以及linux命令执行返回值代表意义

    Shell脚本中$0.$?.$!.$$.$*.$#.$@等的意义以及linux命令执行返回值意义 (1) Shell脚本中$0.$?.$!.$$.$*.$#.$@等的意义说明 1.1.简要说明 ps: ...

  5. lab值意义_色差仪上的字母Lab值代表什么意思

    L表示黑白,也有说亮暗,+表示偏白,-表示偏暗 A表示红绿,+表示偏红,-表示偏绿 B表示黄蓝,+表示偏黄,-表示偏蓝 在使用色差仪的过程中我们分析最多就是Lab值,色差和Lab是密切相关的,所以了解 ...

  6. python 线性回归 统计检验 p值_SPSS 25 数学统计分析工具

    SPSS 25 是一个集成的系列产品,解决了整个分析过程,从策划到数据收集,分析,报告和部署.随着十几完全集成的模块可供选择,你可以找到你需要的专业能力,以增加收入,超越竞争对手,进行研究,并做出更好 ...

  7. 微软Azure storage account的path值代表什么含义

    通过@BlobOutput annotation属性path指定的值: flags/{tenantId}/{storeId}/customer_behavior_{environmentId}.jso ...

  8. snprintf的返回值代表字节数 != 实际写入字节数

    #include <stdio.h> int main(void) {char buf[4];int cnt=0;cnt = snprintf(buf, sizeof(buf), &quo ...

  9. 服务器Ping值代表着什么?

    如果在你浏览网页时发现网络比较卡慢甚至连不上网的情况,这时候我们可以先用ping来感知测试下网络情况.首先按win键打开开始菜单,在搜索框中输入"cmd"点击回车.在弹出的dos窗 ...

  10. java nio socketChannel read返回值代表的意思

    当socketChannel为阻塞方式时(默认就是阻塞方式)read函数,不会返回0,阻塞方式的socketChannel,若没有数据可读,或者缓冲区满了,就会阻塞,直到满足读的条件,所以一般阻塞方式 ...

最新文章

  1. juniper M320路由器基本配置
  2. HttpClient使用方法(包括POST文件)
  3. LeetCode -- 3Sum
  4. centos7安装docker安装rabbitmq(2021)亲测有效!!!
  5. 支持中文的算法可视化网站,你想要的算法这都有
  6. bochs上网镜像怎么上网_【干货科普】上网慢!经常掉线!怎么办?
  7. python post请求实例_Python使用requests发送POST请求实例代码
  8. java实现人字拼,人字拼地板拼法大全
  9. 男人最佳的生育年限,程序猿们,看看吧!!!
  10. Debian 7 Gitlab `GLIBC_2.14 not found`
  11. jsp下Kindeditor环境搭建
  12. ad19做直插封装 ipc_共享一下自己的PCB封装库(Altium Designer)
  13. 科密a1无法连接数据库_科密考勤机系统老说数据库连接失败是什么原因?
  14. mysql 嵌入式linux版本_PHP专栏 : MySQL 数据库安装详细
  15. Tensorflow入门(一)----”搭建图像识别系统“教程整理
  16. 【Python学习向】 图片去水印
  17. 百分比计算机公式,百分比的计算公式怎么算的(免费教你计算百分比)
  18. 设计模式【2.1】-- 简单工厂模式怎么演变成工厂方法模式?
  19. OpenStack | Placement组件
  20. 第3课 把文件存入Git文档库

热门文章

  1. “大数据杀熟”背后的算法在为谁服务?
  2. C++ struct内部定义函数
  3. php 条件求和,Excel条件求和公式是什么
  4. Mybiosource丨Mybiosource玻连蛋白 (VTN),ELISA 试剂盒原理
  5. Revit 2019注册机
  6. Axure 9软件功能区域、界面介绍
  7. python scipy 密度函数 分位数 累计函数计算p值 卡方检验 t检验 F检验 假设检验 AB实验 显著性检验
  8. 解决网页上内容不能复制的几种方法
  9. c++ atuo_ptr 的实现原理
  10. 科大讯飞语音合成WebApi