从事心理咨询的同学转发了一片有关喝茶的文章(详见:http://www.zjfj66.com/article/qinggan/14379314.html).

文中作者为了检验自己能否品出不同年份的普洱茶,做了严格的测试,原文如下:

**************************

我把不同年代的生普掰下一块,一字摆开,泡了测试它们的味道到底有什么不同。我经历了反复多次试验,双盲的对照的,其设计和执行的严格程度完全参考美国FDA的条款,最后的实验结果很沮丧地表明,十年以内的茶的味道的差别,我无法可靠地进行分辨。

**************************

然后又引述了统计学界的一个公案:Fisher测试某位女士是否能分辨出先放茶再加奶和先放奶再冲茶的味道是否不同。这个测试就是后来著名的Fisher精确检验。

作为一个数据分析伪从业人员,我对Fisher精确检验很感兴趣, 但一开始就被2*2的实验结果列联表搞蒙了,看不明白这个表格含义所在,为何要弄出这么一个表格来。于是就搜索了Fisher精确检验的详细资料,翻阅资料后把自己的理解用非专业的词汇总结一下。

Fisher精确检验原理描述:

假设检验用来检验一次随机实验的结果是否支持对于某个随机实验的假设。具体如下:随机事件发生的概率小于0.05则认定该事件为小概率事件。一般原则认为在某个假设前提下,一次随机实验的结果不会出现小概率事件。若一次随机实验的结果出现了小概率事件则认定该假设不被支持。

1. 理论依据是:超几何分布(无放回产品抽样实验):非卡方检验的范畴。超几何分布的一个形象例子是:有N件物品,M件为次品,求取n件,其中有k件为次品的概率。=(M,k)*(N-M,n-k)/(N,n)

2. 基本思想是:在2*2列联表中,四格表周边和(即边际分布)计数固定不变的条件下,计算表内4个实际频数变动时的各种组合之概率Pi;而这个具体的实例可以分解出8个类似产品抽样实验的具体实例结果。根据给出的数据可以计算出每个抽样结果基于假设的超几何分布概率。根据其中之一抽样结果的概率,通过假设检验的原则即可推定假设是否成立。

注:以上两条来源:http://blog.sina.com.cn/s/blog_6b1c9ed50101kh2f.html

超几何分布是统计学上一种离散概率分布。它描述了由有限个物件中抽出n个物件,成功抽出指定种类的物件的次数(不归还)。称为超几何分布,是因为其形式与“超几何函数”的级数展式的系数有关。

例如 判断节食与性别是否相关:

男        女

节食          a         b

不节食         c         d

四格表周边和(即边际分布)计数固定不变的条件下(男性总数固定(a+c),女性总数不变(b+d),节食总人数不变(a+c),不节食总人数不变(c+d)),可以分解出下列超几何分布抽样:

1. 一共 (a+b+c+d)人,其中男性(a+c)人, 节食有(a+b)人,则其中节食男性为a人的概率;

2. 一共 (a+b+c+d)人,其中男性(a+c)人, 不节食有(c+d)人,则其中不节食男性为c人的概率;

3. 一共 (a+b+c+d)人,其中女性(b+d)人, 节食有(a+b)人,则其中节食女性为b人的概率;

4. 一共 (a+b+c+d)人,其中女性(b+d)人, 不节食有(c+d)人,则其中不节食女性为d人的概率;

5. 一共 (a+b+c+d)人,其中节食(a+b)人, 男性(a+c)人,则其中节食男性为a人的概率;

6. 一共 (a+b+c+d)人,其中节食(a+b)人, 女性(b+d)人,则其中节食女性为b人的概率;

7. 一共 (a+b+c+d) 人,其中不节食(c+d)人, 男性(a+c)人,则其中不节食男性为c人的概率;

8. 一共 (a+b+c+d)人,其中不节食(c+d)人, 女性(b+d)人,则其中不节食女性为d人的概率;

Fisher精确检验是统计显著性检验方法,用于检查两个二进制变量的相关性。所谓二进制变量就是变量的值域只有两个值,例如:性别为男或女;在特定场景下规定变量只有两个可用值,如:规定出行方式为火车或飞机,收入为高或低等。

Fisher精确检验的例子:

1.   两个候选人的得票是否和投票人性别相关。

2.   性别和是否节食是否相关。

3.   收入高低是否和出行方式(火车/飞机)相关。

Fisher精确检验适用于样本量n<40或者理论频数T<1的情况。

其中n为2*2列联表的实际发生的总频数(a+b+c+d),理论频数T是指如果原假设成立则每个格子中理论上应该出现的频数。

对于上述2*2列联表而言:a,b,c,d是实际测试的各个格子实际发生的频数,n为2*2列联表的实际发生的总频数(a+b+c+d)

理论频数是指总体的频数,可以根据检验假设的样本数据推断出近似值。 具体方法是,假设原假设成立,两组样本数据差别仅是由抽样误差所致,则两组样本数据的并集的男性所占比率可以作为总体数据中男性所占比率,即理论频率,如下例:

男        女

节食&不节食          a+c     b+d       ----- 男性所占比率:P=(a+c)/n

则 总体理论上男的所占频率(比率)可以用 P 来近似表示。因为原假设成立节食与否与男女性别无关,因此在节食的人中男性比率也应该是P。以此为依据便可推算出四格表中相应的四格的理论数。对于a格的理论频数 (a+b)*P = (a+b)*(a+c)/n,即所在行的频数之和*所在列的频数之和/总频数。

Fisher精确检验的通俗理解相关推荐

  1. R 两组样本t检验 wilcoxon检验、卡方、fisher精确检验

    一般统计方法R实现 文章目录 一.读入数据 二.连续性变量 1.正态性和方差齐性检验 2.描述统计量 3.独立样本t检验和wilcoxon秩和检验 三.四格表卡方或fisher精确检验(OR[95%C ...

  2. 方差分析/卡方/fisher精确检验

    方差分析 前提条件: 1.各样本须是相互独立的随机样本; 2.各样本来自正态分布总体; 3.各总体方差相等,即方差齐.(方差不齐,用非参数检验) 适用数据情况: 分类变量的连续变量 例如: 卡方检验 ...

  3. Fisher精确检验.医学统计实例详解-医学统计助手★卡方检验,t检验,F检验,秩和检验,方差分析

    Fisher精确检验是一种在统计分析中经常使用的方法,旨在评估两个分类变量之间是否存在显著关系.这种方法由罗纳德·A·费舍尔(Ronald A. Fisher)于20世纪20年代提出,并被广泛应用于小 ...

  4. 7. R语言【独立性检验】:卡方独立性检验、Fisher精确检验 、Cochran-Mantel-Haenszel检验

    文章目录 1. 卡方检验 2. 费希尔精确检验(Fisher Exact Test) 3. Cochran-Mantel-Haenszel检验 独立性检验:用来判断变量之间相关性的方法,如果两个变量彼 ...

  5. 通俗理解T检验与F检验的区别【转】

    转自:http://blog.sina.com.cn/s/blog_4ee13c2c01016div.html 1,T检验和F检验的由来 一般而言,为了确定从样本(sample)统计结果推论至总体时所 ...

  6. T检验与F检验的区别(通俗理解)

    转载自: 一抹新绿的博客(新浪) http://blog.sina.com.cn/s/blog_4ee13c2c01016div.html 1,T检验和F检验的由来 一般而言,为了确定从样本(samp ...

  7. R语言检验独立性:卡方检验(Chi-square test)和费舍尔精确检验分析案例报告

    统计测试最常见的领域之一是测试列联表中的独立性.在这篇文章中,我将展示如何计算列联表,我将在列联表中引入两个流行的测试:卡方检验和Fisher精确检验. 什么是列联表? 列联表提供关于两个分类变量的测 ...

  8. Fisher's exact test( 费希尔精确检验)

    Fisher's exact test[1][2][3] is a statistical significance test used in the analysis ofcontingency t ...

  9. 通俗理解卡尔曼滤波(无人驾驶感知融合的经典算法)

    前言 我个人有近10年AI教育经验了,中间获得过一些名号,比如北理工校外导师,微软MVP兼CSDN技术专家,本博客也有1700多万PV了,在AI圈内有极高知名度.后2015年和团队一块创业创办AI职教 ...

  10. 通俗理解数学符号 “∫”,“d“,“e”

    积分符号 "∫" 的由来. 通俗理解微分符号d. 通俗解读自然数e. 积分符号 "∫" 的由来 积分符号"∫" 的由来可以追溯到17世纪的德 ...

最新文章

  1. Linux下的ATT语法(即GNU as 汇编语法)入门
  2. 判断输入是否为中文的函数
  3. java 多态判断非空_跳槽涨薪季面试题之java基础(一)
  4. shell 打印追加_[转]shell 数组定义、使用和追加
  5. mysql约束sex_MySQL笔记--约束
  6. 策略模式学习三---总结
  7. Python之类的继承
  8. php并发取源码,PHP读取大文件源码示例-Swoole多进程读取大文件
  9. 面试题22. 链表中倒数第k个节点
  10. [转]如何使用BackTrack破解WIFI无线网络的WEP密钥
  11. Matlab系列教程_数值计算_最值、平均值、中值
  12. SQL数据库的创建及其详细操作(作业)
  13. matlab的otdr仿真,otdr测试曲线生成软件-OTDR测试曲线图仿真软件TrcView 4.0 官方免费版 - 河东下载站...
  14. cad上样条曲线上的点太多了_CAD样条曲线如何转换成多段线?看完这篇文章你就懂了...
  15. 飞行的小鸟(Flybird)C语言小游戏C++简单小程序超简单
  16. git pull --rebase的作用是什么,它与git pull有什么区别?
  17. java Bean拷贝忽略空属性
  18. 2022张宇考研基础30讲 第十三讲 常微分方程
  19. matlab生成特定矩阵
  20. 2020-09-04

热门文章

  1. matlab regstat函数,MATLAB如何使用binostat函数计算二项分布的期望和方差
  2. 下载2019年7月实行的新标准JTT808-2019道路运输车辆卫星定位系统终端通讯协议及数据格式
  3. 学计算机拼音不好怎么办,新学期拼音学不会怎么办?送你10个妙招攻克拼音难关...
  4. Java 转换EXCEL Duble格式时间为指定格式日期字符串
  5. 流量卡之家:拥有边缘计算的物联网才是真正的物联网
  6. CAD等比例缩放图形
  7. 做网络安全居然不了解ATT&CK?这篇文章的介绍详细到令人尖叫
  8. Kero---knockout
  9. 微星GT60笔记本升级1060显卡案例
  10. windows系统电脑实用快捷键