贝叶斯与两类错误

  • 1. 两类错误
    • 1.1 假设检验的基本思想——从女士品茶说起
    • 1.2 两类错误与p值
  • 2. 贝叶斯学派的基本思想

参考:贝叶斯与病检

1. 两类错误

1.1 假设检验的基本思想——从女士品茶说起

  20世纪20年代后期,英国剑桥夏日的午后,绅士和他们的夫人们正围坐在户外的桌旁,享用着下午茶。在品茶过程中,一位女士坚称:把茶加进奶里,或把奶加进茶里,不同的做法,会使茶的味道品起来不同。
  在场的科学精英们,对这位女士的“胡言乱语”嗤之以鼻。这怎么可能呢?他们并不相信仅仅因为加茶加奶的先后顺序不同,茶就会发生不同的化学反应。

  事实上,如果她知道两杯茶分别以不同的方式调制,她可能一下子全部猜对(或全部猜错)。同样,即便这位女士能做出区分,她仍然有猜错的可能。或者是其中的一杯与奶没有充分地混合,或者是泡制时茶水不够热(AB-test)。即便这位女士能做出区分,也很有可能是奉上了10杯茶,她却只是猜对了其中的9 杯。
  他调配出了八杯其他条件一模一样而仅仅是倒茶倒奶顺序相反的茶,其中两类各四个(为了少打几个字,在下文中称其为“奶”或者“茶”)。然后他让女士品尝之后告诉他哪四杯是“奶”。当然,剩下的就都是“茶”了。

1.2 两类错误与p值

  首先假设女士没有这个能力(这个假设被称为原假设),然后如果女士很好的鉴别了这八杯茶,那就说明在原假设成立的情况下,发生了非常反常的现象,以至于说明原假设是令人怀疑的。从统计上来说,如果在原假设成立的前提下,发生了非常小概率的事件,那我们就有理由怀疑原假设的真实性。

H0:这位女士没有这样的能力,纯属瞎猜。H_0:这位女士没有这样的能力,纯属瞎猜。H0​:这位女士没有这样的能力,纯属瞎猜。

  设女士选对了XXX杯奶,那么蒙对XXX杯奶的概率如下所示
P(X=0)=C40∗C44C84=1/70P(X=0) ={{C_4^0* C_4^4}\over{C_8^4}}=1/70P(X=0)=C84​C40​∗C44​​=1/70
P(X=1)=C41∗C43C84=16/70P(X=1) ={{C_4^1* C_4^3}\over{C_8^4}}=16/70P(X=1)=C84​C41​∗C43​​=16/70
P(X=2)=C42∗C42C84=36/70P(X=2) ={{C_4^2* C_4^2}\over{C_8^4}}=36/70P(X=2)=C84​C42​∗C42​​=36/70
P(X=3)=C43∗C41C84=16/70P(X=3) ={{C_4^3* C_4^1}\over{C_8^4}}=16/70P(X=3)=C84​C43​∗C41​​=16/70
P(X=4)=C44∗C40C84=1/70P(X=4) ={{C_4^4* C_4^0}\over{C_8^4}}=1/70P(X=4)=C84​C44​∗C40​​=1/70

  如果判定猜对3杯奶及以上,说明这位女士有鉴茶能力。那么从上面的共识可以看出,女士靠瞎猜通关的概率可以达到
P(X=3)+P(X=4)=17/70P(X=3)+P(X=4)=17/70P(X=3)+P(X=4)=17/70
  如果判定四杯全部猜对,才可以说明这位女士有鉴茶能力。那么女士蒙混过关的概率就大大降低,变成
P(X=4)=C44∗C40C84=1/70P(X=4) ={{C_4^4* C_4^0}\over{C_8^4}}=1/70P(X=4)=C84​C44​∗C40​​=1/70

  这种错误被称为第一类错误,即在原假设H0H_0H0​为真的情况下拒绝原假设的概率,一般控制在5%以下:
P(rejectH0∣H0为真)=αP(reject \;H_0|H_0为真)=\alphaP(rejectH0​∣H0​为真)=α

  相应地,第二类错误指的是在原假设H0H_0H0​为伪的情况下接受原假设的概率:
P(acceptH0∣H0为伪)=βP(accept \;H_0|H_0为伪)=\betaP(acceptH0​∣H0​为伪)=β

  回顾一下混淆矩阵,这里的原假设指的是:it is negative (-),相应地,拒真 = it is actually negative, but predicted positive.

1 0
1 True Positive(TP) False Negative(FN: type II error)
0 False Positive(FP: type I error) True Negative(TN)

  p-value则指的是,在原假设为真的前提下,出现该样本或比该样本更极端的结果的概率之和。应用到上述场景中,如果观察到女士准确地品出了四杯奶(即样本),那么其p-value为1/70.
  如下图所示,蓝色表示在原假设为真的情况下总体的分布,我们认为位于尾部两端的数据出现的概率较小,通常将显著性水平设置为5%或1%(黑色虚线之外),当我们观察的数据(墨绿色点)位于极端区域时(以小概率事件),我们可以有充足证据拒绝原假设。
  再举一个简单的例子,我们认为某年级一班的学生身高是呈正态分布的,但是看到了班里出来的好几个学生身高都是2米多,那么我们有充分信心觉得这不是小概率事件,从而拒绝原假设。

2. 贝叶斯学派的基本思想

P(Bi∣A)=P(A∣Bi)∗P(Bi)P(A)=P(A∣Bi)∗P(Bi)∑j=1nP(A∣Bj)∗P(Bj)P(B_i|A)={{P(A|B_i)*P(B_i)}\over{P(A)}}={{P(A|B_i)*P(B_i)}\over{\sum _{j=1}^n} {P(A|B_j)*P(B_j)} }P(Bi​∣A)=P(A)P(A∣Bi​)∗P(Bi​)​=∑j=1n​P(A∣Bj​)∗P(Bj​)P(A∣Bi​)∗P(Bi​)​
  记事件AAA患某病,事件BBB为检测结果患某病;在研究血液检查是否能够正确诊断HIV的学术论文中,研究者发现,血液检查的灵敏度为81%(假阴性率为19%),特异度为74%(假阳性率为26%)。这里相当于给出了两类错误的数值。
简单解释一下,根据既往研究,在确实感染HIV的人群中,血液检查诊断阳性的概率P(检验阳性|患病)=81%,在未患病的人群中,错误诊断为阳性的概率P(检验阳性|未患病)=26%.根据全国范围的流行病学调查,HIV的感染率为5%,也就是在人群大众中P(患病)=5%,P(未患病)=95%.即
Recall=P(B∣A)=0.81,Specificity=P(B‾∣A‾)=0.74Recall=P(B|A)=0.81, Specificity=P(\overline{B}|\overline{A})=0.74Recall=P(B∣A)=0.81,Specificity=P(B∣A)=0.74

  如果eivind 诊断结果为阳性(检测有病),那么实际上eivind真的感染了该病的概率是多大呢?

P(A∣B)=P(B∣A)∗P(A)P(B∣A)∗P(A)+P(B∣A‾)∗P(A‾)=0.81∗0.050.81∗0.05+0.26∗0.95=0.1409P(A|B)={P(B|A)*P(A)\over P(B|A)*P(A)+P(B|\overline A)*P(\overline A)}={0.81*0.05\over{0.81*0.05+0.26*0.95}}=0.1409P(A∣B)=P(B∣A)∗P(A)+P(B∣A)∗P(A)P(B∣A)∗P(A)​=0.81∗0.05+0.26∗0.950.81∗0.05​=0.1409
  所以即便检测结果为阳性,也不必过于惊慌,拿到通知书的我们只有14%中招的概率,或许这也可以解释为什么有的时候需要接受两次核酸检测了。
  如果每个人都接受核酸检测(完全不考虑病史和接触史),在检测的灵敏度和特异度有限的情况下,会造成大批量误诊。也就是说,检查结果显示有病的人中,只有14%是真的感染病患,在传染病排查中,这会引发相当严重的事故。

【统计学习】细节笔记 [ 3 ] :贝叶斯角和两类错误角度理解混淆矩阵(为什么不能每个人都做核酸检测)相关推荐

  1. 统计假设测验------(一)基本原理(假设测验的两类错误)

    1.导论: 一个试验相当于一个样本,由一个样本平均数可以对总体平均数做出估计,但样本平均数是因不同样本而变化的,即样本平均数有抽样误差.用存在误差的样本平均数来推断总体,其结论并不是绝对正确的.把试验 ...

  2. 《统计学习方法》读书笔记——朴素贝叶斯法(公式推导+代码实现)

    传送门 <统计学习方法>读书笔记--机器学习常用评价指标 <统计学习方法>读书笔记--感知机(原理+代码实现) <统计学习方法>读书笔记--K近邻法(原理+代码实现 ...

  3. 刘二大人 PyTorch深度学习实践 笔记 P6 逻辑斯蒂回归

    刘二大人 PyTorch深度学习实践 笔记 P6 逻辑斯蒂回归 P6 逻辑斯蒂回归 1.torchversion 提供的数据集 2.基本概念 3.代码实现 P6 逻辑斯蒂回归 1.torchversi ...

  4. ML之NB:基于NB朴素贝叶斯算法训练20类新闻文本数据集进行多分类预测

    ML之NB:基于NB朴素贝叶斯算法训练20类新闻文本数据集进行多分类预测 目录 输出结果 设计思路 核心代码 输出结果 设计思路 核心代码 vec = CountVectorizer() X_trai ...

  5. 【统计类知识】区间估计(置信区间)、假设检验(两类错误、P值)

    统计推断的三大基本形式: 抽样分布 参数估计(点估计.区间估计) 假设检验(参数检验.非参数检验) 一. 置信区间 在实际中,我们通常得不到总体在某方面的真值,比如总体均值.或者说,如果我们现在要估计 ...

  6. 概率统计笔记:贝叶斯推断 Bayesian Inference

    1 贝叶斯定理和全概率公式(复习) 贝叶斯定理(条件概率的计算公式): 全概率公式:如果A和A'构成了样本空间的一个划分,那么事件B的概率为: 全概率公式下条件概率的另一种写法: 2 贝叶斯推断 对条 ...

  7. 西瓜书笔记7:贝叶斯分类器

    目录 相关概率知识 贝叶斯-全概率公式 先验概率.后验概率.似然概率 7.1 贝叶斯决策论 7.2 极大似然估计 极大似然估计公式 均值方差估计公式推导 概率知识复习 高斯分布 最大似然估计 7.3 ...

  8. 推荐常用的排序学习算法——BPR(贝叶斯个性化排序)

    文章目录 1. 排序学习 1.1 优势 1.2 排序学习在推荐领域的作用 1.3 排序学习设计思路 1.3.1 单点法(Pointwise) 1.3.2 配对法(Pairwise) 1.3.3 列表法 ...

  9. 机器学习笔记——朴素贝叶斯(Naive Bayes)

    1贝叶斯算法简介 贝叶斯分类算法是统计学的一种分类方法,它是一类利用概率统计知识进行分类的算法.在许多场合,朴素贝叶斯(Naïve Bayes,NB)分类算法可以与决策树和神经网络分类算法相媲美,该算 ...

  10. 分类算法学习(二)——贝叶斯算法的原理及简单实现

    1.3.贝叶斯分类的基础--贝叶斯定理 每次提到贝叶斯定理,我心中的崇敬之情都油然而生,倒不是因为这个定理多高深,而是因为它特别有用.这个定理解决了现实生活里经常遇到的问题:已知某条件概率,如何得到两 ...

最新文章

  1. 深入理解计算机系统 系统软件 硬件 文件 进程 虚拟内存
  2. java上传+限制单文件,VereMVC 之 单文件上传
  3. catia齿轮宏程序_Catia宏程序
  4. CSS3的弹性盒子flex详解(2)
  5. Gradle打包命令记录
  6. Oracle使用startup与startup force启动的区别
  7. 前端学习(1990)vue之电商管理系统电商系统之自定义时间过滤器
  8. redis为什么选择单线程工作模型
  9. OpenTelemetry-可观察性的新时代
  10. 称重管理系统如何修改重量_无人值守称重系统硬件配置和作用
  11. VGG16与SSD算法Tensorflow代码实现对比
  12. python读json文件太大github_GitHub上最火的开源项目是啥|JSON文件实战处理
  13. android 成长日记 3.关于Activity的用户体验提升办法和使用技巧说明
  14. ie8和ie11的html代码生成,ie8升级ie11-IE11,IE8
  15. 山科大离散数学期末考试_离散数学期末考试试题及答案
  16. kudu tablet的设计
  17. 【程序员如何买基金 八】筛选优秀的债券基金
  18. 《腾讯传》的读书笔记与相关读后感2600字
  19. linux下无线网卡做热点,用ArchLinux做wifi热点无线路由
  20. Android开发的各个领域发展前景?路线?规划未来看这篇

热门文章

  1. 百度之星 度度熊的午饭时光
  2. 三星手机的计算机功能在哪里,【分享】三星手机几个投屏电脑的方法
  3. php免杀书籍,php免杀教程【绝对原创+首发】
  4. 司空见惯 - 体彩中奖交多少税
  5. autojs遍历当前页面所有控件_解放双手,手机自动化神器-AutoJS的使用
  6. java 连接 timesten_极简Java连接TimesTen程序
  7. 秒杀系统架构分析与实战
  8. 幅值与峰峰值的计算_交流电有效值与峰值计算公式的推导过程.
  9. python爬虫小说实例源码_Python下载网络小说实例代码
  10. Amesim2016与Matlab2017b联合仿真环境搭建