【统计学习】细节笔记 [ 3 ] :贝叶斯角和两类错误角度理解混淆矩阵(为什么不能每个人都做核酸检测)
贝叶斯与两类错误
- 1. 两类错误
- 1.1 假设检验的基本思想——从女士品茶说起
- 1.2 两类错误与p值
- 2. 贝叶斯学派的基本思想
参考:贝叶斯与病检
1. 两类错误
1.1 假设检验的基本思想——从女士品茶说起
20世纪20年代后期,英国剑桥夏日的午后,绅士和他们的夫人们正围坐在户外的桌旁,享用着下午茶。在品茶过程中,一位女士坚称:把茶加进奶里,或把奶加进茶里,不同的做法,会使茶的味道品起来不同。
在场的科学精英们,对这位女士的“胡言乱语”嗤之以鼻。这怎么可能呢?他们并不相信仅仅因为加茶加奶的先后顺序不同,茶就会发生不同的化学反应。
事实上,如果她知道两杯茶分别以不同的方式调制,她可能一下子全部猜对(或全部猜错)。同样,即便这位女士能做出区分,她仍然有猜错的可能。或者是其中的一杯与奶没有充分地混合,或者是泡制时茶水不够热(AB-test)。即便这位女士能做出区分,也很有可能是奉上了10杯茶,她却只是猜对了其中的9 杯。
他调配出了八杯其他条件一模一样而仅仅是倒茶倒奶顺序相反的茶,其中两类各四个(为了少打几个字,在下文中称其为“奶”或者“茶”)。然后他让女士品尝之后告诉他哪四杯是“奶”。当然,剩下的就都是“茶”了。
1.2 两类错误与p值
首先假设女士没有这个能力(这个假设被称为原假设),然后如果女士很好的鉴别了这八杯茶,那就说明在原假设成立的情况下,发生了非常反常的现象,以至于说明原假设是令人怀疑的。从统计上来说,如果在原假设成立的前提下,发生了非常小概率的事件,那我们就有理由怀疑原假设的真实性。
H0:这位女士没有这样的能力,纯属瞎猜。H_0:这位女士没有这样的能力,纯属瞎猜。H0:这位女士没有这样的能力,纯属瞎猜。
设女士选对了XXX杯奶,那么蒙对XXX杯奶的概率如下所示
P(X=0)=C40∗C44C84=1/70P(X=0) ={{C_4^0* C_4^4}\over{C_8^4}}=1/70P(X=0)=C84C40∗C44=1/70
P(X=1)=C41∗C43C84=16/70P(X=1) ={{C_4^1* C_4^3}\over{C_8^4}}=16/70P(X=1)=C84C41∗C43=16/70
P(X=2)=C42∗C42C84=36/70P(X=2) ={{C_4^2* C_4^2}\over{C_8^4}}=36/70P(X=2)=C84C42∗C42=36/70
P(X=3)=C43∗C41C84=16/70P(X=3) ={{C_4^3* C_4^1}\over{C_8^4}}=16/70P(X=3)=C84C43∗C41=16/70
P(X=4)=C44∗C40C84=1/70P(X=4) ={{C_4^4* C_4^0}\over{C_8^4}}=1/70P(X=4)=C84C44∗C40=1/70
如果判定猜对3杯奶及以上,说明这位女士有鉴茶能力。那么从上面的共识可以看出,女士靠瞎猜通关的概率可以达到
P(X=3)+P(X=4)=17/70P(X=3)+P(X=4)=17/70P(X=3)+P(X=4)=17/70
如果判定四杯全部猜对,才可以说明这位女士有鉴茶能力。那么女士蒙混过关的概率就大大降低,变成
P(X=4)=C44∗C40C84=1/70P(X=4) ={{C_4^4* C_4^0}\over{C_8^4}}=1/70P(X=4)=C84C44∗C40=1/70
这种错误被称为第一类错误,即在原假设H0H_0H0为真的情况下拒绝原假设的概率,一般控制在5%以下:
P(rejectH0∣H0为真)=αP(reject \;H_0|H_0为真)=\alphaP(rejectH0∣H0为真)=α
相应地,第二类错误指的是在原假设H0H_0H0为伪的情况下接受原假设的概率:
P(acceptH0∣H0为伪)=βP(accept \;H_0|H_0为伪)=\betaP(acceptH0∣H0为伪)=β
回顾一下混淆矩阵,这里的原假设指的是:it is negative (-),相应地,拒真 = it is actually negative, but predicted positive.
预 | 测 | ||
---|---|---|---|
1 | 0 | ||
实 | 1 | True Positive(TP) | False Negative(FN: type II error) |
际 | 0 | False Positive(FP: type I error) | True Negative(TN) |
p-value则指的是,在原假设为真的前提下,出现该样本或比该样本更极端的结果的概率之和。应用到上述场景中,如果观察到女士准确地品出了四杯奶(即样本),那么其p-value为1/70.
如下图所示,蓝色表示在原假设为真的情况下总体的分布,我们认为位于尾部两端的数据出现的概率较小,通常将显著性水平设置为5%或1%(黑色虚线之外),当我们观察的数据(墨绿色点)位于极端区域时(以小概率事件),我们可以有充足证据拒绝原假设。
再举一个简单的例子,我们认为某年级一班的学生身高是呈正态分布的,但是看到了班里出来的好几个学生身高都是2米多,那么我们有充分信心觉得这不是小概率事件,从而拒绝原假设。
2. 贝叶斯学派的基本思想
P(Bi∣A)=P(A∣Bi)∗P(Bi)P(A)=P(A∣Bi)∗P(Bi)∑j=1nP(A∣Bj)∗P(Bj)P(B_i|A)={{P(A|B_i)*P(B_i)}\over{P(A)}}={{P(A|B_i)*P(B_i)}\over{\sum _{j=1}^n} {P(A|B_j)*P(B_j)} }P(Bi∣A)=P(A)P(A∣Bi)∗P(Bi)=∑j=1nP(A∣Bj)∗P(Bj)P(A∣Bi)∗P(Bi)
记事件AAA患某病,事件BBB为检测结果患某病;在研究血液检查是否能够正确诊断HIV的学术论文中,研究者发现,血液检查的灵敏度为81%(假阴性率为19%),特异度为74%(假阳性率为26%)。这里相当于给出了两类错误的数值。
简单解释一下,根据既往研究,在确实感染HIV的人群中,血液检查诊断阳性的概率P(检验阳性|患病)=81%,在未患病的人群中,错误诊断为阳性的概率P(检验阳性|未患病)=26%.根据全国范围的流行病学调查,HIV的感染率为5%,也就是在人群大众中P(患病)=5%,P(未患病)=95%.即
Recall=P(B∣A)=0.81,Specificity=P(B‾∣A‾)=0.74Recall=P(B|A)=0.81, Specificity=P(\overline{B}|\overline{A})=0.74Recall=P(B∣A)=0.81,Specificity=P(B∣A)=0.74
如果eivind 诊断结果为阳性(检测有病),那么实际上eivind真的感染了该病的概率是多大呢?
P(A∣B)=P(B∣A)∗P(A)P(B∣A)∗P(A)+P(B∣A‾)∗P(A‾)=0.81∗0.050.81∗0.05+0.26∗0.95=0.1409P(A|B)={P(B|A)*P(A)\over P(B|A)*P(A)+P(B|\overline A)*P(\overline A)}={0.81*0.05\over{0.81*0.05+0.26*0.95}}=0.1409P(A∣B)=P(B∣A)∗P(A)+P(B∣A)∗P(A)P(B∣A)∗P(A)=0.81∗0.05+0.26∗0.950.81∗0.05=0.1409
所以即便检测结果为阳性,也不必过于惊慌,拿到通知书的我们只有14%中招的概率,或许这也可以解释为什么有的时候需要接受两次核酸检测了。
如果每个人都接受核酸检测(完全不考虑病史和接触史),在检测的灵敏度和特异度有限的情况下,会造成大批量误诊。也就是说,检查结果显示有病的人中,只有14%是真的感染病患,在传染病排查中,这会引发相当严重的事故。
【统计学习】细节笔记 [ 3 ] :贝叶斯角和两类错误角度理解混淆矩阵(为什么不能每个人都做核酸检测)相关推荐
- 统计假设测验------(一)基本原理(假设测验的两类错误)
1.导论: 一个试验相当于一个样本,由一个样本平均数可以对总体平均数做出估计,但样本平均数是因不同样本而变化的,即样本平均数有抽样误差.用存在误差的样本平均数来推断总体,其结论并不是绝对正确的.把试验 ...
- 《统计学习方法》读书笔记——朴素贝叶斯法(公式推导+代码实现)
传送门 <统计学习方法>读书笔记--机器学习常用评价指标 <统计学习方法>读书笔记--感知机(原理+代码实现) <统计学习方法>读书笔记--K近邻法(原理+代码实现 ...
- 刘二大人 PyTorch深度学习实践 笔记 P6 逻辑斯蒂回归
刘二大人 PyTorch深度学习实践 笔记 P6 逻辑斯蒂回归 P6 逻辑斯蒂回归 1.torchversion 提供的数据集 2.基本概念 3.代码实现 P6 逻辑斯蒂回归 1.torchversi ...
- ML之NB:基于NB朴素贝叶斯算法训练20类新闻文本数据集进行多分类预测
ML之NB:基于NB朴素贝叶斯算法训练20类新闻文本数据集进行多分类预测 目录 输出结果 设计思路 核心代码 输出结果 设计思路 核心代码 vec = CountVectorizer() X_trai ...
- 【统计类知识】区间估计(置信区间)、假设检验(两类错误、P值)
统计推断的三大基本形式: 抽样分布 参数估计(点估计.区间估计) 假设检验(参数检验.非参数检验) 一. 置信区间 在实际中,我们通常得不到总体在某方面的真值,比如总体均值.或者说,如果我们现在要估计 ...
- 概率统计笔记:贝叶斯推断 Bayesian Inference
1 贝叶斯定理和全概率公式(复习) 贝叶斯定理(条件概率的计算公式): 全概率公式:如果A和A'构成了样本空间的一个划分,那么事件B的概率为: 全概率公式下条件概率的另一种写法: 2 贝叶斯推断 对条 ...
- 西瓜书笔记7:贝叶斯分类器
目录 相关概率知识 贝叶斯-全概率公式 先验概率.后验概率.似然概率 7.1 贝叶斯决策论 7.2 极大似然估计 极大似然估计公式 均值方差估计公式推导 概率知识复习 高斯分布 最大似然估计 7.3 ...
- 推荐常用的排序学习算法——BPR(贝叶斯个性化排序)
文章目录 1. 排序学习 1.1 优势 1.2 排序学习在推荐领域的作用 1.3 排序学习设计思路 1.3.1 单点法(Pointwise) 1.3.2 配对法(Pairwise) 1.3.3 列表法 ...
- 机器学习笔记——朴素贝叶斯(Naive Bayes)
1贝叶斯算法简介 贝叶斯分类算法是统计学的一种分类方法,它是一类利用概率统计知识进行分类的算法.在许多场合,朴素贝叶斯(Naïve Bayes,NB)分类算法可以与决策树和神经网络分类算法相媲美,该算 ...
- 分类算法学习(二)——贝叶斯算法的原理及简单实现
1.3.贝叶斯分类的基础--贝叶斯定理 每次提到贝叶斯定理,我心中的崇敬之情都油然而生,倒不是因为这个定理多高深,而是因为它特别有用.这个定理解决了现实生活里经常遇到的问题:已知某条件概率,如何得到两 ...
最新文章
- 深入理解计算机系统 系统软件 硬件 文件 进程 虚拟内存
- java上传+限制单文件,VereMVC 之 单文件上传
- catia齿轮宏程序_Catia宏程序
- CSS3的弹性盒子flex详解(2)
- Gradle打包命令记录
- Oracle使用startup与startup force启动的区别
- 前端学习(1990)vue之电商管理系统电商系统之自定义时间过滤器
- redis为什么选择单线程工作模型
- OpenTelemetry-可观察性的新时代
- 称重管理系统如何修改重量_无人值守称重系统硬件配置和作用
- VGG16与SSD算法Tensorflow代码实现对比
- python读json文件太大github_GitHub上最火的开源项目是啥|JSON文件实战处理
- android 成长日记 3.关于Activity的用户体验提升办法和使用技巧说明
- ie8和ie11的html代码生成,ie8升级ie11-IE11,IE8
- 山科大离散数学期末考试_离散数学期末考试试题及答案
- kudu tablet的设计
- 【程序员如何买基金 八】筛选优秀的债券基金
- 《腾讯传》的读书笔记与相关读后感2600字
- linux下无线网卡做热点,用ArchLinux做wifi热点无线路由
- Android开发的各个领域发展前景?路线?规划未来看这篇
热门文章
- 百度之星 度度熊的午饭时光
- 三星手机的计算机功能在哪里,【分享】三星手机几个投屏电脑的方法
- php免杀书籍,php免杀教程【绝对原创+首发】
- 司空见惯 - 体彩中奖交多少税
- autojs遍历当前页面所有控件_解放双手,手机自动化神器-AutoJS的使用
- java 连接 timesten_极简Java连接TimesTen程序
- 秒杀系统架构分析与实战
- 幅值与峰峰值的计算_交流电有效值与峰值计算公式的推导过程.
- python爬虫小说实例源码_Python下载网络小说实例代码
- Amesim2016与Matlab2017b联合仿真环境搭建