先说结论:因为假阳性的人数相比于真阳性太多了
具体是怎么回事呢?咱们慢慢分析。

文章目录

  • 一、贝叶斯公式
  • 二、典例分析
  • 三、贝叶斯公式的本质思考(摘自教材)

一、贝叶斯公式

定理1(贝叶斯公式) 设有事件 A , B A,B A,B, P ( A ) > 0 P(A)>0 P(A)>0, P ( B ) > 0 P(B)>0 P(B)>0,则 P ( B ∣ A ) = P ( B ) P ( A ∣ B ) P ( A ) P(B|A)=\frac{P(B)P(A|B)}{P(A)} P(B∣A)=P(A)P(B)P(A∣B)​证明:由条件概率的定义 P ( C ∣ D ) = P ( C D ) P ( D ) P(C|D)=\frac{P(CD)}{P(D)} P(C∣D)=P(D)P(CD)​可知 P ( B ) P ( A ∣ B ) = P ( A B ) P(B)P(A|B)=P(AB) P(B)P(A∣B)=P(AB), P ( A B ) P ( A ) = P ( B ∣ A ) \frac{P(AB)}{P(A)}=P(B|A) P(A)P(AB)​=P(B∣A)。

定理2(含全概率公式的贝叶斯公式)若事件 B 1 , B 2 , ⋯ , B n , ⋯ B_1,B_2,\cdots,B_n,\cdots B1​,B2​,⋯,Bn​,⋯构成互斥完备事件群,且对于任意 i = 1 , 2 , ⋯ i=1,2,\cdots i=1,2,⋯有 P ( B i ) > 0 P(B_i)>0 P(Bi​)>0,则对于任意事件 A A A( P ( A ) > 0 P(A)>0 P(A)>0),有 P ( B i ∣ A ) = P ( B i ) P ( A ∣ B i ) ∑ j P ( B j ) P ( A ∣ B j ) P(B_i|A)=\frac{P(B_i)P(A|B_i)}{\sum\limits_jP(B_j)P(A|B_j)} P(Bi​∣A)=j∑​P(Bj​)P(A∣Bj​)P(Bi​)P(A∣Bi​)​证明提要:由全概率公式有 P ( A ) = ∑ j P ( B j ) P ( A ∣ B j ) P(A)=\sum\limits_jP(B_j)P(A|B_j) P(A)=j∑​P(Bj​)P(A∣Bj​),然后代入定理1即可。

二、典例分析

现在我们考虑标题中提出的问题。

某个地区患有一种疾病的占 0.05 % 0.05\% 0.05%,患者对某种检测结果呈阳性的概率为 0.99 0.99 0.99,正常人对这种检查呈阳性的概率为 0.005 0.005 0.005,问检测结果呈阳性的人得这种并的概率是多少?

记事件 A A A为患有此疾病, B B B为检测结果呈阳性,则 A ˉ \bar A Aˉ为未患有此疾病。
根据题意, P ( A ) = 0.0005 P(A)=0.0005 P(A)=0.0005, P ( A ˉ ) = 0.9995 P(\bar A)=0.9995 P(Aˉ)=0.9995, P ( B ∣ A ) = 0.99 P(B|A)=0.99 P(B∣A)=0.99, P ( B ∣ A ˉ ) = 0.005 P(B|\bar A)=0.005 P(B∣Aˉ)=0.005。
显然 A A A和 A ˉ \bar A Aˉ构成互斥完备事件群。
根据定理2,有 P ( A ∣ B ) = P ( A ) P ( B ∣ A ) P ( A ) P ( B ∣ A ) + P ( A ˉ ) P ( B ∣ A ˉ ) = 0.000495 0.000495 + 0.0049975 ≈ 0.0901 P(A|B)=\frac{P(A)P(B|A)}{P(A)P(B|A)+P(\bar A)P(B|\bar A)}=\frac{0.000495}{0.000495+0.0049975}\approx0.0901 P(A∣B)=P(A)P(B∣A)+P(Aˉ)P(B∣Aˉ)P(A)P(B∣A)​=0.000495+0.00499750.000495​≈0.0901即检测结果呈阳性,得病的概率只有 9.01 % 9.01\% 9.01%。

按理来说,这种检测其实是相当精准的(得病的对这种检测结果呈阳性的概率高达 99 % 99\% 99%,未得病的呈阳性的概率只有 0.5 % 0.5\% 0.5%),那为什么会出现这种结果呢?

我们分析一下 P ( A ∣ B ) P(A|B) P(A∣B)的式子。 P ( A ) P ( B ∣ A ) P(A)P(B|A) P(A)P(B∣A)是得病且呈阳性的概率, P ( A ˉ ) P ( B ∣ A ˉ ) P(\bar A)P(B|\bar A) P(Aˉ)P(B∣Aˉ)是未得病且呈阳性的概率,所以 P ( A ∣ B ) P(A|B) P(A∣B)就是得病且呈阳性的概率占总的呈阳性的概率的比例。

为了更具体地讨论,我们用人数来说话。假设当地有一百万( 1000000 1000000 1000000)人,则得病的有 500 500 500人,得病且呈阳性的有 495 495 495人,正常人呈阳性的有 4997.525 4997.525 4997.525人(按 4998 4998 4998人来计算)。表示成图就是这个样子:

呈阳性的情况下得病的概率是多大呢?现在我们仅把目光聚焦在呈阳性的人里面:

为方便比较,我们把“得病且呈阳性”的部分旋转:

呈阳性且得病的几率就是得病且呈阳性的人数占所有呈阳性的人数的比例: 495 495 + 4998 ≈ 9 % \frac{495}{495+4998}\approx9\% 495+4998495​≈9%。

所以,虽然正常人呈阳性的概率很小,但是正常人和得病的人数相比实在是太多了,导致正常人呈阳性的也非常多,“冲淡了”呈阳性的人得病的几率。相比之下,得病且呈阳性的人实在是少得可怜。因此,我们就解释了为什么虽然检测结果呈阳性,得这种病的概率却不高。

既然如此,做这种检测还有意义吗?还是有的,因为做之前一个人得病的几率为 0.05 % 0.05\% 0.05%,做了且呈阳性之后得病的几率骤增到了 9 % 9\% 9%,上升了 180 180 180倍。当然,医院里面检测一个疾病要用很多种检测手段,这样就能一步步排除假阳性的情况了。

三、贝叶斯公式的本质思考(摘自教材)


【概率论】理解贝叶斯(Bayes)公式:为什么疾病检测呈阳性,得这种病的概率却不高?相关推荐

  1. 贝叶斯(Bayes)——算法概念梳理与实际应用

    基本概念导引: 贝叶斯法是关于随机事件A和B的条件概率和边缘概率的. 其中P(A|B)是在B发生的情况下A发生的可能性.  为完备事件组,即  在贝叶斯法则中,每个名词都有约定俗成的名称: P(A)是 ...

  2. 【概率论】贝叶斯法则

    基础知识描述: 联合概率: 定义:指在多元的概率分布中多个随机变量同时满足各自条件的概率. 举例:假设X和Y都服从正态分布,那么P{X<4,Y<0}就是一个联合概率,表示X<4,Y& ...

  3. 正态分布均值μ的贝叶斯Bayes估计推导

    前面一篇介绍了正态分布均值μ的极大似然估计MLE推导,这篇来介绍正态分布均值μ的贝叶斯Bayes估计推导. 数据x1,x2,-,xn来自正态分布N(μ,σ2),其中σ2已和. 假设μ的先验分布是正态分 ...

  4. 二项分布_贝塔分布(multivariate Beta distribution)_多项分布_狄利克雷分布(Dirichlet distribution)_贝叶斯理论公式浅述

    二项分布_贝塔分布(multivariate Beta distribution)_多项分布_狄利克雷分布(Dirichlet distribution)_贝叶斯理论公式浅述 参考书籍<统计学习 ...

  5. 贝叶斯相关公式(Bayes)

    这里只是记录一下,非常推荐马同学高等数学,文末有原文.点击这里看里面的例一应该是理解贝叶斯公式最好的例子 ,如果你稍微有一些基础,我觉得文末第二个链接中的例一更加适合你 代数推导 1. 贝叶斯公式 是 ...

  6. 如何理解贝叶斯概率公式的先验、后验以及似然

    贝叶斯概率公式最简单的情况: P(A|B)=P(B|A)*P(A)/P(B) 关于如何理解/ 记住贝叶斯公式里的先验.后验以及似然.有一个关于编译器的巧妙的例子: 假设今天Alice结束了漫长的期末复 ...

  7. 分类算法之贝叶斯(Bayes)分类器

    摘要:旁听了清华大学王建勇老师的 数据挖掘:理论与算法 的课,讲的还是挺细的,好记性不如烂笔头,在此记录自己的学习内容,方便以后复习. 一:贝叶斯分类器简介 1)贝叶斯分类器是一种基于统计的分类器,它 ...

  8. 如何通俗易懂的理解贝叶斯网络及其应用

    https://www.zhihu.com/question/28006799?sort=created

  9. 大数据分析案例-基于朴素贝叶斯算法构建微博谣言检测模型

最新文章

  1. 合肥工业大学—SQL Server数据库实验四:数据库的分离和附加
  2. python 执行vba脚本_用python批量执行VBA代码
  3. 微信小程序左上角返回按钮跳转到指定页面
  4. Python可视化(matplotlib)在图像中添加文本和标记(Text and Annotation)
  5. AKI-H8串口通信
  6. jqgrid下载,引入
  7. java里面string什么意思_java中string什么意思
  8. 最新版华为HG255D硬件定义
  9. cad相对坐标快捷键_CAD快捷键及命令大全
  10. 点播系统加服务器加投影加音响,打造真实家庭影院 投影机+音响巧搭配
  11. 华三交换机升级的ipe文件_H3C S5830V2[S5820V2]系列以太网交换机 配置指导-Release 2108-6W101...
  12. 计算机应用基础第四章电子表格测试,2019年计算机应用基础第四章测试答案
  13. 棋盘(Checkerboard)算法
  14. 总结下利用python赚钱的方法,在闲余时间月赚2k-5k
  15. 笔计算机维修,电子计算器常见故障 计算器常用维修方法
  16. OO ALV简单报表之DOCKING容器实现
  17. java写三次函数导数,用导数研究三次函数
  18. html静态商城网页制作 基于HTML+CSS+JavaScript在线服装商城店铺商城设计毕业论文源码...
  19. 文字/图片向上无限循环滚动
  20. 第九周—等比数列求和

热门文章

  1. c语言sort函数从小到大排序指针,sort排序是从小到大
  2. 单分散磁性二氧化硅微球粒径100nm,浓度可调
  3. 【C语言习题】两素数之差为2,则称该两素数为双胞胎数。求出[2,300]内双胞胎数。
  4. html css燕十八,燕十八_divcss教学笔记.doc
  5. Selenium 之订制启动Chrome的选项(Options)
  6. 计算机wps基础知识试题,计算机一级考试《WPS》精选练习题
  7. STL 大理石在那儿
  8. Qt on Mac 开发之 读取苹果系统OSX上的plist资源文件
  9. Java搭建Spark程序,提交到Yarn
  10. 基于Python的JS逆向和AST抽象语法树