文章目录

  • 1.1 条件概率
  • 1.2 全概率
  • 1.3 贝叶斯定理
  • 1.3 贝叶斯公式的理解
  • 1.4 案例:贝叶斯定理的应用
  • 参考

1.1 条件概率

条件概率指在A事件发生的情况下,B事件发生的概率。“A事件发生的情况下”,代表A为样本空间,“B事件发生的概率”,代表A∩BA\cap BA∩B为事件。

因此P(B∣A)=P(A∩B)P(A)P(B|A)=\frac{P(A\cap B)}{P(A)}P(B∣A)=P(A)P(A∩B)​

做一下公式变形 P(A∩B)=P(B∣A)P(A)P(A\cap B)=P(B|A)P(A)P(A∩B)=P(B∣A)P(A)

1.2 全概率


可见P(D)=P(D∩A)+P(D∩B)+P(D∩C)P(D)=P(D\cap A) + P(D\cap B) + P(D\cap C)P(D)=P(D∩A)+P(D∩B)+P(D∩C)
由条件概率的公式也可以写成:
P(D)=P(D∣A)P(A)+P(D∣B)P(B)+P(D∣C)P(AC)P(D)=P(D|A)P(A) + P(D|B)P(B) + P(D|C)P(AC)P(D)=P(D∣A)P(A)+P(D∣B)P(B)+P(D∣C)P(AC)
P(D)就是事件D在全部样本空间S(由A,B,C构成)下发生的概率,称为全概率。
这个式子就是全概率公式。

1.3 贝叶斯定理


先发生A再发生D的事件:

计算事件在样本空间下的概率P(D|A)

那么,已知M发生在D中,则M发生在A中的概率为:

P(A∣D)=P(A∩D)P(D)=P(A)P(D∣A)P(D∣A)P(A)+P(D∣B)P(B)+P(D∣C)P(AC)P(A|D)=\frac{P(A\cap D)}{P(D)} =\frac{P(A) P(D|A)}{P(D|A)P(A) + P(D|B)P(B) + P(D|C)P(AC)}P(A∣D)=P(D)P(A∩D)​=P(D∣A)P(A)+P(D∣B)P(B)+P(D∣C)P(AC)P(A)P(D∣A)​

这就是贝叶斯公式

1.3 贝叶斯公式的理解

把上面式子等号右侧拆成两部分来看,则贝叶斯公式的形式为:

P(A∣D)P(A|D)P(A∣D) = P(A)P(A)P(A) * P(D∣A)P(D∣A)P(A)+P(D∣B)P(B)+P(D∣C)P(AC)\frac{P(D|A)}{P(D|A)P(A) + P(D|B)P(B) + P(D|C)P(AC)}P(D∣A)P(A)+P(D∣B)P(B)+P(D∣C)P(AC)P(D∣A)​

贝叶斯公式实际上阐述了这么一个事情:

后验概率(新信息出现后的A的概率) = 先验概率(A的概率) x 可能性函数(新信息带来的调整)

新信息带来的调整,可以直观的由韦恩图来解释:

1.4 案例:贝叶斯定理的应用

典型应用例如,垃圾邮件过滤,疾病检查,中文分词。

已知某种疾病的发病率是0.001,即1000人中会有1个人得病。现有一种试剂可以检验患者是否得病,它的准确率是0.99,即在患者确实得病的情况下,它有99%的可能呈现阳性。它的误报率是5%,即在患者没有得病的情况下,它有5%的可能呈现阳性。现有一个病人的检验结果为阳性,请问他确实得病的可能性有多大?

第一步,分解问题
(1)问题是什么:病人的检测结果为阳性,他确实得病的概率有多大?
假定A事件表示得病,B事件表示阳性,那么求解的就是P(A|B)

(2)已知信息
1.疾病发病率为0.001,即P(A)为0.001,
这就是"先验概率",即没有做试验之前,我们预计的发病率。
2.试剂检测患者是否得病,准确率是0.99,即,患者确实得病的情况下(A),有99%的可能性被检测为阳性(B),也就是P(B|A)=0.99
3.试剂的误报率是5%,即患者没有得病的情况下(事件A的反面,记为A’),有5%的可能呈阳性,也就是P(B|A’)=0.05

综上,已知P(A), P(B|A), P(B|A’),求P(A|B),也就是"后验概率",即做了试验以后,对发病率的估计。

第二步,应用贝叶斯定理
(1)求先验概率
P(A)=0.001
(2)求可能性函数
P(B|A) / P(B)
P(B|A) 表示患者确实得病的情况下试剂呈阳性的概率,也就是0.99
P(B)可以由全概率公式求得,P(B)=P(B|A)P(A)+P(B|A’)P(A’)=0.99 * 0.001 + 0.05 * 0.999 ≈ 0.05
所以可能性函数 P(B|A) / P(B) = 0.99/0.05 = 19.8
(3)带入贝叶斯公式求后验概率
我们得到了一个惊人的结果,P(A|B)约等于0.019。也就是说,即使检验呈现阳性,病人得病的概率,也只是从0.1%增加到了2%左右。这就是所谓的"假阳性",即阳性结果完全不足以说明病人得病。

为什么这种检验的准确率高达99%,但是可信度却不到2%?答案是与它的误报率太高有关。我们无差别的给一大群人做筛查,而正常人的数目远大于实际患者,所以误差造成的干扰就非常大了。

解决办法是可以先锁定可疑样本,比如10000个人里检查出问题的那10个人,再独立的重复检测一次,而正常人连续两次都出现误差的概率极低,这时筛选出真正患者的准确率就很高了,这也是很多疾病要送交独立机构多次检查的原因。也就是,提高了先验概率,也就有效提高了后验概率。

参考

1.如何理解贝叶斯定理?
贝叶斯定理,就是看着后视镜开车,求看到右转弯灯时在十字路口的概率。


看着后视镜开车,肯定常常会撞车,没关系,我们可以不断的去修正我们的假设。
比如,撞了几次车之后,就发现可能之前估计的在十字路口打右转弯灯的数据明显偏大了,我们修正之后再继续开车。我们人类的学习,本身也是一个试错的过程。

2.怎样用非数学语言讲解贝叶斯定理(Bayes’s theorem)? - 猴子的回答 - 知乎

贝叶斯的现实意义:如果我能掌握一个事情的全部信息,我当然可以计算出一个客观概率(古典概率)。但生活中绝大多数决策面临的信息都是不全的,我们需要在信息有限的情况下,尽可能做出一个好的预测。也就是,在主观判断的基础上,先估计一个值(先验概率),然后再根据观察到的新信息不断修正(可能性函数),这就是贝叶斯定理利用过去的数据来预测概率的底层思想。

3.通俗易懂!白话朴素贝叶斯—红色石头

如果我对西瓜没有任何了解,包括瓜的颜色、形状、瓜蒂是否脱落。按常理来说,西瓜成熟的概率大概是 60%。那么,这个概率 P(瓜熟) 就被称为先验概率。

也就是说,先验概率是根据以往经验和分析得到的概率,先验概率无需样本数据,不受任何条件的影响。就像只根据常识而不根据西瓜状态来判断西瓜是否成熟,这就是先验概率

如果我在以前学到了一个判断西瓜是否成熟的常识,就是看瓜蒂是否脱落。一般来说,瓜蒂脱落的情况下,西瓜成熟的概率大一些,大概是 75%。如果把瓜蒂脱落当作一种结果,然后去推测西瓜成熟的概率,这个概率 P(瓜熟 | 瓜蒂脱落) 就被称为后验概率。后验概率类似于执果索因。

知道了先验概率和后验概率,我们再来看看什么是联合概率。买西瓜的例子中,P(瓜熟,瓜蒂脱落) 称之为联合分布,它表示瓜熟了且瓜蒂脱落的概率。关于联合概率,满足下列乘法等式:
P(瓜熟,瓜蒂脱落)=P(瓜熟∣瓜蒂脱落)⋅P(瓜蒂脱落)=P(瓜蒂脱落∣瓜熟)⋅P(瓜熟)P(瓜熟,瓜蒂脱落)=P(瓜熟|瓜蒂脱落)\cdot P(瓜蒂脱落)=P(瓜蒂脱落|瓜熟)\cdot P(瓜熟)P(瓜熟,瓜蒂脱落)=P(瓜熟∣瓜蒂脱落)⋅P(瓜蒂脱落)=P(瓜蒂脱落∣瓜熟)⋅P(瓜熟)

如何计算瓜蒂脱落的概率呢?实际上可以分成两种情况:一种是瓜熟状态下瓜蒂脱落的概率,另一种是瓜生状态下瓜蒂脱落的概率。瓜蒂脱落的概率就是这两种情况之和。因此,我们就推导出了全概率公式

P(瓜蒂脱落)=P(瓜蒂脱落∣瓜熟)⋅P(瓜熟)+P(瓜蒂脱落∣瓜生)⋅P(瓜生)P(瓜蒂脱落)=P(瓜蒂脱落|瓜熟)\cdot P(瓜熟)+P(瓜蒂脱落|瓜生)\cdot P(瓜生)P(瓜蒂脱落)=P(瓜蒂脱落∣瓜熟)⋅P(瓜熟)+P(瓜蒂脱落∣瓜生)⋅P(瓜生)

为了买到一个熟瓜,专门在网上搜索了一下,知道判断一个瓜是否熟了,除了要看瓜蒂是否脱落,还要看瓜的形状和颜色。形状有圆和尖之分,颜色有深绿、浅绿、青色之分。现在,特征由原来的 1 个,变成现在的 3 个,我们用 X 表示特征,用 Y 表示瓜的类型(瓜熟还是瓜生)。则根据贝叶斯定理,后验概率 P(Y=ck∣X=x)P(Y=c_k | X=x)P(Y=ck​∣X=x) 的表达式为:

P(Y=ck∣X=x)=P(X=x∣Y=ck)P(Y=ck)∑kP(X=x∣Y=ck)P(Y=ck)P(Y = c_ k | X = x) = \frac { P ( X = x | Y = c _ k ) P ( Y = c _ k) } { \sum _ k P ( X = x | Y = c _ k) P (Y= c _ k ) }P(Y=ck​∣X=x)=∑k​P(X=x∣Y=ck​)P(Y=ck​)P(X=x∣Y=ck​)P(Y=ck​)​

其中,ckc_kck​ 表示类别,kkk 为类别个数。本例中,kkk = 1,2,c1c_1c1​ 表示瓜熟,c2c_2c2​ 表示瓜生。这里的特征 X 不再是单一的,而是包含了 3 个特征。因此,条件概率 P(X=x∣Y=ck)P(X=x | Y=c_k)P(X=x∣Y=ck​) 假设各个条件相互独立,也就是说假设不同特征之间是相互独立的。这样,P(X=x∣Y=ck)P(X=x | Y=c_k)P(X=x∣Y=ck​) 就可以写成:

P(X=x∣Y=ck)=P(X1,⋯,Xn∣Y=ck)=Πj=1nP(Xj=xj∣Y=ck)P(X=x|Y=c_k)=P(X^1,\cdots,X^n|Y=c_k)=\Pi_{j=1}^nP(X^j=x^j|Y=c_k)P(X=x∣Y=ck​)=P(X1,⋯,Xn∣Y=ck​)=Πj=1n​P(Xj=xj∣Y=ck​)

其中,n 为特征个数,j 表示当前所属特征。针对这个例子,P(X=x∣Y=ck)P(X=x | Y=c_k)P(X=x∣Y=ck​) 可以写成:

P(X=x∣Y=ck)=P(X1=x1∣Y=ck)P(X2=x2∣Y=ck)P(X3=x3∣Y=ck)P(X=x|Y=c_k)=P(X^1=x^1|Y=c_k)P(X^2=x^2|Y=c_k)P(X^3=x^3|Y=c_k)P(X=x∣Y=ck​)=P(X1=x1∣Y=ck​)P(X2=x2∣Y=ck​)P(X3=x3∣Y=ck​)

这种条件独立性的假设就是朴素贝叶斯法“朴素”二字的由来。这一假设让朴素贝叶斯法变得简单,但是有时候会牺牲一定的分类准确率。

这样,利用朴素贝叶斯思想,我们就可以把后验概率写成:

P(Y=ck∣X=x)=P(X=x∣Y=ck)P(Y=ck)∑kP(X=x∣Y=ck)P(Y=ck)=P(Y=ck)ΠjP(Xj=xj∣Y=ck)∑kP(Y=ck)ΠjP(Xj=xj∣Y=ck)P(Y=c_k|X=x)=\frac{P(X=x|Y=c_k)P(Y=c_k)}{\sum_kP(X=x|Y=c_k)P(Y=c_k)}=\frac{P(Y=c_k)\Pi_jP(X^j=x^j|Y=c_k)}{\sum_kP(Y=c_k)\Pi_jP(X^j=x^j|Y=c_k)}P(Y=ck​∣X=x)=∑k​P(X=x∣Y=ck​)P(Y=ck​)P(X=x∣Y=ck​)P(Y=ck​)​=∑k​P(Y=ck​)Πj​P(Xj=xj∣Y=ck​)P(Y=ck​)Πj​P(Xj=xj∣Y=ck​)​

上式中的分母部分,对于所有的 ckc_kck​ 来说,都是一样的。因此,分母可以省略,不同的 ckc_kck​,仅比较 P(Y=ck∣X=x)P(Y=c_k | X=x)P(Y=ck​∣X=x) 的分子即可:

P(Y=ck)ΠjP(Xj=xj∣Y=ck)P(Y=c_k)\Pi_jP(X^j=x^j|Y=c_k)P(Y=ck​)Πj​P(Xj=xj∣Y=ck​)

直接上例子:
获得了一组包含 10 组样本的数据,当成是历史经验数据,以它为标准。

其中,瓜蒂分为脱落和未脱,形状分为圆形和尖形,颜色分为深绿、浅绿、青色。不同特征组合对应着瓜熟或者瓜生。

现在,挑了一个西瓜,它的瓜蒂脱落、形状圆形、颜色青色。这时候就完全可以根据样本数据和朴素贝叶斯法来计算后验概率。

对于瓜熟的情况:
瓜熟的先验概率: P(瓜熟) = 6 / 10 = 0.6。
条件概率: P(脱落 | 瓜熟) = 4 / 6 = 2 / 3。
条件概率: P(圆形 | 瓜熟) = 4 / 6 = 2 / 3。
条件概率: P(青色 | 瓜熟) = 2 / 6 = 1 / 3。
计算后验概率分子部分:
P(瓜熟) × P(脱落 | 瓜熟) × P(圆形 | 瓜熟) × P(青色 | 瓜熟) = 0.6 × (2 / 3) × (2 / 3) × (1 / 3) = 4 / 45。
对于瓜生的情况:
瓜生的先验概率: P(瓜生) = 4 / 10 = 0.4。
条件概率: P(脱落 | 瓜生) = 1 / 4 = 0.25。
条件概率: P(圆形 | 瓜生) = 1 / 4 = 0.25。
条件概率: P(青色 | 瓜生) = 1 / 4 = 0.25。
计算后验概率分子部分:
P(瓜生) × P(脱落 | 瓜生) × P(圆形 | 瓜生) × P(青色 | 瓜生) = 0.4 × 0.25 × 0.25 × 0.25 = 1 / 160。

因为 4 / 45 > 1 / 160,所以预测瓜蒂脱落、形状圆形、颜色青色的是熟瓜。

先验后验与贝叶斯定理相关推荐

  1. 先验 后验 似然估计

    一.完备事件组 设E是随机试验,Ω是相应的样本空间,A1,A2,...An为Ω的一个事件组,若 (1)AiAj=(ij) (2)A1A2...An=Ω 则称A1A2...An为样本空间的一个完备事件组 ...

  2. 先验、后验、似然、置信的理解

    先验.后验.似然.置信的理解 1. 贝叶斯公式 2. 举例 1. 贝叶斯公式 公式中: 所求的是事件 A 发生条件下事件 Bi 的概率为P(Bi│A): 试验产生了原因A之后,再对结果发生概率的新认识 ...

  3. 概率统计16——均匀分布、先验与后验

    相关阅读: 最大似然估计(概率10) 重要公式(概率4) 概率统计13--二项分布与多项分布 贝叶斯决策理论(1)基础知识 | 数据来自于一个不完全清楚的过程-- 均匀分布 简单来说,均匀分布是指事件 ...

  4. 概率论:先验与后验与似然

    1.我自己的理解 1.1 从时间角度理解: a.先验:根据以往的经验或者常识,总结当前事情发生某种结果的概率,又或者说是没有根据当前的事实,而只是对以往理论的研究进行推导,类似于选举中,专家在没有对当 ...

  5. 机器学习中的先验、后验和似然

    机器学习中的先验.后验和似然的概念理解 1.我自己的理解: 1)先验:统计历史上的经验而知当下发生的概率: 2)后验:当下由因及果的概率: 2.网上有个例子说的透彻: 1)先验--根据若干年的统计(经 ...

  6. 输入与输出后验与先验——学而不思则罔,思而不学则殆

    学而不思则罔,思而不学则殆.这句关于学习的经验与告诫,直到很久后我才明白其深刻含义,事实上,原先的我更偏于后者.而今天对于这句哲言,我想从另一个角度去思考它. 断断续续的,我学习了一些关于图像识别技术 ...

  7. 如何理解贝叶斯概率公式的先验、后验以及似然

    贝叶斯概率公式最简单的情况: P(A|B)=P(B|A)*P(A)/P(B) 关于如何理解/ 记住贝叶斯公式里的先验.后验以及似然.有一个关于编译器的巧妙的例子: 假设今天Alice结束了漫长的期末复 ...

  8. 先验条件、后验条件、不变条件

    You'll have a lot of problems writing Java, especially multi-threaded code, if you can't understand ...

  9. MAP 最大后验——利用经验数据获得对未观测量的点态估计

    Map (最大后验) 在贝叶斯统计学中,最大后验(Maximum A Posteriori,MAP)估计可以利用经验数据获得对未观测量的点态估计.它与Fisher的最大似然估计(Maximum Lik ...

最新文章

  1. go语言编程之字符串操作
  2. IntelliJ IDEA 、 Android Stadio 不显示Version Contro窗口
  3. 斯特林反演[bzoj4671]异或图
  4. oracle通过执行计划cost,Oracle 执行计划(5)—cost成本之索引范围扫描-B树索引
  5. SpringIOC的创建对象的单例多例模式和自动注入
  6. mysql 数据库gbk转utf8 乱码_mysql表utf8编码,内容gbk编码的乱码转换
  7. php cut截取字符串,php源码分析之DZX1.5字符串截断函数cutstr用法
  8. FastDFS启动报错
  9. 哈弗F7x驾舱数字化测试 语音识别精准
  10. 百度web前端面试2015.10.18
  11. Azure 中 Windows 虚拟机的大小
  12. 手机可以python编程吗_如何在安卓手机上编程Python代码并运行-百度经验
  13. 历代Windows版本
  14. sql-server(模式创建)
  15. 服务器管理口安装系统,管理口安装服务器操作系统
  16. 安卓手机主题软件_安卓手机数据恢复软件——FonePaw Android Data Recovery Mac
  17. Spring Web MVC (Spring MVC) 的相关例题及解析
  18. 3601lpk.dll劫持病毒分析
  19. 在Arcgis中进行拓扑检查(二)
  20. 代码随想录训练营day45

热门文章

  1. 【P02】47耳放的优化版本,全资料下载
  2. 国内期刊投稿用 CTeX(CTeX_2.9.2.164_Full)
  3. Revit二次开发之职业精神篇
  4. 疫情致美国10万家餐厅倒闭或长期关闭;温德姆酒店集团上半年大中华区签署38个项目 | 美通企业日报...
  5. iMAG(爱码哥)新建应用
  6. win10应用商店闪退、打不开解决办法
  7. nmap与hydra
  8. 数字加密和解密(Java)
  9. 机器学习算法之--决策树总结
  10. H.S.Teoh为D的垃集辩护.与Ola的反驳.