利用一个例子来讲解以下概率论的基础概念:

  • 条件概率
  • 联合概率
  • 全概率公式
  • 贝叶斯公式

小英是一名跑步爱好者,下面统计了小英100天的跑步情况,这100天有不同的天气情况,小英也不是每天都跑步。下面结合例子开始介绍概率论的基础概念。

概率

概率表示某事件发生的可能性

图1一共有100个格子,格子里的颜色表示一天的天气状况,共有100天。其中有20天下雨(蓝色),30天刮风(黄色),50天晴天(绿色)。那么数格子很容易可以算出某天天气是下雨或刮风或晴天的概率:

  • P(x1=1)=20/100=0.2P(x_1=1)=20/100=0.2P(x1​=1)=20/100=0.2,表示某天是小雨的概率,简写为P(x1)=0.2P(x_1)=0.2P(x1​)=0.2
  • P(x2)=0.3P(x_2)=0.3P(x2​)=0.3
  • P(x3)=0.5P(x_3)=0.5P(x3​)=0.5

由此得到表1。

联合概率

联合概率表示多事件同时发生的概率

先来看图2,粉色格子表示在这天小英跑步了,从图中可以数出:小雨时小英有4天在跑步;刮风时小英跑了27天;晴天小英有30天在跑步。很容易数出,小英在下雨天跑步的概率就是P(x1=1,y=1)=4/100=0.04P(x_1=1,y=1)=4/100=0.04P(x1​=1,y=1)=4/100=0.04简写为P(x1,y)P(x_1,y)P(x1​,y),用逗号隔开表示两件事同时发生的概率。

  • P(x1,y)=0.04P(x_1,y)=0.04P(x1​,y)=0.04
  • P(x2,y)=0.27P(x_2,y)=0.27P(x2​,y)=0.27
  • P(x3,y)=0.3P(x_3,y)=0.3P(x3​,y)=0.3

由此得到表2

条件概率

条件概率表示,在某事发生的前提之下,另一件事发生的概率。

比如计算:下雨时,小英跑步的概率。一共有20个蓝色格子,表示下了20天雨,其中有4个是被粉色格子覆盖的。则下雨天,小英跑步的概率就是P(y=1∣x1=1)=4/20=0.2P(y=1|x_1=1)=4/20=0.2P(y=1∣x1​=1)=4/20=0.2,简写为P(y∣x1)=0.2P(y|x_1)=0.2P(y∣x1​)=0.2,则:

  • P(y∣x1)=0.2P(y|x_1)=0.2P(y∣x1​)=0.2
  • P(y∣x2)=0.9P(y|x_2)=0.9P(y∣x2​)=0.9
  • P(y∣x3)=0.6P(y|x_3)=0.6P(y∣x3​)=0.6

由此得到表3。

把表1、2、3摆在一起可以看出(注意换了位置),表2其实就是表1和表3对应元素相乘。

这就引出了联合概率公式
P(xi,y)=P(xi)P(y∣xi)(1)P(x_i,y)=P(x_i)P(y|x_i) \tag{1} P(xi​,y)=P(xi​)P(y∣xi​)(1)
变换一下次序就是条件概率公式
P(y∣xi)=P(xi,y)P(xi)(2)P(y|x_i)=\frac{P(x_i,y)}{P(x_i)} \tag{2} P(y∣xi​)=P(xi​)P(xi​,y)​(2)

注:更一般化的公式应该是联合概率P(A,B)=P(A)P(B∣A)P(A,B)=P(A)P(B|A)P(A,B)=P(A)P(B∣A)和条件概率P(B∣A)=P(A,B)/P(A)P(B|A)=P(A,B)/P(A)P(B∣A)=P(A,B)/P(A),其实就是符号的区别。这里边A和B填任何符号都行。

全概率公式

根据表1,表2,表3怎么计算小英在某天跑步的概率?

如果看着图数粉色格子的话,很容易得出P(y=1)=(4+27+30)/100=0.61P(y=1)=(4+27+30)/100=0.61P(y=1)=(4+27+30)/100=0.61。简写为P(y)=0.61P(y)=0.61P(y)=0.61。

把这个公式拆解一下可以得到下面这样的计算式:

P(y)=4100+27100+30100=20100420+301002730+501003050=0.2⋅0.2+0.3⋅0.9+0.5⋅0.6\begin{aligned} P(y)&=\frac{4}{100}+\frac{27}{100}+\frac{30}{100}\\ &=\frac{20}{100}\frac{4}{20}+\frac{30}{100}\frac{27}{30}+\frac{50}{100}\frac{30}{50}\\ &=0.2 \cdot0.2+0.3\cdot0.9+0.5\cdot0.6 \end{aligned} P(y)​=1004​+10027​+10030​=10020​204​+10030​3027​+10050​5030​=0.2⋅0.2+0.3⋅0.9+0.5⋅0.6​

可以看到公式的最后一行实际上就是表1和表3对应元素相乘再相加。

把这个过程写成公式就是:

P(y)=P(x1)P(y∣x1)+P(x2)P(y∣x2)+P(x3)P(y∣x3)=∑i=1nP(xi)P(y∣xi)\begin{aligned} P(y)&=P(x_1)P(y|x_1) + P(x_2)P(y|x_2) + P(x_3)P(y|x_3)\\ &=\sum_{i=1}^{n}P(x_i)P(y|x_i) \end{aligned} P(y)​=P(x1​)P(y∣x1​)+P(x2​)P(y∣x2​)+P(x3​)P(y∣x3​)=i=1∑n​P(xi​)P(y∣xi​)​

这个例子里n=3n=3n=3。

全概率公式为

P(y)=∑i=1nP(xi)P(y∣xi)(3)P(y)=\sum_{i=1}^{n}P(x_i)P(y|x_i) \tag{3} P(y)=i=1∑n​P(xi​)P(y∣xi​)(3)

为何不直接用表2和公式P(xi,y)P(x_i,y)P(xi​,y)?

很多时候我们从题目得不到联合概率P(xi,y)P(x_i,y)P(xi​,y)的信息,一般都能得到某变量发生的概率P(xi)P(x_i)P(xi​)或条件概率P(y∣xi)P(y|x_i)P(y∣xi​),反正P(xi)P(y∣xi)P(x_i)P(y|x_i)P(xi​)P(y∣xi​)也能表示P(xi,y)P(x_i,y)P(xi​,y),那不如用适用性更广的公式。

结合图2和图3来看,全概率公式其实就是一个分而治之的思想,每种天气状态都会对应不同的小英跑步的概率,而天气状态的概率又各不相同。这两个概率相乘再相加就得到了小英跑步的概率。

贝叶斯公式

之前我们都是在100天的范围之下讨论小英跑步的问题的

现在把讨论范围缩小:在小英跑步的日子中,下雨的天数是多少?

把表示跑步的粉色部分从图2扣下来就形成了图4。

这个问题的答案数一下便知P(x1∣y)=4/(4+27+30)=4/61P(x_1|y)=4/(4+27+30)=4/61P(x1​∣y)=4/(4+27+30)=4/61

稍微推导一下,根据之前得到的条件概率公式(2)可得
P(xi∣y)=P(xi,y)P(y)P(x_i|y)=\frac{P(x_i,y)}{P(y)} P(xi​∣y)=P(y)P(xi​,y)​
再根据联合概率公式(1)和全概率公式(3)可得贝叶斯公式
P(xi∣y)=P(xi)P(y∣xi)∑j=1nP(xj)P(y∣xj)(4)P(x_i|y)=\frac{P(x_i)P(y|x_i)}{\sum_{j=1}^nP(x_j)P(y|x_j)} \tag{4} P(xi​∣y)=∑j=1n​P(xj​)P(y∣xj​)P(xi​)P(y∣xi​)​(4)
把x1x_1x1​带入贝叶斯公式(4)就有:
P(x1∣y)=P(x1)P(y∣x1)∑j=1nP(xj)P(y∣xj)=P(x1)P(y∣x1)P(x1)P(y∣x1)+P(x2)P(y∣x2)+P(x3)P(y∣x3)=0.2⋅0.20.2⋅0.2+0.3⋅0.9+0.6⋅0.5=0.040.61=461\begin{aligned} P(x_1|y)&=\frac{P(x_1)P(y|x_1)}{\sum_{j=1}^nP(x_j)P(y|x_j)}\\ &=\frac{P(x_1)P(y|x_1)}{P(x_1)P(y|x_1)+P(x_2)P(y|x_2)+P(x_3)P(y|x_3)}\\ &=\frac{0.2\cdot0.2}{0.2\cdot0.2+0.3\cdot0.9+0.6\cdot0.5}\\ &=\frac{0.04}{0.61}\\ &=\frac{4}{61} \end{aligned} P(x1​∣y)​=∑j=1n​P(xj​)P(y∣xj​)P(x1​)P(y∣x1​)​=P(x1​)P(y∣x1​)+P(x2​)P(y∣x2​)+P(x3​)P(y∣x3​)P(x1​)P(y∣x1​)​=0.2⋅0.2+0.3⋅0.9+0.6⋅0.50.2⋅0.2​=0.610.04​=614​​
其实核心思想就是把条件概率公式拆分得更细了,理论是很简单的。推导过程可能看起来有点复杂,结合图4看就很清晰了。P(x1∣y)P(x_1|y)P(x1​∣y)的分子就是一个联合概率公式,下部分就是全概率公式。只要式(1)(2)(3)都掌握好了,贝叶斯公式就很简单。
P(x1∣y)=联合概率全概率P(x_1|y)=\frac{联合概率}{全概率} P(x1​∣y)=全概率联合概率​

  • P(x1∣y)=4/61P(x_1|y)=4/61P(x1​∣y)=4/61
  • P(x2∣y)=27/61P(x_2|y)=27/61P(x2​∣y)=27/61
  • P(x3∣y)=30/61P(x_3|y)=30/61P(x3​∣y)=30/61
    可以把贝叶斯概率公式理解为范围缩小了的概率问题。

图解概率论基础概念(条件概率、全概率公式、贝叶斯公式)相关推荐

  1. 概率论基础 —— 2. 条件概率、全概率、贝叶斯概率公式

    文章目录 条件概率 全概率 贝叶斯概率 条件概率 条件概率是一种比较特殊的概率体系,和我们前面提到过的基本概率(交事件)有所不同.它最大的特点在于事件发生时有一定的限制前提,通常一般是说在事件A发生后 ...

  2. 【概率论基础】概率论的一些基础概念以及公式

    概率论基础 不确定性的来源: 被建模系统内在的随机性:如量子力学的粒子动力学描述. 不完全观测:不嫩观测到所有驱动系统行为的变量. 不完全建模:进行假设简化时必须舍弃某些观测信息,舍弃的信息导致魔性的 ...

  3. 概率论复习笔记——条件概率、全概率、贝叶斯公式及其应用

    概统笔记--贝叶斯公式 条件概率 乘法定理 全概率公式和贝叶斯公式 样本空间 全概率公式 贝叶斯公式 相关应用 条件概率 定义 设 A , B A,B A,B是两个事件,且 P ( A ) > ...

  4. 数学基础(1)~ 概率论基础知识

    概率论基础 出处:http://www.cnblogs.com/fanling999/p/6702297.html 参考:盛骤, 谢式千, 潘承毅. 概率论与数理统计, 第四版[M]. 高等教育出版社 ...

  5. 机器学习的9个基础概念和10种基本算法总结

    https://blog.csdn.net/libaqiangdeliba/article/details/41901387 1.基础概念: (1) 10折交叉验证:英文名是10-fold cross ...

  6. 概率论基础(4)五种重要的分布(二项、泊松、均匀、指数、正态分布)

    概率论对于学习 NLP 方向的人,重要性不言而喻.于是我打算从概率论基础篇开始复习,也顺便巩固巩固基础. 这是基础篇的第四篇知识点总结 基础:下面前三篇的链接地址: 概率论基础(1)古典和几何概型及事 ...

  7. 概率论-重点概念回顾

    概率论-重点概念回顾 1.大数定理和中心极限定理 大数定理:在样本数量很大时,样本均值和数学期望接近.随机事件发生的频率接近于理论概率. 中心极限定理:在样本数量无穷大时,样本均值的分布呈正态分布. ...

  8. 第一章——概率论基本概念

    概率论基本概念 结合书本以及宋浩老师在B站的视频写的笔记 随机事件 随机试验的三个特点 在相同条件可重复 结果不止一个,并且实现可以明确试验所有出现的结果 无法预测 事件 基本事件: 相对于实验目的, ...

  9. 详解概率论基础: 从贝叶斯开始

    转自:机器之心,侵删 本文从最基础的概率论到各种概率分布全面梳理了基本的概率知识与概念,这些概念可能会帮助我们了解机器学习或开拓视野.这些概念是数据科学的核心,并经常出现在各种各样的话题上.重温基础知 ...

  10. 概率论基础(7)数学期望、方差、协方差、切比雪夫不等式

    概率论对于学习 NLP 方向的人,重要性不言而喻.于是我打算从概率论基础篇开始复习,也顺便巩固巩固基础. 这是基础篇的第七篇知识点总结 基础:下面前六篇的链接地址: 概率论基础(1)古典和几何概型及事 ...

最新文章

  1. “一带一路”谋定沿边开放发展-刘虹飞:经信研究形成共识
  2. ACM数论之旅4---扩展欧几里德算法(欧几里德(・∀・)?是谁?)
  3. 新版ipados可以编辑C语言吗,iPadOS新增了五个有用的功能,看你需不需要
  4. php xml 实例教程,php解析xml方法实例详解,解析xml实例详解_PHP教程
  5. Ubuntu离线安装VSCode(附带前期准备工作)
  6. 看Facebook如何基于物理安全保护数据
  7. 【UI插件】开发一个简单日历插件(上)
  8. 编译aspell时出错
  9. 第二章 部署war包到tomcat
  10. pythonmt4通讯swot矩阵_基于SWOT与安索夫矩阵的市场战略分析.doc
  11. 解决Ubuntu 20.04 虚拟机克隆出多台造成的IP地址冲突的问题
  12. layui中实现动态的cols表头字段
  13. ubuntu16.04 64位安装HTS-2.3(包括前端配置)【待更】
  14. python列表按照长度排序_Python程序根据元素的长度对列表进行排序?
  15. python基于PHP+MySQL的药店药品进销存管理系统
  16. 买了xbox的这两年
  17. 我爱Flask之URL和Flask视图介绍
  18. linux 打开大文件命令,linux下大文件的读取
  19. ceph rbd mysql_如何在 Kubernetes 环境中搭建 MySQL(三):使用 PVC 挂接 RBD
  20. 【项目分析】旅游代购

热门文章

  1. VEH与SetUnhandledExceptionFilter
  2. 炼丹笔记一——基于TensorFlow的vgg16的cifar10和100简单探究超参数对训练集收敛情况的影响
  3. bootstrap搜索图标的使用
  4. 安装Home Assistant 历程+遇到的问题
  5. 图像超分辨去噪(去雨雾)
  6. 关于货币流动的一点思考
  7. IT 认证考试--软考--(中级项目)嵌入式系统设计师1:嵌入式系统设计师介绍
  8. 你学习了Python,再看此文,这是一篇可以给你带来外快的文章,不夸张
  9. 如何裁剪视频?这两个简单方法你们还不快来学
  10. Python人工智能学习路线(长篇干货)