一文读懂贝叶斯原理(Bayes' theorem)

前言:贝叶斯定理是18世纪英国数学家托马斯·贝叶斯(Thomas Bayes)提出得重要概率论理论。以下摘一段 wikipedia 上的简介:

一、简介

所谓的贝叶斯定理源于他生前为解决一个“逆概”问题写的一篇文章,而这篇文章是在他死后才由他的一位朋友发表出来的。在贝叶斯写这篇文章之前,人们已经能够计算“正向概率”,如“假设袋子里面有 N 个白球,M 个黑球,你伸手进去摸一把,摸出黑球的概率是多大”。而一个自然而然的问题是反过来:“如果我们事先并不知道袋子里面黑白球的比例,而是闭着眼睛摸出一个(或好几个)球,观察这些取出来的球的颜色之后,那么我们可以就此对袋子里面的黑白球的比例作出什么样的推测”。这个问题,就是所谓的逆向概率问题。

贝叶斯定理的思想出现在18世纪,但真正大规模派上用途还得等到计算机的出现。因为这个定理需要大规模的数据计算推理才能凸显效果,它在很多计算机应用领域中都大有作为,如自然语言处理,机器学习,推荐系统,图像识别,博弈论等等。

二、定义

贝叶斯定理的思想出现在18世纪,但真正大规模派上用途还得等到计算机的出现。因为这个定理需要大规模的数据计算推理才能凸显效果,它在很多计算机应用领域中都大有作为,如自然语言处理,机器学习,推荐系统,图像识别,博弈论等等。

  • 贝叶斯定理是关于随机事件 A 和 B 的条件概率:

  • 其中P(A|B)是在 B 发生的情况下 A 发生的可能性。
  • 在贝叶斯定理中,每个名词都有约定俗成的名称:
  1. P(A)是 A 的先验概率,之所以称为“先验”是因为它不考虑任何 B 方面的因素。

  2. P(A|B)是已知 B 发生后 A 的条件概率,也由于得自 B 的取值而被称作 A 的后验概率。

  3. P(B|A)是已知 A 发生后 B 的条件概率,也由于得自 A 的取值而被称作 B 的后验概率。

  4. P(B)是 B 的先验概率,也作标淮化常量(normalizing constant)。

  • 按这些术语,贝叶斯定理可表述为:

后验概率 = (相似度 * 先验概率)/标淮化常量

  • 也就是说,后验概率与先验概率和相似度的乘积成正比。
  • 另外,比例P(B|A)/P(B)也有时被称作标淮相似度(standardised likelihood),Bayes定理可表述为:

后验概率 = 标淮相似度 * 先验概率

  • 条件概率就是事件 A 在另外一个事件 B 已经发生条件下的发生概率。条件概率表示为P(A|B),读作“在 B 发生的条件下 A 发生的概率”。
  • 联合概率表示两个事件共同发生(数学概念上的交集)的概率。A 与 B 的联合概率表示为

三、推导

我们可以从条件概率的定义推导出贝叶斯定理。

四、解释

通常,事件 A 在事件 B 发生的条件下的概率,与事件 B 在事件 A 发生的条件下的概率是不一样的;然而,这两者是有确定关系的,贝叶斯定理就是这种关系的陈述。

贝叶斯公式的用途在于通过己知三个概率来推测第四个概率。它的内容是:在 B 出现的前提下,A 出现的概率等于 A 出现的前提下 B 出现的概率乘以 A 出现的概率再除以 B 出现的概率。通过联系 A 与 B,计算从一个事件发生的情况下另一事件发生的概率,即从结果上溯到源头(也即逆向概率)。

通俗地讲就是当你不能确定某一个事件发生的概率时,你可以依靠与该事件本质属性相关的事件发生的概率去推测该事件发生的概率。用数学语言表达就是:支持某项属性的事件发生得愈多,则该事件发生的的可能性就愈大。这个推理过程有时候也叫贝叶斯推理。

五、参考文献

一文读懂贝叶斯原理(Bayes‘ theorem)相关推荐

  1. ​独家 | 一文读懂贝叶斯优化

    作者:Apoorv Agnihotri,Nipun Batra 翻译:王雨桐 校对:张一然 本文约6200字,建议阅读10+分钟. 本文将贝叶斯优化拆解为易于理解的小部分. 许多现代的机器学习算法都涉 ...

  2. 独家 | 一文读懂贝叶斯网络

    作者:Devin Soni 翻译:车前子 校对:孙韬淳 本文约1400字,建议阅读8分钟. 本文从概率论出发,为你阐述贝叶斯网络. 贝叶斯网络是一种利用贝叶斯推断进行概率计算的概率图模型.贝叶斯网络的 ...

  3. 推荐 :一文读懂贝叶斯网络

    作者:Devin Soni  翻译:车前子   校对:孙韬淳 本文约1400字,建议阅读8分钟. 本文从概率论出发,为你阐述贝叶斯网络. 贝叶斯网络是一种利用贝叶斯推断进行概率计算的概率图模型.贝叶斯 ...

  4. python贝叶斯算法的论文_3个范例带你读懂贝叶斯法则

    贝叶斯法则可能是概率论中最有生命力的一个公式.它可以用来计算条件概率或者主观概率. 贝叶斯法则的思想非常简单:随机事件发生的概率随着相关条件的发生而改变,一个命题真假的信念即主观概率随着相关证据的发现 ...

  5. 一文读懂CDN加速原理

    一文读懂CDN加速原理 什么是 CDN 工作原理 传统访问过程 CDN 访问过程 组成要素 智能调度 DNS 缓存功能服务 负载均衡设备 内容 Cache 服务器 共享存储 名词解释 CNAME记录( ...

  6. 【机器学习】一文看懂贝叶斯优化/Bayesian Optimization

    点击上方,选择星标,每天给你送干货! 来自:AI部落联盟 今天想谈的问题是:什么是贝叶斯优化/Bayesian Optimization,基本用法是什么? 本文的定位是:帮助未接触.仅听说过.初次接触 ...

  7. 一文读懂扩散模型原理、推断加速和可控生成

    在刚刚过去的2022年,扩散模型(Diffusion Models)成为了深度生成模型中新的SOTA.近期,中国人民大学助理教授李崇轩和清华大学博士生鲍凡在由智源社区主办的"2022大模型创 ...

  8. 一文读懂遗传算法工作原理(附Python实现)

    Datawhale干货 选自:AnalyticsVidhya,编译:机器之心 近日,Analyticsvidhya 上发表了一篇题为<Introduction to Genetic Algori ...

  9. 一文读懂网络通信技术原理

    一.网络的由来? 互联网的本质就是一系列的网络协议. 一台硬设有了操作系统,然后装上软件你就可以正常使用了,每个人都拥有一台自己的机器,然而彼此孤立. 如何能让大家一起玩耍,就有了初步的网络,其实两台 ...

最新文章

  1. Codeforces 1023A Single Wildcard Pattern Matching
  2. 20165315 第八周考试课下补做
  3. Spring Session - 使用Spring Session从零到一构建分布式session
  4. c语言数组与指针浅析
  5. 总结】Android辅助功能(一)-AccessibilityEvent的分发
  6. 2017年10月18日普及组 面积最大
  7. ZOJ 2060----Fibonacci Again
  8. 7-1 矩阵A乘以B (30 分)
  9. 2020江苏省计算机等级考试题库,2020年江苏省计算机等级考试易考套餐:三级数据库技术题库+教材...
  10. 18大产业的产业链全景图!(高清大图)
  11. 通俗易懂地讲解 __block 变量
  12. 从张一鸣和黄峥的离职信中,我们发现了四个共同点
  13. SpringBoot整合sigar实现服务端监控
  14. python多态实例_Python多态实例详解
  15. XML中写注释的格式
  16. ASCII三种进制对照表、二进制、字节
  17. DatePicker 设置最小日期是当前时间报错:java.lang.IllegalArgumentException: fromDate:xxx does not preced toDate: xx
  18. 用excel数据批量填充word表格
  19. 每一步详细介绍—在HM中进行CU PU TU划分以及PU最佳预测模式选择
  20. 商机:颜值经济时代医美增量市场悄然开启 谁都想美成Angelababy

热门文章

  1. Flex控件_datagrid_编辑功能
  2. 2021.11.06总结
  3. 百度与谷歌技术实力比较
  4. 蓝牙电话协议HFP(Hands-Free Profile) 传输手机状态信息(信号/漫游/电量/运行商/电话状态)
  5. 根据出生日期计算年龄——基于Python的datetime库
  6. 解决文件上传重名的方案
  7. 利用ADS、HFSS设计微带带通滤波器的设计日志
  8. 刘洋-从国内三本到牛津博士
  9. 2015移动安全病毒年报
  10. 使用 Java 故意消耗 Cpu 和内存的代码