1、贝叶斯定理

  • 先验概率P(A):在不考虑其他的情况下,A事件发生的概率。
  • 条件概率P(B|A):A事件发生的情况下,B事件发生的概率。
  • 后验概率P(A|B):在B事件发生之后,对A事件发生的概率的重新评估。
    P(A∣B)=P(AB)P(B)P(A|B)=\frac{P(AB)}{P(B)} P(A∣B)=P(B)P(AB)​
  • 全概率:如果A和A’ 构成样本空间的一个划分,那么事件B的概率为A和A’ 的概率分别乘以B对这两个事件的概率之和。
    P(B)=P(A)×P(B∣A)+P(A′)×P(B∣A′)P(B)=∑i=1nP(Ai)×P(B∣Ai)\begin{aligned} P(B)&=P(A)\times P(B|A)+P(A')\times P(B|A') \\ P(B)&=\sum_{i=1}^nP(A_i)\times P(B|A_i) \end{aligned} P(B)P(B)​=P(A)×P(B∣A)+P(A′)×P(B∣A′)=i=1∑n​P(Ai​)×P(B∣Ai​)​
  • 基于条件概率的贝叶斯定律数学公式:
    P(A∣B)=P(A)×P(B∣A)P(B)P(A)×P(B∣A)∑i=1nP(B∣Ai)×P(Ai)\begin{aligned} P(A|B)&=\frac{P(A)\times P(B|A)}{P(B)} \\ &\frac{P(A)\times P(B|A)}{\sum_{i=1}^nP(B|A_i)\times P(A_i)} \end{aligned} P(A∣B)​=P(B)P(A)×P(B∣A)​∑i=1n​P(B∣Ai​)×P(Ai​)P(A)×P(B∣A)​​

2、朴素贝叶斯算法

朴素贝叶斯(Naive Bayes, NB)是基于“特征之间是独立的”这一朴素假设,应用贝叶斯定理的监督学习算法。对应给定的样本X的特征向量x1,x2,…,xmx_1, x_2,\dots, x_mx1​,x2​,…,xm​,该样本X的类别y的概率可以由贝叶斯公式得到:
P(y∣x1,x2,…,xm)=P(y)P(x1,x2,…,xm∣y)P(x1,x2,…,xm)P(y|x_1, x_2, \dots, x_m)=\frac{P(y)P(x_1, x_2, \dots, x_m|y)}{P(x_1, x_2, \dots, x_m)} P(y∣x1​,x2​,…,xm​)=P(x1​,x2​,…,xm​)P(y)P(x1​,x2​,…,xm​∣y)​
朴素贝叶斯算法流程:

  • 设x={a1,a2,…,am}x=\{a_1, a_2, \dots, a_m\}x={a1​,a2​,…,am​}为待分类项,其中a为x的一个特征属性
  • 类别集合为C={y1,y2,…,yn}C=\{y_1, y_2, \dots, y_n\}C={y1​,y2​,…,yn​}
  • 分别用贝叶斯公式计算P(y1∣x),P(y2∣x),…,P(yn∣x)P(y_1|x), P(y_2|x), \dots, P(y_n|x)P(y1​∣x),P(y2​∣x),…,P(yn​∣x)的值
  • 如果P(yk∣x)=max⁡{P(y1∣x),P(y2∣x),…,P(yn∣x)}P(y_k|x)=\max\{P(y_1|x), P(y_2|x), \dots, P(y_n|x)\}P(yk​∣x)=max{P(y1​∣x),P(y2​∣x),…,P(yn​∣x)},那么认为xxx为yky_kyk​类型
高斯朴素贝叶斯

Gaussian Naive Bayes是指当特征属性为连续值时,而且分布服从高斯分布,那么在计算P(x|y)的时候可以直接使用高斯分布的概率公式:
g(x,η,σ)=12πσe−(x−η)22σ2P(xk∣yk)=g(xk,ηyk,σyk)\begin{aligned} g(x, \eta, \sigma)&=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\eta)^2}{2\sigma^2}} \\ P(x_k|y_k)&=g(x_k, \eta_{y_k}, \sigma_{y_k}) \end{aligned} g(x,η,σ)P(xk​∣yk​)​=2π​σ1​e−2σ2(x−η)2​=g(xk​,ηyk​​,σyk​​)​
因此只需要计算出各个类别中此特征项划分的各个均值和标准差。

伯努利朴素贝叶斯

Bernoulli Naive Bayes是指当特征属性为连续值时,而且分布服从伯努利分布,那么在计算P(x|y)的时候可以直接使用伯努利分布的概率公式:
P(xk∣y)=P(1∣y)xk+(1−P(1∣y))(1−xk)P(x_k|y)=P(1|y)x_k+(1-P(1|y))(1-x_k) P(xk​∣y)=P(1∣y)xk​+(1−P(1∣y))(1−xk​)
伯努利分布是一种离散分布,只有两种可能的结果。1表示成功,出现的概率为p。0表示失败,出现的概率为q=1-p。其中均值为E(x)=p,方差为Var(X)=p(1-p)。

多项式朴素贝叶斯

Multinomial Naive Bayes是指当特征属性服从多项分布,从而,对于每个类别y,参数为θy=(θy1,θy2,…,θyn)θ_y =(θ_{y_1}, θ_{y_2}, \dots, θ_{y_n})θy​=(θy1​​,θy2​​,…,θyn​​),其中n为特征属性数目,那么P(xi∣y)P(x_i|y)P(xi​∣y)的概率为θyiθ_{y_i}θyi​​。
θyi=Nyi+αNy+α×nNyi=∑x∈TxiNy=∑i=1∣T∣Nyi\begin{aligned} θ_{y_i}&=\frac{N_{y_i}+\alpha}{N_y+\alpha\times n} \\ N_{y_i}&=\sum_{x\in T}x_i \\ N_y&=\sum_{i=1}^{|T|}N_{y_i} \end{aligned} θyi​​Nyi​​Ny​​=Ny​+α×nNyi​​+α​=x∈T∑​xi​=i=1∑∣T∣​Nyi​​​

3、贝叶斯网络

把某个研究系统中涉及到的随机变量,根据是否条件独立绘制在一个有向图中,就形成了贝叶斯网络。
贝叶斯网络(Bayesian Network),又称有向无环图模型(directed acyclic graphical model,DAG),是一种概率图模型,根据概率图的拓扑结构,考察一组随机变量{X1,X2,…,Xn}\{X_1, X_2, \dots, X_n\}{X1​,X2​,…,Xn​}及其N组条件概率分布(Conditional Probabililty Distributions,CPD)的性质。
当多个特征属性之间存在着某种相关关系的时候,使用朴素贝叶斯算法就没法解决这类问题,那么贝叶斯网络就是解决这类应用场景的一个非常好的算法。
一般而言,贝叶斯网络的有向无环图中的节点表示随机变量,可以是可观察到的变量,或隐变量、未知参数等等。连接两个节点之间的箭头代表两个随机变量之间的因果关系(也就是这两个随机变量之间非条件独立),如果两个节点间以一个单箭头连接在一起,表示其中一个节点是“因”,另外一个是“果”,从而两节点之间就会产生一个条件概率值。每个节点在给定其直接前驱的时候,条件独立于其后继。
贝叶斯网络的关键方法是图模型,构建一个图模型我们需要把具有因果联系的各个变量用箭头连在一起。贝叶斯网络的有向无环图中的节点表示随机变量。连接两个节点的箭头代表此两个随机变量是具有因果关系的。贝叶斯网络是模拟人的认知思维推理模式的,用一组条件概率以及有向无环图对不确定性因果推理关系建模。

最简单的贝叶斯网络

P(a,b,c)=P(c∣a,b)P(b∣a)P(a)P(a, b, c)=P(c|a, b)P(b|a)P(a) P(a,b,c)=P(c∣a,b)P(b∣a)P(a)

全连接贝叶斯网络

每一对节点之间都有边连接
P(x1,x2,…,xn)=P(xn∣x1,x2,…,xn−1)…P(x2∣x1)P(x1)P(x1,x2,…,xn)=∏i=2nP(xi∣x1,x2,…,xi−1)×P(x1)\begin{aligned} P(x_1, x_2, \dots, x_n)&=P(x_n|x_1, x_2, \dots, x_{n-1})\dots P(x_2|x_1)P(x_1) \\ P(x_1, x_2, \dots, x_n)&=\prod_{i=2}^nP(x_i|x_1, x_2, \dots, x_{i-1})\times P(x_1) \end{aligned} P(x1​,x2​,…,xn​)P(x1​,x2​,…,xn​)​=P(xn​∣x1​,x2​,…,xn−1​)…P(x2​∣x1​)P(x1​)=i=2∏n​P(xi​∣x1​,x2​,…,xi−1​)×P(x1​)​

一般化的贝叶斯网络

  • x1,x2,x3x_1, x_2, x_3x1​,x2​,x3​独立
  • x6x_6x6​和x7x_7x7​在给定条件下独立
  • x1,x2,x3…x7x_1, x_2, x_3\dots x_7x1​,x2​,x3​…x7​的联合分布为:
    p(x1,x2,x3,x4,x5,x6,x7)=p(x1)p(x2)p(x3)p(x4∣x1,x2,x3)p(x5∣x1,x3)p(x6∣x4)p(x7∣x4,x5)p(x_1, x_2, x_3, x_4, x_5, x_6, x_7)=p(x_1)p(x_2)p(x_3)p(x_4|x_1, x_2, x_3)p(x_5|x_1, x_3)p(x_6|x_4)p(x_7|x_4, x_5) p(x1​,x2​,x3​,x4​,x5​,x6​,x7​)=p(x1​)p(x2​)p(x3​)p(x4​∣x1​,x2​,x3​)p(x5​∣x1​,x3​)p(x6​∣x4​)p(x7​∣x4​,x5​)

朴素贝叶斯算法及贝叶斯网络详述相关推荐

  1. 朴素贝叶斯算法实现 | Java | 机器学习 | 贝叶斯

    做的一个结课作业,用Java实现了朴素贝叶斯算法 关于贝叶斯算法可以参考西瓜书.贝叶斯分类器-华校专 设计思路 创建数据类.朴素贝叶斯算法类和验证模型的类. 数据类DataFrame,用来加载和存储数 ...

  2. Python数据分析与机器学习实战<十>贝叶斯算法

    目录 贝叶斯算法概述 贝叶斯要解决的"逆概"问题 正向概率: 逆向概率:(也就是贝叶斯解决的问题) 为什么使用贝叶斯? 贝叶斯推导实例 贝叶斯公式 贝叶斯--"拼写纠正& ...

  3. 分类算法之贝叶斯网络(Bayesian networks)

    2.1.摘要 在上一篇文章中我们讨论了朴素贝叶斯分类.朴素贝叶斯分类有一个限制条件,就是特征属性必须有条件独立或基本独立(实际上在现实应用中几乎不可能做到完全独立).当这个条件成立时,朴素贝叶斯分类法 ...

  4. 算法杂货铺——分类算法之贝叶斯网络(Bayesian networks)

    算法杂货铺--分类算法之贝叶斯网络(Bayesian networks) 2010-09-18 22:50 by T2噬菌体, 66011 阅读, 25 评论, 收藏, 编辑 2.1.摘要 在上一篇文 ...

  5. 朴素贝叶斯算法--过滤垃圾短信

    文章目录 1. 基于黑名单过滤 2. 基于规则过滤 3. 基于概率统计过滤 4. 总结 上一节我们讲到,如何用位图.布隆过滤器,来 过滤重复数据.今天,我们再讲一个跟过滤相关的问题,如何过滤垃圾短信? ...

  6. 算法高级(43)-过滤垃圾邮件、短信?-朴素贝叶斯算法

    一.算法介绍 朴素贝叶斯算法,简称NB算法,是贝叶斯决策理论的一部分,是基于贝叶斯定理与特征条件独立假设的分类方法. 两个重要概念: 先验概率是指根据以往经验和分析得到的概率,它往往作为"由 ...

  7. 数据挖掘-朴素贝叶斯算法的R实现

    本次为学生时期所写的实验报告,代码程序为课堂学习和自学,对网络程序有所参考,如有雷同,望指出出处,谢谢! 基础知识来自教材:李航的<统计学习方法> 本人小白,仍在不断学习中,有错误的地方恳 ...

  8. 机器学习之朴素贝叶斯算法

    作者:RayChiu_Labloy 版权声明:著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处 目录 贝叶斯公式与朴素贝叶斯算法 贝叶斯公式推导 用机器学习的视角理解贝叶斯公式 NB ...

  9. 机器学习:朴素贝叶斯算法+中文情感分类+python

    朴素贝叶斯中文情感分类 1.写在前面 朴素贝叶斯算法理论在很多博客上已经解释的很详细了,本文就不再叙述,本文注重于算法的应用以及编程实现,在读取前人的博客以及他们的项目应用,本人结合书本<机器学 ...

最新文章

  1. android popupwindow 自定义背景,Android PopupWindow背景半透明兼容方案
  2. jquery获取浏览器版本号_前端为什么弃用jQuery?有这六个原因
  3. CRT中的时间(time_t和tm)
  4. java遍历嵌套二维map输出下标_Map集合嵌套 4种遍历方式
  5. 运营前线1:一线运营专家的运营方法、技巧与实践03 与用户沟通,请避免这6个“坑”!...
  6. 68. 使用Apache的rewrite技术
  7. 最新如何在CentOS6版本上安装Teamviewer
  8. VBA InStr 函数
  9. 语法分析——自顶向下分析方法
  10. 社交网络影响力最大化——贪心算法实现(Python实现)
  11. 音乐Npc弹窗 c#
  12. 用户认证授权系统方案思考
  13. 【子网,超网和掩码】
  14. ARPG游戏设计制作随笔
  15. ant design vue中分页器的使用注意事项
  16. 互联网技术架构——画龙点睛
  17. Yii Framework 开发教程(36) Zii组件-DatePicker示例
  18. 深入剖析虚拟内存工作原理
  19. idea与svn的安装及集成
  20. python手册 apk_python apk签名

热门文章

  1. The table ‘xxxx‘ is full
  2. 失眠脑子一直在想事情,试试这些高质量睡眠小妙招
  3. 智能车竞赛技术报告 |单车拉力组 - 大理工大学- 基于串级控制的智能循迹自形成研究
  4. 复式、别墅、大户型无线wifi覆盖方案
  5. 海康摄像机相关设置资料--官方
  6. 带你探索元宇宙鲜为人知的另一面
  7. 发表SCI有什么好处?如何发表一篇SCI论文?
  8. 牛客网 KY6 手机键盘
  9. Python PyQt5 PySerial 书签备份 2018/12/6
  10. 1168: 账单(指针专题,多实例)