在介绍朴素贝叶斯和贝叶斯信念网络之前,我们首先得知道其中涉及到的相关概念和背景知识。

概念和背景知识

条件概率

条件概率就是指已知事件B发生的条件下,事件A发生的概率(即事件A在事件B发生下的条件概率) ,记为

根据上面的Venn 图可以很容易清楚地知道,在事件B发生的情况下,事件A发生的概率等于P(A∩B)除以P(B),所以条件的公式即为:

全概率公式

出了条件概率之外,还有可能会用到全概率公式。所以,我们简单介绍一下全概率公式。

假定样本空间S,是两个事件A与A'所构成。如下图:

然后在这个样本空间S中,任意一个事件B,如下图:

那么,对于事件B,它发生的概率就等于事件A和B同时发生的概率与事件A'和事件B同时发生的概率之和,即

由之前的条件概率公式可以得出A和B同时发生的概率:

所以,任意事件B的概率可以下次如下形式:

同理,可以推广到由n个事件构成的样本空间:

贝叶斯公式

对条件概率进行变形可以得到,对于任何事件A满足:P(Ai|B)P(B)=P(B|Ai)*P(Ai),即P(Ai|B)=P(B|Ai)*P(Ai)/P(B)

由全概率公式

替换条件概率中的P(B),得到下面的贝叶斯公式:

我们把贝叶斯公式中的P(Bi)称作时间Bi的先验概率,这是一种事件发生前的预判概率,一般基于先验知识。

而P(A|Bi)是在Bi事件发生的条件下事件A发生的概率(条件概率,这也是一种后验概率)

P(Bi|A)是在事件A发生条件下事件Bi发生的概率(条件概率,这也是一种后验概率,这一般使我们求解的目标)

属性条件独立性假设

对已知类别,假设所有属性相互独立。或者说,假设每个属性独立地对分类结果发生影响。

如果两个事件A和B是相互独立的,那么有:

X可以写成:

故p(c|x)可写成:

注意p(x)=

由于分母是常量,与c无关,故我们计算c的各种取值的可能性时并不会对各结果的相对大小产生影响。因此可以忽略。

贝叶斯分类算法原理

朴素贝叶斯分类器

贝叶斯信念网络

贝叶斯信念网络,简称贝叶斯网络。它是由一个有向无环图和一个条件概率表所组成。其中,有向无环图是表示一组随机变量以及它们之间的条件依赖关系,每个结点代表一个随机变量,每条弧代表一个概率依赖。如果一条弧由结点X到Y,则X是Y的双亲或直接前驱,而Y是Z的后继。

条件概率表则是用来描述属性之间的联合概率分布。

举个例子吧:

上图中的西瓜问题的一种贝叶斯网结构和属性" 根蒂"的条件概率表。从图中网络结构可看出,而"根蒂"则直接依赖于"甜度"。进一步从条件概率表能得到"根蒂"对"甜度"的依赖关系,如P(根蒂=硬挺|甜度=高) =0.1。

贝叶斯网结构有效地表达了属性间的条件独立性。贝叶斯信网络的一个重要性质描述了各随机变量(节点)之间的条件独立假设给定某一节点的双亲,则该随机变量条件独立于有向无环图中所有它的非后代。

如果是上面这个例子,则:

x3和x4在给定x1的取值时独立,x4和x5在给定x2的取值时独立。

构造训练贝叶斯网络分为以下两步(也就是说,给你一个训练元组,要用贝叶斯信念网络进行分类,需要做的事):

(1)确定随机变量间的拓扑关系,形成DAG。这一步通常需要领域专家完成,而想要建立一个好的拓扑结构,通常需要不断迭代和改进才可以。

(2)训练贝叶斯网络。这一步也就是要完成条件概率表的构造,如果每个随机变量的值都是可以直接观察的,那么这一步的训练是直观的,方法类似于朴素贝叶斯分类。但是通常贝叶斯网络中存在隐藏变量节点,那么训练方法就是比较复杂,例如可使用梯度下降法

机器学习教程之朴素贝叶斯、贝叶斯信念网络相关推荐

  1. 机器学习入门:第十九章 深度信念网络

    深度信念网络 (Deep Belief Network, DBN) 深度信念网络 (Deep Belief Network, DBN) 由 Geoffrey Hinton 在 2006 年提出.它是一 ...

  2. 《机器学习实战》朴素贝叶斯

    机器学习实战的朴素贝叶斯一章中的源文件老是提示 IndexError: range object index out of range 看源码里怎么都不会溢出啊,除非minLen为0:所以看了下测试集 ...

  3. 04机器学习实战之朴素贝叶斯

    朴素贝叶斯 概述 贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类.本章首先介绍贝叶斯分类算法的基础--贝叶斯定理.最后,我们通过实例来讨论贝叶斯分类的中最简单的一种: ...

  4. 实现贝叶斯分类器_机器学习实战项目-朴素贝叶斯

    朴素贝叶斯 概述 贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类.本章首先介绍贝叶斯分类算法的基础--贝叶斯定理.最后,我们通过实例来讨论贝叶斯分类的中最简单的一种: ...

  5. 机器学习实战之朴素贝叶斯

    机器学习实战之朴素贝叶斯 一.朴素贝叶斯算法概述 1.贝叶斯决策理论 2.条件概率 3.全概率公式 4.贝叶斯推断 5.朴素贝叶斯推断 二.实战 三.总结 1.朴素贝叶斯推断的一些优点: 2.朴素贝叶 ...

  6. 机器学习面试题——朴素贝叶斯

    机器学习面试题--朴素贝叶斯 提示:这些知识点也是大厂笔试经常考的题目,我记得阿里和京东就考!!!想必在互联网大厂就会用这些知识解决实际问题 朴素贝叶斯介绍一下 朴素贝叶斯优缺点 贝叶斯公式 朴素贝叶 ...

  7. 机器学习:基于朴素贝叶斯对花瓣花萼的宽度和长度分类预测

    机器学习:基于朴素贝叶斯对花瓣花萼的宽度和长度分类预测 作者:i阿极 作者简介:Python领域新星作者.多项比赛获奖者:博主个人首页

  8. 机器学习实验:朴素贝叶斯算法

    机器学习实验:朴素贝叶斯算法 问题如下: 根据给出的算法naivebayes.py,实现: 1.将数据集文件naivebayes_data.csv中的数据替换成14天打球与天气数据: 2.预测样本{O ...

  9. 机器学习题库整理 通俗理解贝叶斯方法和贝叶斯网络

    1 贝叶斯方法长久以来,人们对一件事情发生或不发生的概率,只有固定的0和1,即要么发生,要么不发生,从来不会去考虑某件事情发生的概率有多大,不发生的概率又是多大.而且概率虽然未知,但最起码是一个确定的 ...

  10. 独家 | 贝叶斯信念网络初探(附链接)

    作者:Jason Brownlee 翻译:陈超 校对:欧阳锦 本文约3500字,建议阅读8分钟 本文共分为5部分,从概率模型的挑战.概率模型--贝叶斯信念网络.如何建立和使用贝叶斯网络.贝叶斯网络范例 ...

最新文章

  1. 中兴c600olt数据配置_中兴上架Blade 20smart孝心版
  2. Linux实时查看进程命令top笔记
  3. 整理了Kafka的一些常用工具,建议收藏备用!| 博文精选
  4. MongoDB服务无法注册
  5. ubuntun opencv 编译成64_19、OpenCV图像平滑处理
  6. BlocksKit源码分析(一)
  7. linux 串口内核加载,linux对串口编程的详解(从应用层到内核驱动,包括232,485)
  8. [曲线拟合]使用Tensorflow拟合COS函数
  9. win10摄像头可以用计算机里不显示,win10打开计算机如何显示摄像头
  10. Cortex m0+笔记
  11. 高一计算机课期中考试总结反思,期中考试总结与反思(精选25篇)
  12. 地壳中元素含量排名记忆口诀_地理知识十大趣味记忆方法
  13. 华为云数据迁移工具解决方案:腾讯云迁移到华为云
  14. python英语单词 扇贝英语安卓下载_扇贝单词英语版手机版|扇贝单词英语版安卓版下载 v3.6.402 - 跑跑车安卓网...
  15. 德州市德城区农产品区域公用品牌“尚德诚品”正式发布
  16. 教育培训机构怎么做推广?有什么好建议?
  17. 杨辉三角(Python-动态规划)
  18. html制作过程总结经验,网页基础制作教程:学习HTML经验总结
  19. 强化学习(Reinforcement Learning)入门学习--01
  20. Android:安卓实现高考倒计时功能

热门文章

  1. CMSC5724-数据挖掘之VC维、Shatter、VC-dim以及Margin有关的通理
  2. MS发起的PDP上下文激活过程----PPP和PDP激活是什么区别
  3. 支持2018的ibm服务器,联想支持Win10 2018年4月更新(RS4版本1803)的机型
  4. 如何制作 Windows 系统主题?
  5. 【雕爷学编程】Arduino动手做(108)---GY-521三轴模块
  6. 每日一记录,2022年1月5日
  7. NVIDIA GPU Compute Capability解释
  8. 考研笔记——王道C语言
  9. 工信部发布2015年中国软件业务收入百强发展报告(zz)
  10. 怎么查看电脑配置详情