回顾

在文章《朴素贝叶斯》中,小夕为大家介绍了朴素贝叶斯模型的基本知识,并且得出了朴素贝叶斯是利用联合概率P(x1,x2,x3...xn,y)来确定某个样本为某个类别的概率,进而利用最大后验概率(MAP)来决策类别。也就是说,朴素贝叶斯的假设函数如下:

其中,假设有c个类别,则i=1,2,...,c。(补充:argmax大家应该都熟悉了吧,意思就是返回使函数值最大的参数,这里的函数即P(X,yi),参数即yi。)

其中,根据朴素贝叶斯的条件独立性假设,联合概率被简化为

我们想啊,朴素贝叶斯也是个模型,神经网络也是个模型。然而神经网络的粉丝们就给神经网络画出了图,还画的辣么好看~而作为朴素贝叶斯粉丝的小夕当然也要给朴素贝叶斯模型画个图啊,把我家朴素贝叶斯描述的活灵活现,漂漂亮亮嗒~

画像

如图,小夕将每一个随机变量(即X中的每个维度xi和类别y)画成一个圈圈,这个圈圈就代表这个随机变量。

然后用一条有向边来表示随机变量之间的条件关系,比如P(x1|y),它表示“如果能观测到y,那么x1的概率分布函数就确定了(当然了,x1的概率分布函数就是x1取各个值时的概率,所组成的函数)”。简单来说就是给定(观测到)y的取值,就知道了x1的情况。所以用箭头表示这个关系:

所以,朴素贝叶斯的假设函数(准确讲是假设函数的核心)即:

看~这个图是不是把公式

非常形象的画出来啦~

这个图,我们暂且就定义为有向图,反正根据小夕的说法,它描绘了“各个随机变量之间的条件依赖关系”(看起来像推理关系)。

想一想这个图还有没有隐含含义呢?

机智的宝宝肯定想到了朴素贝叶斯的条件独立性假设!没错!这个图还反映了“每个随机变量的独立性关系”(看起来像每个随机变量的爸爸妈妈是谁,子女是谁)。

看,有了独立性关系这个解释,是不是又把朴素贝叶斯的条件独立性假设包含进来啦。回顾一下,朴素贝叶斯假设样本的特征向量的各个维度之间是互相独立的(即x1,x2,...,xn之间是相互独立的),所以在这个图中,它们之间没有连线,表示相互独立。

贝叶斯网

想一想,小夕已经“吐槽”过了,朴素贝叶斯很朴素,因为它做了一个很不靠谱的输入变量xi之间相互独立的这个假设,因此小夕在《NB与LR的战争》中还建议大家去做一个将X的维度原地复制成两倍的实验,以验证这个独立性假设的不靠谱之处。

想象一下,假设我们有一个预测某教授会不会给一个学生写一封好的保研推荐信的机器学习任务。

在这个任务中,类别即两个:会,或者不会,给这个学生写推荐信。特征我们选取4个:学生的x1=智商,x2=学生在这个老师的课的考试分数,x3=这个老师的课的考试难度,x4=这个学生的SAT(美国版高考)成绩。

(该例子来自《probablistic graphicalmodel》Kolleretc.)

显然啊,x1和x3联合起来会很大程度上决定x2的值,x1会很大程度决定x4的值,而让老师去写推荐信的时候,老师只会看到你在他的课上考了多少分以及老师此刻的心情来决定是否给你写个好推荐信。然而用朴素贝叶斯建模的话,显然这些客观存在的依赖关系全都被忽略掉了,可想而知往往结果很糟糕。

那么,我们可不可以保留这些客观存在的依赖关系呢?

想想刚才小夕为朴素贝叶斯画的图~我们就按照这个画图规则把进化版的模型画出来吧!

(x1=学生智商, intelligence;

x2=老师课的分数, score;

x3=课程难度, difficulty;

x4=SAT分数, SAT;

y=是否写好推荐信, letter)

看!对不对呢~按照前面说的画图原则,这个图是不是将客观存在的信息都描绘进去啦~

看起来像这个样子的模型叫什么呢?就是“贝叶斯网”!

也就是说:在贝叶斯网中,我们会建模样本的特征向量X内各个维度之间的依赖关系,并且隐含的包含了各个随机变量(X的各个维度以及y)的独立性关系(之所以说隐含,是因为在贝叶斯网络中,好像无法像朴素贝叶斯一样一眼看出变量之间的独立性关系,比如观测到x2时,你能知道此时y和x1是否是相互独立的吗?)

 

将这个模型训练完成之后,它看起来的样子是这样的(跟前面小夕画的图完全对应的):

(直接抠的书上的图\(//∇//)\)

于是按照机器学习框架,一大波问题袭来了:

1、这个模型如何训练?

2、这个模型如何对新样本分类?

除了这些一般化问题之外,还有前面提到的看似更复杂的问题:

贝叶斯网中隐含的各个随机变量的独立性关系如何描述?

 

小夕会在以后的文章中为大家逐步解开谜团~

 

ps:当然啦,这种画法肯定不是小夕首先提出来的,有兴趣的同学可以去看这篇论文(好像也不是这个论文的作者第一次提出来的):

Charles Sutton, Andrew McCallum: An Introduction toConditional Random Fields for Relational Learning.

除了这篇论文外,参考资料还有《probablistic graphical model》Koller etc.这本书有中文版~据说翻译的不错。不过要小心1000多页的块头哦。

从朴素贝叶斯到贝叶斯网相关推荐

  1. 朴素贝叶斯与贝叶斯网络

    朴素贝叶斯与贝叶斯网络 标签(空格分隔): 机器学习 朴素贝叶斯 朴素贝叶斯朴素在哪里呢? -- 两个假设 一个特征出现的概率与其他特征(条件)独立: 每个特征同等重要. 朴素贝叶斯分类器 \(P(c ...

  2. 贝叶斯系列——贝叶斯定理、贝叶斯决策、朴素贝叶斯、贝叶斯网络、贝叶斯滤波器

    写一个贝叶斯系列,整理一下贝叶斯定理.贝叶斯决策.朴素贝叶斯.贝叶斯网络.贝叶斯滤波器 众所周知,概率分为两个学派,频率学派(大数定理)和贝叶斯学派(贝叶斯公式),我们不去判断哪个学派说的更对,但是在 ...

  3. 从朴素贝叶斯分类器到贝叶斯网络(下)

    从朴素贝叶斯分类器到贝叶斯网络(下) 2016年01月04日 00:49:20 阅读数:11673 书接上文 :从朴素贝叶斯分类器到贝叶斯网络(上) 三.贝叶斯网络 贝叶斯网络(Bayesian Ne ...

  4. 贝叶斯定理 php,朴素贝叶斯及贝叶斯网络简介

    贝叶斯网络 贝叶斯网络的定义 贝叶斯网络(Bayesian network),又称信念网络(Belief Network),或有向无环图模型(directed acyclic graphical mo ...

  5. 贝叶斯条件概率/贝叶斯网络

    一.TL;DL 条件概率的公式:P(AB)=P(A)P(B|A)=P(B)P(A|B):即事件A和事件B同时发生的概率等于在发生A的条件下B发生的概率乘以A的概率. 贝叶斯公式:由条件概率公式推导出 ...

  6. 贝叶斯方法和贝叶斯网络

    从贝叶斯方法谈到贝叶斯网络 0 引言 看到July的这篇文章,觉得写得很好,所以转载过来,留着慢慢看.原地址:https://blog.csdn.net/v_july_v/article/detail ...

  7. 机器学习题库整理 通俗理解贝叶斯方法和贝叶斯网络

    1 贝叶斯方法长久以来,人们对一件事情发生或不发生的概率,只有固定的0和1,即要么发生,要么不发生,从来不会去考虑某件事情发生的概率有多大,不发生的概率又是多大.而且概率虽然未知,但最起码是一个确定的 ...

  8. 贝叶斯推断 | 贝叶斯线性回归

    入门好文: 贝叶斯推断 贝叶斯推断及其互联网应用(一):定理简介 作为一个非统计专业的人,着实是被贝叶斯思想折磨了很久,常见的公式都能倒背如流,但依旧无法理解其精神内核. 近日,有高人指点,自己再查了 ...

  9. 吉布斯采样和梅特罗波利斯-黑斯廷斯算法

    吉布斯采样 吉布斯采样(英语:Gibbs sampling)是统计学中用于马尔科夫蒙特卡洛(MCMC)的一种算法,用于在难以直接采样时从某一多变量概率分布中近似抽取样本序列.该序列可用于近似联合分布. ...

  10. 伊恩斯普里格斯3D肖像的秘密

    Ian Spriggs将细节注意到了Next 级别.在他最近的作品的幕后,看看大师如何通过构图和细节讲述故事. 伊恩斯普里格斯的3D人物肖像不仅穿越了不可思议的山谷,他们大胆地跳过了另一边而欢欣鼓舞. ...

最新文章

  1. 一年六篇顶会的清华大神提出Fastformer:史上最快、效果最好的Transformer
  2. java免安装工具包_Java1.8安装及环境变量配置
  3. openstack icehouse版本glance上传镜像
  4. 匿名函数:lambda函数简述
  5. PHP 的 Phar 包原来性能这么强!
  6. 数据结构:详解KMP算法,手工求解next、nextval数组,求模式串的比较次数例题
  7. 十五步骤手把手学会制作网吧XP母盘制作
  8. TCP 连接中的TIME_WAIT
  9. 基于Java+SpringBoot+vue+element实现家具购物销售网站详细设计和实现
  10. python帮助文档在哪_python文档之查看帮助文档方法
  11. 有多少人自驾过独库公路?
  12. Linux常用命令参考手册02
  13. 3h精通OpenCV(四)-绘制形状与文本
  14. go interface类型转换_图解Go的unsafe.Pointer
  15. 身份证归属地信息查询接口
  16. 让国内顶尖程序员社区“牛客网”低头的这份Java面试手册真的强
  17. 微信如何屏蔽别人发来的消息,如何屏蔽微信消息
  18. 既然心动,那就赶快行动吧!
  19. 零基础也能看懂的五大网络安全技术,学网络真的可以很简单
  20. 新媒体工作者必备常识

热门文章

  1. 成功:选择比努力更重要,智慧比勤奋更重要
  2. linux Swap交换分区概念
  3. 这不是商业互吹,是学习的宝藏
  4. ARM寄存器及功能介绍/R0-R15寄存器
  5. c语言编辑的库存管理软件,C语言课程设计,商品库存管理系统怎么做啊?
  6. java 动态转换器,Java 编程的动态性,第 5 部分: 动态转换类
  7. 每日一题(1) —— 数组计算
  8. 51单片机——硬件基础
  9. mysql查询没有权限试图_MySQL迁移后提示查询view权限不足的处理
  10. bcp 不能调用where 子句_MySQL中IS NULL、IS NOT NULL、!=不能用索引?胡扯!