【数据挖掘】贝叶斯信念网络 ( 马尔科夫假设 | 结构 | 有向无环图 | 参数 | 条件概率表 | 案例分析 )
文章目录
- I . 贝叶斯信念网络
- II . 马尔科夫假设
- III . 贝叶斯信念网络 示例 1
- IV . 贝叶斯信念网络 示例 2
- V . 贝叶斯信念网络 联合概率分布计算
- VI . 贝叶斯信念网络 联合概率分布计算 2
- VII . 贝叶斯信念网络 训练过程
I . 贝叶斯信念网络
1 . 属性关联 : 贝叶斯信念网络 允许数据集样本属性 之间存在依赖关系 ;
① 属性概率 : 贝叶斯信念网络中 , 每个节点的概率都可以使用贝叶斯公式计算 ;
② 弧 的 可信度 : 网络中属性之间的 弧 有可信度属性 , 因此将该网络命名为 贝叶斯信念网络 ;
2 . 贝叶斯信念网络 表示方法 :
① 有向无环图 : 使用 有向无环图 表示贝叶斯信念网络 ;
② 随机变量 : 图中的每个节点 , 表示一个随机变量 , 即样本的属性 ;
③ 概率依赖 : 图 ( 有向无环图 ) 中的每条 弧 表示一个概率依赖 , 即样本的一个属性 , 依赖与另外一个属性 ;
④ 属性概率依赖 : ZZZ 属性依赖与 XXX 属性 和 YYY 属性 , PPP 属性依赖于 YYY 属性 ; 属性 ZZZ 和 属性 PPP 之间没有依赖关系 ;
特别注意 : 图中一定不能出现环 , 否则就会造成循环依赖 ;
3 . 概率图模型 : 分为 222 大类 , 一类是有向依赖 , 一类是无向关联 ;
贝叶斯信念网络 : 使用 有向无环图 表示 ;
马尔科夫网络 : 使用 无向图模型 表示 ;
II . 马尔科夫假设
模型复杂 : 在 贝叶斯信念网络 中 , 如果考虑属性依赖 , 属性 ZZZ 依赖于 属性 XXX 和 YYY 属性 , 属性 XXX 依赖于 属性 AAA , 属性 AAA 依赖于 ⋯\cdots⋯ 这样就会导致模型过于复杂 ;
马尔科夫假设 : 为了便于计算 , 每个属性只与其直接依赖的属性有关 , 间接依赖的属性没有直接联系 ;
III . 贝叶斯信念网络 示例 1
有家族史 , 抽烟 | 有家族史 , 不抽烟 | 没有家族史 , 抽烟 | 没有家族史 , 不抽烟 | |
---|---|---|---|---|
得肺癌概率 | 0.8 | 0.5 | 0.7 | 0.1 |
不得肺癌概率 | 0.2 | 0.5 | 0.3 | 0.9 |
得肺癌的概率依赖于 是否有家族史 , 是否吸烟 , 两个属性 ;
使用贝叶斯信念网络 的 有向无环图 表示 :
IV . 贝叶斯信念网络 示例 2
贝叶斯信念网络中 每个节点都有一个概率表 ;
贝叶斯信念网络 :
是否有家族病史 属性节点 的 概率表 :
有家族病史概率 | 没有家族病史概率 | |
---|---|---|
有家族病史 | 0.2 | 0.8 |
是否有高血脂 属性节点 的 概率表 : 高血脂 属性 依赖于 家族病史属性 ;
有高血脂概率 | 没有高血脂概率 | |
---|---|---|
有家族病史 | 0.4 | 0.6 |
没有家族病史 | 0.1 | 0.9 |
是否有高血压 属性节点 的 概率表 : 高血压 属性 依赖于 高血脂属性 和 家族病史属性 ;
有高血压概率 | 没有高血压概率 | |
---|---|---|
有家族病史 , 有高血脂 | 0.9 | 0.1 |
有家族病史, 没有高血脂 | 0.4 | 0.6 |
没有家族病史 , 有高血脂 | 0.4 | 0.6 |
没有家族病史 , 没有高血脂 | 0.1 | 0.9 |
V . 贝叶斯信念网络 联合概率分布计算
计算上述示例 222 中 :
使用贝叶斯公式计算 ,有 家族病史 , 高血脂 , 高血压 , 三个属性的联合概率分布 ;
P(有家族史,有高血脂,有高血压)=P(有家族史)×P(有高血脂∣有家族史)×P(有高血压∣有高血脂,有家族史)=0.2×0.4×0.9=0.072\begin{array}{lcl} P(有家族史 , 有高血脂 , 有高血压) & = & P( 有家族史 ) \times P( 有高血脂 | 有家族史 ) \times P ( 有高血压 | 有高血脂 , 有家族史 ) \\\\ &=& 0.2 \times 0.4\times 0.9 \\\\ &=& 0.072 \end{array}P(有家族史,有高血脂,有高血压)===P(有家族史)×P(有高血脂∣有家族史)×P(有高血压∣有高血脂,有家族史)0.2×0.4×0.90.072
P(有家族史)P( 有家族史 )P(有家族史) 表示有家族史 的概率 ;
P(有高血脂∣有家族史)P( 有高血脂 | 有家族史 )P(有高血脂∣有家族史) 表示有家族史 , 并且有高血脂的概率 ;
P(有高血压∣有高血脂,有家族史)P ( 有高血压 | 有高血脂 , 有家族史 )P(有高血压∣有高血脂,有家族史) 表示同时有家族史 和 高血脂 时 , 有高血压的概率 ;
VI . 贝叶斯信念网络 联合概率分布计算 2
计算 高血压 由 家族史引起的概率 :
① 即计算有家族史时 , 多大概率有高血压 :
P(有高血压∣有家族史)=P(有高血压,有家族史)/P(有家族史)\begin{array}{lcl} P(有高血压 | 有家族史) &=& P( 有高血压 , 有家族史 ) / P(有家族史)\\\\ \end{array}P(有高血压∣有家族史)=P(有高血压,有家族史)/P(有家族史)
② 概率表中没有 P(有高血压,有家族史)P( 有高血压 , 有家族史 )P(有高血压,有家族史) 概率 , 需要计算 :
P(有高血压,有家族史)=P(有高血压,有家族史,有高血脂)+P(有高血压,有家族史,无高血脂)P( 有高血压 , 有家族史 ) = P( 有高血压 , 有家族史 , 有高血脂 ) + P( 有高血压 , 有家族史 , 无高血脂 )P(有高血压,有家族史)=P(有高血压,有家族史,有高血脂)+P(有高血压,有家族史,无高血脂)
③ 概率表中没有 P(有高血压,有家族史,有高血脂)P( 有高血压 , 有家族史 , 有高血脂 )P(有高血压,有家族史,有高血脂) 概率 , 需要计算 ;
P(有家族史,有高血脂,有高血压)=P(有家族史)×P(有高血脂∣有家族史)×P(有高血压∣有高血脂,有家族史)=0.2×0.4×0.9=0.072\begin{array}{lcl} P(有家族史 , 有高血脂 , 有高血压) & = & P( 有家族史 ) \times P( 有高血脂 | 有家族史 ) \times P ( 有高血压 | 有高血脂 , 有家族史 ) \\\\ &=& 0.2 \times 0.4\times 0.9 \\\\ &=& 0.072 \end{array}P(有家族史,有高血脂,有高血压)===P(有家族史)×P(有高血脂∣有家族史)×P(有高血压∣有高血脂,有家族史)0.2×0.4×0.90.072
④ 概率表中没有 P(有高血压,有家族史,无高血脂)P( 有高血压 , 有家族史 , 无高血脂 )P(有高血压,有家族史,无高血脂) 概率 , 需要计算 ;
P(有高血压,有家族史,无高血脂)=P(有家族史)P(无高血脂∣有家族史)P(有高血压∣无高血脂,有家族史)=0.2×0.6×0.4=0.048\begin{array}{lcl} P( 有高血压 , 有家族史 , 无高血脂 ) &=& P(有家族史) P(无高血脂 | 有家族史) P ( 有高血压 | 无高血脂 ,有家族史 ) \\\\ &=& 0.2 \times 0.6 \times 0.4 \\\\ &=& 0.048 \end{array}P(有高血压,有家族史,无高血脂)===P(有家族史)P(无高血脂∣有家族史)P(有高血压∣无高血脂,有家族史)0.2×0.6×0.40.048
⑤ 计算 P(有高血压,有家族史)P( 有高血压 , 有家族史 )P(有高血压,有家族史) 公式 ② 结果 : 将 ③ 和 ④ 中的计算结果代入到 ② 公式中 :
P(有高血压,有家族史)=P(有高血压,有家族史,有高血脂)+P(有高血压,有家族史,无高血脂)=0.048+0.072=0.12\begin{array}{lcl} P( 有高血压 , 有家族史 ) &=& P( 有高血压 , 有家族史 , 有高血脂 ) + P( 有高血压 , 有家族史 , 无高血脂 ) \\\\ &=& 0.048 + 0.072 \\\\ &=& 0.12 \end{array}P(有高血压,有家族史)===P(有高血压,有家族史,有高血脂)+P(有高血压,有家族史,无高血脂)0.048+0.0720.12
⑥ 计算公式 ① 结果 :
P(有高血压∣有家族史)=P(有高血压,有家族史)/P(有家族史)=0.120.2=0.6\begin{array}{lcl} P( 有高血压 | 有家族史 ) &=& P( 有高血压 , 有家族史 ) / P(有家族史)\\\\ \\\\ &=& \dfrac{0.12}{0.2} \\\\ &=& 0.6 \end{array}P(有高血压∣有家族史)===P(有高血压,有家族史)/P(有家族史)0.20.120.6
⑦ 结果 : 如果有家族史 , 得高血压的概率是 0.60.60.6 ;
VII . 贝叶斯信念网络 训练过程
1 . 贝叶斯信念网络 模型 使用过程 : 给出训练集 , 通过学习 , 获得 贝叶斯信念网络 , 通过 贝叶斯信念网络 可以推断某个事件发生的概率 ;
2 . 贝叶斯信念网络由 结构 和 参数组成 ;
① 贝叶斯信念网络 结构 : 有向无环图 ;
② 贝叶斯信念网络 参数 : 描述样本间属性依赖关系 , 即每个属性节点对应的条件概率表 ;
3 . 贝叶斯信念网络 机器学习过程 :
① 结构学习 : 确定贝叶斯网络的结构 , 得到有向图 ; 简单的问题可以由人工给出 , 复杂的结构 , 需要计算机给出 ;
② 参数学习 : 最终目的是得到该属性节点的条件概率表 ;
- 贝叶斯网络 BBB , 结构 GGG , 参数 Θ\ThetaΘ , 贝叶斯信念网络可以表示成 B=<G,Θ>B=<G, \Theta>B=<G,Θ> ;
- 结构 BBB 是有向无环图 , 每个节点都代表样本的一个属性 ;
- 如果两个属性由依赖关系 , 使用 有向弧 连接起来 , 箭头由被依赖属性节点 , 指向需要依赖的属性 ;
【数据挖掘】贝叶斯信念网络 ( 马尔科夫假设 | 结构 | 有向无环图 | 参数 | 条件概率表 | 案例分析 )相关推荐
- 【海量数据挖掘/数据分析】之 贝叶斯信念网络(贝叶斯信念网络、有向无环图、贝叶斯公式、贝叶斯信念网络计算实例)
[海量数据挖掘/数据分析]之 贝叶斯信念网络(贝叶斯信念网络.有向无环图.贝叶斯公式.贝叶斯信念网络计算实例) 目录 [海量数据挖掘/数据分析]之 贝叶斯信念网络(贝叶斯信念网络.有向无环图.贝叶斯公 ...
- 从贝叶斯理论到马尔可夫随机场(MRF)--以图像分割为例
从贝叶斯理论到马尔可夫随机场--以图像分割为例 马尔可夫随机场(CRF) 图像分割过程 Matlab代码实现 Python实现代码 参考文献 本文主要介绍马尔可夫随机场及其在图像分割中的应用.基于马尔 ...
- 【转】贝叶斯网络+马尔科夫毯 简介
原文地址:http://blog.csdn.net/memory513773348/article/details/16973807 简介 贝叶斯网络(Bayesian network),又称信念网络 ...
- 【网络时间同步】基于马尔科夫随机场最大后验估计和Gardner环的无线传感器网络时间同步算法matlab仿真
1.软件版本 matlab2021a 2.本算法理论知识 通过一种基于马尔科夫随机场的最大后验估计方法对无线传感器网络中不相邻的两个接收节点在多个参考广播消息条件下的相位偏差进行估计,然后通过Gard ...
- 【深度】从朴素贝叶斯到维特比算法:详解隐马尔科夫模型
详解隐马尔科夫模型 作者:David S. Batista 选自:机器之心 本文首先简要介绍朴素贝叶斯,再将其扩展到隐马尔科夫模型.我们不仅会讨论隐马尔科夫模型的基本原理,同时还从朴素贝叶斯的角度讨论 ...
- PRML第八章读书笔记——Graphical Models 生成式模型/超先验/层次贝叶斯模型、d-分离/朴素贝叶斯、有向分解/马尔可夫毯、D图I图完美图、马尔科夫链/因子图/和积算法/最大和算法
(终于读到概率图了,从这一章开始应该算是PRML的精华内容了.过于基础的东西就不写了,主要写自己不会的) 目录 8.1 Bayesian Networks P365 祖先采样法ancestral sa ...
- 马尔科夫逻辑网(译文)
马修 理查德森(mattr@cs.washington.edu) 和佩德罗 多明戈斯 (pedrod@cs.washington.edu) 美国西雅图华盛顿大学计算机科学工程系WA 98195-250 ...
- 条件随机场(CRF)和隐马尔科夫模型(HMM)最大区别在哪里?CRF的全局最优体现在哪里?
作者:尔总的马甲 链接:https://www.zhihu.com/question/53458773/answer/554436625 来源:知乎 著作权归作者所有.商业转载请联系作者获得授权,非商 ...
- 深入浅出的马尔科夫入门文章
http://blog.csdn.net/pipisorry/article/details/46618991 生成模式(Generating Patterns) 1.确定性模式(Determinis ...
最新文章
- Kernel i2c gpio spi pinctrl platform 分析讲解 (未完待续)
- Google advertiser api开发概述——部分失败
- php渲染页面简单例子,微信小程序如何渲染html内容(示例讲解)
- php gd 缩略图,[PHP GD库]①0--缩略图封装
- 前后端分离开发模式下后端质量的保证 —— 单元测试
- GitHub 60000+ Star 登顶,命令行的艺术!
- eclipse和mysql创建ssm_Eclipse下SSM项目的搭建
- I/O端口及其寻址方式
- Linux 切换用户
- mysql 分组 列转行_MySQL数据库的分组操作,语句拼接,列转行操作
- java求抽象类shape_java 抽象类 Shape
- 如何在万网注册域名及域名解析?
- 浏览器安全级别怎么设置,设置浏览器安全级别的方法
- mysql导出一个数据库的结构及遇到的问题
- 5.zookeeper集成Java项目curator客户端
- 捡了西瓜丢芝麻——注意编程细节
- 从打游戏的显卡到科学先锋,一篇文章读懂异构计算
- MySQL所有的字段类型,可能是最全的字段类型说明
- 开展计算机课程的目的,信息工程学院开展“计算机应用基础”课程教学研讨会...
- 搭建短视频被动收益系统的资源网站,实现月入过万
热门文章
- 后盾网lavarel视频项目---laravel 使用laracasts/flash插件提示信息
- 【ubuntu】ubuntu16.04的虚拟机突然打不开terminal了
- jsp(3,6,9) EL表达式及JSTL
- 14个最常见的Kafka面试题及答案【转】
- 在Python中用Selenium执行JavaScript
- UpdatePanel 内的RadioButton 还是会刷新页面
- 第二次冲刺团队进展报告七
- microsoft visual sourcesafe explorer 获取不了文件夹的解决方法
- 发票管理及打印系统的部分代码
- springMVC文件下载