文章目录

  • 0. 前言
  • 1. 有向模型
  • 2. 无向模型
  • 3. 因子图
  • 4. 分离和d-分离
  • 5. 从图模型中采样

如果这篇文章对你有一点小小的帮助,请给个关注,点个赞喔,我会非常开心的~

花书+吴恩达深度学习(二三)结构化概率模型(贝叶斯网络、马尔可夫网络)
花书+吴恩达深度学习(二四)蒙特卡罗方法(重要采样,MCMC)
花书+吴恩达深度学习(二五)直面配分函数(CD, SML, SM, RM, NCE)
花书+吴恩达深度学习(二六)近似推断(EM, 变分推断)

0. 前言

结构化概率模型使用图来描述随机变量之间的直接相互作用,从而描述概率分布

每一个节点代表一个随机变量,每一条边代表一个直接相互作用。

结构化概率模型的优点是,它们能够显著降低表示概率分布、学习和推断的成本

有向模型和无向模型的区别是:有向模型通过从起始点的概率分布直接定义,无向模型通过ϕ\phiϕ函数转换为概率分布而定义

1. 有向模型

有向图模型(directed graphical model)又被称为信念网络(belief network)或贝叶斯网络(Bayesian network)。

所有边都是有方向的,箭头所指的方向表示随机变量的概率分布是由其他随机变量决定的。

概率分布表示为:
p(x)=∏ip(xi∣Pag(xi))p(x)=\prod_{i}p(x_i\mid Pag(x_i)) p(x)=i∏​p(xi​∣Pag(xi​))
其中,Pag(xi)Pag(x_i)Pag(xi​)表示xix_ixi​的所有父节点。

例如下图所示(图源:深度学习):

t1t_1t1​依赖于t0t_0t0​,t2t_2t2​直接依赖于t1t_1t1​,间接依赖于t0t_0t0​,p(t0,t1,t2)=p(t0)p(t1∣t0)p(t2∣t1)p(t_0,t_1,t_2)=p(t_0)p(t_1\mid t_0)p(t_2\mid t_1)p(t0​,t1​,t2​)=p(t0​)p(t1​∣t0​)p(t2​∣t1​)。

只要图中的每个变量都只有少量的父节点,那么分布就可以用较少的参数表示。

2. 无向模型

无向模型(undirected model)又被称为马尔可夫随机场(Markov random field)或马尔可夫网络(Markov network)。

无向模型适用于当变量间相互作用并没有本质性的指向,或者明确的双向作用时。

无向图中每一个团(节点的子集)CCC都有一个因子(团势能)ϕ(C)\phi(C)ϕ(C),未归一化概率分布
p~(x)=∏C∈gϕ(C)\tilde{p}(x)=\prod_{C\in g}\phi(C) p~​(x)=C∈g∏​ϕ(C)
归一化概率分布
p(x)=1Zp~(x)Z=∫p~(x)dxp(x)=\frac{1}{Z}\tilde{p}(x)\\ Z=\int \tilde{p}(x)dx p(x)=Z1​p~​(x)Z=∫p~​(x)dx
当函数ϕ\phiϕ固定时,可以把ZZZ当成一个常数,归一化常数ZZZ被称为配分函数。

无向模型中许多理论都依赖于∀x,p~(x)>0\forall x,\ \tilde{p}(x)>0∀x, p~​(x)>0。

满足条件的简单方式是基于能量的模型 EBM(Energy-based model):
p~(x)=exp⁡(−E(x))\tilde{p}(x)=\exp(-E(x)) p~​(x)=exp(−E(x))
其中,E(x)E(x)E(x)被称作是能量函数。

基于能量的模型中的概率可以无限趋近于0但是永远达不到0.

许多对概率模型的操作不计算pmodel(x)p_{model}(x)pmodel​(x),而是log⁡p~model(x)\log \tilde{p}_{model}(x)logp~​model​(x),该量的负数称为自由能:
F(x)=−log⁡∑hexp⁡(−E(x,h))F(x)=-\log\sum_{h}\exp(-E(x,h)) F(x)=−logh∑​exp(−E(x,h))

3. 因子图

因子图(factor graph)是从无向模型中抽样的另一种方法,可以解决无向模型语法中的模糊性。

通过显式的表示每一个ϕ\phiϕ函数的作用域,如下图所示(图源:深度学习):

4. 分离和d-分离

图中隐含的条件独立性称为分离(separation)。

分离的情况:

  1. 图显式的给定变量集SSS的情况下,变量集AAA和变量集BBB无关
  2. 变量aaa和bbb之间没有路径
  3. 变量aaa和bbb之间的所有路径都包含可观测的变量

不分离的情况:

  1. 变量aaa和bbb之间的路径仅涉及未观测变量

在有向模型中,这些概念被称为d-分离。

d-分离的情况如下图所示(图源:深度学习):

分离和d-分离只能告诉我们图中隐含的条件独立性

5. 从图模型中采样

原始采样的基本思想是将图中的变量xix_ixi​使用拓扑排序。

原始采样通常非常快,并且非常简便。

缺点是其仅适用于有向模型,并且不是每次采样都是条件采样操作。

从无向模型中采样时一个成本很高的多次迭代的过程,理论上最简单的方法是Gibbs采样


如果这篇文章对你有一点小小的帮助,请给个关注,点个赞喔,我会非常开心的~

花书+吴恩达深度学习(二三)结构化概率模型(贝叶斯网络、马尔可夫随机场)相关推荐

  1. 花书+吴恩达深度学习(二九)生成随机网络 GSN

    文章目录 0. 前言 1. 生成随机网络 GSN 如果这篇文章对你有一点小小的帮助,请给个关注,点个赞喔,我会非常开心的~ 花书+吴恩达深度学习(二七)深度生成模型之玻尔兹曼机及其变体(RBM, DB ...

  2. 花书+吴恩达深度学习(二八)深度生成模型之有向生成网络(VAE, GAN, 自回归网络)

    文章目录 0. 前言 1. sigmoid 信念网络 2. 生成器网络 3. 变分自编码器 VAE 4. 生成式对抗网络 GAN 5. 生成矩匹配网络 6. 自回归网络 6.1 线性自回归网络 6.2 ...

  3. 花书+吴恩达深度学习(二六)近似推断(EM, 变分推断)

    文章目录 0. 前言 1. 将推断视为优化问题 1.1 期望最大化 EM 1.2 最大后验推断 MAP 1.3 稀疏编码 2. 变分推断 2.1 离散型潜变量 2.2 连续性潜变量 如果这篇文章对你有 ...

  4. 花书+吴恩达深度学习(二五)直面配分函数(CD, SML, SM, RM, NCE)

    文章目录 0. 前言 1. 对数似然梯度 1.1 朴素 MCMC 算法 1.2 对比散度算法 CD 1.3 随机最大似然 SML 2. 伪似然 3. 得分匹配 SM 4. 比率匹配 RM 5. 去噪得 ...

  5. 花书+吴恩达深度学习(二四)蒙特卡罗方法(重要采样,MCMC)

    文章目录 0. 前言 1. 重要采样 2. 马尔可夫链蒙特卡罗 MCMC 3. 不同峰值之间的混合挑战 如果这篇文章对你有一点小小的帮助,请给个关注,点个赞喔,我会非常开心的~ 花书+吴恩达深度学习( ...

  6. 花书+吴恩达深度学习(二二)自编码器(欠完备,DAE,CAE,PSD)

    文章目录 0. 前言 1. 欠完备自编码器 2. 去噪自编码器 DAE 3. 收缩自编码器 CAE 4. 稀疏自编码器 5. 预测稀疏分解 PSD 如果这篇文章对你有一点小小的帮助,请给个关注,点个赞 ...

  7. 花书+吴恩达深度学习(二十)构建模型策略(超参数调试、监督预训练、无监督预训练)

    目录 0. 前言 1. 学习率衰减 2. 调参策略 3. 贪心监督预训练 4. 贪心逐层无监督预训练 如果这篇文章对你有一点小小的帮助,请给个关注,点个赞喔~我会非常开心的~ 花书+吴恩达深度学习(十 ...

  8. 花书+吴恩达深度学习(十九)构建模型策略(训练模型顺序、偏差方差、数据集划分、数据不匹配)

    目录 0. 前言 1. 调试模型顺序 2. 偏差方差的解决方法 3. 数据集的选取划分 4. 数据不匹配问题 5. 评估指标的选取 6. 贝叶斯最佳误差 如果这篇文章对你有一点小小的帮助,请给个关注, ...

  9. 花书+吴恩达深度学习(十八)迁移学习和多任务学习

    目录 0. 前言 1. 迁移学习 2. 多任务学习 如果这篇文章对你有一点小小的帮助,请给个关注,点个赞喔~我会非常开心的~ 花书+吴恩达深度学习(十八)迁移学习和多任务学习 花书+吴恩达深度学习(十 ...

最新文章

  1. Linux系统下RAID和LVM的实现
  2. python试卷(有答案版本、个人答案不是官方答案)_python试卷(有答案版本,个人答案不是官方答案).doc...
  3. rpm安装mysql报错_【CentOS-65】通过rpm包安装mysql57解决了server报错和mysqld启动报错的问题...
  4. 20140904 atoi字符串转化为整数源码
  5. 金山吹响讨伐灰鸽子的号角
  6. Oracle数据库更新时间的SQL语句
  7. C++之关于虚函数和多态的分析和补充
  8. java中 001_java实现_001,002.............xxx,的功能
  9. VXLAN配置实例(二)——VXLAN跨子网互通
  10. 基金登记过户系统相关
  11. java修改文件的名称_Java修改文件名称
  12. 筛数方法相关系数_EXCEL中如何求一组数据的相关系数
  13. js制作倒计时,天,小时,分,秒
  14. 网络中超难的75道逻辑题及答案
  15. cf游戏进不去计算机,cf更新之后进不去 穿越火线进不去解决方法
  16. 12 年前我刷了 500 道,谈谈我的学习感受
  17. mysql vb.net odbc_在VB.net中连接MySql的类库_MySQL
  18. 计算机逻辑结构,计算机的逻辑结构.ppt
  19. 【百日刷题计划 第一天】——熟悉语法 语法基础题
  20. openwrt的luci应用ipk包开发(一)

热门文章

  1. centos安装配置tftp服务器
  2. 【hackerrank】Week of Code 26
  3. 第一百五十天 how can I坚持
  4. 经验备忘2014年01月
  5. 如何高效学习Oracle
  6. 软件工程导论团队介绍——信科吴彦组
  7. 从电视机的角度来看设计模式之命令模式
  8. 通过Instant Client包来使用SQL*PLUS
  9. LeetCode OJ - Surrounded Regions
  10. ORA-28056:Writing audit records to Windows EventLog failed的问题