kl散度度量分布_概率图简要模型笔记(二)马尔可夫随机场与KL散度、最大熵、指数族分布、高斯分布、极大似然分布...
这一篇文章主要是想捋一捋KL散度、最大熵、指数族分布这些东西之间的关系,这是一些非常基本的知识点,刚入门机器学习的时候,傻傻分不清楚,现在回过头来看,其实很多东西都可以串起来,不得不感叹数学真是一个很奇妙的东西。参考资料还是昨天发的视频链接以及结合我研一上的姜峰老师的计算机视觉这门课。
马尔可夫随机场
马尔随机场就是无向图模型,对于无向图而言,它比有向图简单。直观上来说它应该比有向图更简单,而且它应该也和有向图具有相似的性质,尤其是条件独立性和因子分解应该是相互等价的。马尔可夫随机场的独立性一共有三个,分别是:全局独立性、局部独立性以及成对马尔科夫性,三个性质是可以相互推导的。
1.条件独立性:
1).全局马尔可夫性(对应D划分)
集合ABC互不相交,若集合A到集合C的所有路径中至少有一个节点位于B集合中(也就是A集合要想到达C集合必须经过B集合),当B集合被观测到,则集合A和集合C独立,这个性质对应着有向图中的D划分。
2)局部马尔科夫性(对应马尔可夫毯)
在给定相邻节点(b,c,d)的前提下,a节点与其他节点(e, f)相互独立。
3)成对马尔科夫性(与最大团的性质有关)
节点a与节点b是两个不相邻的节点,在除了a节点与b节点以外的节点都被观测到的情况下,a节点与b节点相互独立。
2.因子分解
团:一个关于节点的集合,集合中的节点都是相互连接的。
最大团:在一个团中添加任何一个节点都会破坏团的性质,这样的集合称为最大团。
将马尔可夫随机场分解为多个团之后,就可以写出整个随机变量的概率:
Hammersley-Clifford定理将马尔可夫随机场的条件独立性与因子分解两者联合起来了,并证明了两者是等价的。
从吉布斯自由能到马尔可夫随机场:
马尔可夫随机场的定义(局部马尔可夫性):
能否利用因子分解得到马尔可夫随机场的证明,如果可以,那么就证明可以从因子分解得到马尔科夫随机场。
在观测到
这里最后一步将其转换为在整个变量上的积分,将
这是参考资料[1]给出的,其实观察会发现,引入R这一步的主要作用好像是在最后变为全局变量的时候有用,因此可以写的更简洁一点:
后面从吉布斯分布到马尔可夫随机场的属性推导就确实太难了,可以查看一下参考资料[1]。
KL散度、最大熵、指数族函数、高斯分布、吉布斯分布之间的关系
这里还有一个彩蛋,直觉告诉我们:吉布斯既然表示的是一种能量,能量和熵之间很明显应该是存在某种联系的,数学的美妙就美妙在这里,如果有系统的学习过概率统计的同学应该知道,最大熵可以推出指数族分布,在满足熵最大的条件下,我们推导出的变量分布都是满足指数族分布的,也包括高斯分布,高斯分布就是满足一阶和二阶充分统计量的指数族分布。
变量的吉布斯分布:
这个形式就是指数族分布的形式。接下来推导一下基于熵最大如何得到指数族分布。说到最大熵原理就得提一下计算机视觉得四种先验,对于计算机视觉建模而言,目前主要是存在四种先验规则:1.光滑先验,2.统计规律先验,3.编码稀疏性先验,4.非局部自相似先验。最大熵其实就是统计规律先验。KL散度与最大熵之间是否有联系?其实是有联系的。就把很多思路串联起来了。首先KL散度与熵最大有关,最大熵可以得到指数族分布,吉布斯分布是指数族分布的一种,吉布斯分布用来描述马尔科夫随机场。
从KL散度与熵最大:
写出KL散度:
最小化KL散度:
给定一个模型的熵:
在给定约束条件(给统计量)下:
根据拉格朗日乘子法就等价于:
如果把最后的约束看作是KL散度中的
从熵最大模型推导出指数族函数:
直接对
令倒数为0,得到:
这样就可以得到指数族分布:
由于
这就是指数族函数,指数族分布是机器学习当中一类非常重要的函数,它与很多内容都息息相关,也是自然界中广泛存在的一类概率分布。这样整个东西都串起来了,这是不是就与吉布斯分布类似。
从KL散度到极大似然估计:
这个表达式有两项,第一项是常量,因为它表达的是真实分布,所以式子可以等价为:
将积分换为累加:
这里令
这就得到了极大似然估计:
参考资料:
[1]Hammersley-Clifford定理 https://blog.csdn.net/csuyzt/article/details/81709439
kl散度度量分布_概率图简要模型笔记(二)马尔可夫随机场与KL散度、最大熵、指数族分布、高斯分布、极大似然分布...相关推荐
- 概率图模型(6)马尔科夫随机场
文章目录 概率图模型的综合叙述: 马尔科夫随机场综述: 马尔科夫随机场定义: MRF的因式分解: 一个简单的例子: 概率图模型的综合叙述: 特征函数便是图中的conditional.对图简单的说明,综 ...
- 一次性弄懂马尔可夫模型、隐马尔可夫模型、马尔可夫网络和条件随机场!
1. 马尔可夫网络.马尔可夫模型.马尔可夫过程.贝叶斯网络的区别 相信大家都看过上一节我讲得贝叶斯网络,都明白了概率图模型是怎样构造的,如果现在还没明白,请看我上一节的总结: 贝叶斯网络 这一节我们重 ...
- 一次性弄懂马尔可夫模型、隐马尔可夫模型、马尔可夫网络和条件随机场!(词性标注代码实现)
文章目录 1. 马尔可夫网络.马尔可夫模型.马尔可夫过程.贝叶斯网络的区别 2. 马尔可夫模型 2.1 马尔可夫过程 3. 隐马尔可夫模型(HMM) 3.1 隐马尔可夫三大问题 3.1.1 第一个问题 ...
- 概率图模型(PGM)/马尔可夫随机场(MRF)/条件随机场基本概念(CRF)
概率图模型: 1:为什么引入图模型:一般的问题我们都可以用概率模型去很好的解决,那么为什么又要在概率的基础上加一个图呢?在这里我们引入图结构其实是因为图结构可以将概率模型的结构可视化,应用图这是一种直 ...
- 西瓜书+实战+吴恩达机器学习(二二)概率图模型之马尔可夫随机场
文章目录 0. 前言 1. 马尔可夫随机场结构 2. 近似推断 2.1. Metropolis-Hastings 如果这篇文章对你有一点小小的帮助,请给个关注,点个赞喔,我会非常开心的~ 0. 前言 ...
- 机器学习-白板推导-系列(九)笔记:概率图模型: 贝叶斯网络/马尔可夫随机场/推断/道德图/因子图
文章目录 0 笔记说明 1 背景介绍 1.1 概率公式 1.2 概率图简介 1.2.1 表示 1.2.2 推断 1.2.3 学习 1.2.4 决策 1.3 图 2 贝叶斯网络 2.1 条件独立性 2. ...
- 人工智能里的数学修炼 | 概率图模型 : 隐马尔可夫模型
人工智能里的数学修炼 | 概率图模型 : 隐马尔可夫模型 人工智能里的数学修炼 | 隐马尔可夫模型:前向后向算法 人工智能里的数学修炼 | 隐马尔可夫模型 : 维特比(Viterbi)算法解码隐藏状态 ...
- 深入理解机器学习——概率图模型(Probabilistic Graphical Model):马尔可夫随机场(Markov Random Field,MRF)
分类目录:<深入理解机器学习>总目录 马尔可夫随机场(Markov Random Field,MRF)是典型的马尔可夫网,这是一种著名的无向图模型,图中每个结点表示一个或一组变量,结点之间 ...
- 概率图之马尔可夫随机场(Markov Random Field,MRF)
现实生活中,许多任务涉及多个因素(变量),并且因素之间存在依赖关系.概率图模型(Probabilistic Graphical Model,PGM)为表示.学习这种依赖关系提供了一个强大的框架,概率图 ...
最新文章
- 步步为营-68-asp.net简单练习(get set)
- 如何使用oprofile对软件做profiling
- C# 中 FindControl 方法及使用
- 这是一个无效的源路径/url
- 手工制作机器人用彩泥_印度神奇芒果干制作过程,看一遍顶三遍,游客:不会再吃了...
- iOS底层探索之多线程(十)—GCD源码分析( 信号量dispatch_semaphore_t)
- 在其他的电脑上配置绿色Jre+tomcat运行环境
- python实现arxiv论文数据解析处理
- 2022年4月树莓派系统初始用户名密码
- 用importREC修复Import表
- C语言学生宿舍水电费信息管理系统
- python股票预测模型_一种基于Python和BP神经网络的股票预测方法
- opencv4.5.2嵌入式移植
- ionic4自定义插件
- 数据结构与算法篇-单链表
- 长江商学院薛云奎的价值投资课【入门】
- mysql根据单一字段去重
- ps简单合成一个微小人像
- Skype交互过程分析
- UCenter Home如何做线下活动(转载)
热门文章
- 大厂程序员辞职创业,赚的还没原来多!
- 如何为企业量身打造一套高可用系统?
- 7个理由,给你推荐这款“秒杀Excel”的分析神器!
- Ontheinternet的深圳论坛
- 你最近学到的 飞鸽传书 东西的题目
- Widnwos 2000 命令集合
- 初学者是学习 C 语言还是 C++ 好?各有何利弊?
- oracle 去除英文字母,请教:如何去掉字段中的所有标点符号(包括全角的和半角的)...
- 实用遗传咨询 | 精神与行为异常-Autism
- Awesome Bioinformatics:假期了,收藏学习吧!