作者：CHEONG

公众号：AI机器学习与知识图谱

研究方向：自然语言处理与知识图谱

阅读本文之前，首先注意以下两点：

1. 机器学习系列文章常含有大量公式推导证明，为了更好理解，文章在最开始会给出本文的重要结论，方便最快速度理解本文核心。需要进一步了解推导细节可继续往后看。

2. 文中含有大量公式，若读者需要获取含公式原稿Word文档，可关注公众号【AI机器学习与知识图谱】后回复：MCMC第三讲，可添加微信号【17865190919】进学习交流群，加好友时备注来自CSDN。原创不易，转载请告知并注明出处！

本文先给出MCMC采样的核心思想，然后介绍MCMC采样策略成立的两个重要关键点。MCMC相关概念请看：

一、MCMC核心思想

传统拒绝采样和重要性采样想直接给出高维复杂概率分布p(x)p(x)p(x)相近的q(x)q(x)q(x)是十分复杂的；

MCMC就试图间接找到这样的q(x)q(x)q(x)，即先构造一条马氏链，通过假设合适的转态转移矩阵，让马氏链最后进入平稳分布状态概率分布qm(x)q^{m}(x)qm(x)，且qm(x)q^{m}(x)qm(x)和p(x)p(x)p(x)相近，这样通过对qm(x)q^{m}(x)qm(x)进行采样来代替高维复杂概率分布p(x)p(x)p(x)，这就是MCMC采样的思想，所以关键在于如何构造合适的状态转移矩阵，让马氏链最终能够平稳分布并接近p(x)p(x)p(x)。

因此从MCMC采样想法中需要说明两个关键点：

1、马氏链是否可以趋近于平稳分布状态，概率分布qm(x)q^{m}(x)qm(x)；

2、如何设置转态转移矩阵使得平稳分布状态下的概率分布qm(x)q^{m}(x)qm(x)接近p(x)p(x)p(x)

证明1：马氏链随着转移矩阵转变，当m−>∞m->\inftym−>∞时会趋向于平稳分布状态。

如上存在的马氏链，假设每个时刻的概率分布q(t+1)(x)q^{(t+1)}(x)q(t+1)(x)共有K个状态：

则可以令q(t+1)(x)q^{(t+1)}(x)q(t+1)(x)是一个1∗K1*K1∗K维的向量：

则状态转移矩阵，也称为随机矩阵为：

若马氏链的状态从t时刻的xix_ixi到t+1时刻的xjx_jxj，则可以写出：

将上式带入到q(t+1)(x)q^{(t+1)}(x)q(t+1)(x)向量表示中展开为：

因此有：

所以继续迭代推导有：

随机矩阵QQQ具有一个性质，即特征值的绝对值都小于等于1，则对随机矩阵QQQ进行分解为：

其中：

因此特征值绝对值都小于等于1，不妨假设只有一个特征值为1，其他都小于1，则有：

因此存在足够大的mmm，则有：

即对角线上只有一个为1，其他对于小于1的足够大的指数运算后都趋近于0，所以

因此有：

至此得出结论，当m足够大时，马氏链趋向于平稳分布。

证明2、如何设置转态转移矩阵Q使得平稳分布状态下的概率分布qm(x)q^{m}(x)qm(x)接近p(x)p(x)p(x)

MCMC如何利用马尔科夫链收敛于平稳分布，来设计转态转移矩阵Q，使得平稳分布qm(x)q^{m}(x)qm(x)约等于目标分布p(x)p(x)p(x)，马尔科夫链收敛到的平稳分布qm(x)q^{m}(x)qm(x)和初始分布没有关系，只和状态转移矩阵Q有关。具体怎么设置转态转移矩阵Q，参见MH采样算法和Gibbs采样算法，在下一节中将详细介绍具体的采样策略。

【机器学习系列】MCMC第三讲：理解MCMC前必先弄懂这两点相关推荐

sklearn与机器学习系列专题之降维（五）一文弄懂Isomap特征筛选降维
目录 1.Isomap算法简介 2.Isomap算法原理 3.Isomap算法优缺点 4.python实战Isomap 5.下篇预告 1.Isomap算法简介等度量映射(Isometric Feat ...
转机器学习系列 08：深入理解拉格朗日乘子法、KKT 条件和拉格朗日对偶性
深度理解拉格朗日乘子法.KKT条件与线性规划对偶理论的微妙关系 https://blog.csdn.net/benzhujie1245com/article/details/85270058?utm_ ...
【机器学习系列】概率图模型第三讲：深入浅出无向图中的条件独立性和因子分解
作者:CHEONG 公众号:AI机器学习与知识图谱研究方向:自然语言处理与知识图谱阅读本文之前,先注意一下两点: 1. 机器学习系列文章常含有大量公式推导证明,为了更好理解,文章在最开始会给出本文 ...
马尔可夫蒙特卡洛方法（MCMC）简单理解
本文没有理论推导证明,旨在用简单的例子理解MCMC方法. 引入 p(T∣D)=p(D∣T)p(T)p(D)(1)p(T|D) = \frac{p(D|T)p(T)}{p(D)} \tag{1} p(T ...
机器学习系列(2)_从初等数学视角解读逻辑回归
作者:龙心尘 && 寒小阳时间:2015年10月. 出处:http://blog.csdn.net/longxinchen_ml/article/details/49284391 ...
Weka中数据挖掘与机器学习系列之Exploer界面（七）
不多说,直接上干货! Weka的Explorer(探索者)界面,是Weka的主要图形化用户界面,其全部功能都可通过菜单选择或表单填写进行访问.本博客将详细介绍Weka探索者界面的图形化用户界面.预处理 ...
逻辑回归原理梳理_以python为工具【Python机器学习系列（九）】
逻辑回归原理梳理_以python为工具 [Python机器学习系列(九)] 文章目录 1.传统线性回归 2.引入sigmoid函数并复合 3. 代价函数 4.似然函数也可以 5. python梯度下降 ...
吴恩达《机器学习系列课程》学习笔记（一）
大家都想做在线教育,结果最后,B 站反而更像中国的 YouTube. 在 B 站上看到吴恩达的<机器学习系列课程>,看了看发现挺有意思,就梳理一下在此形成学习笔记. 第一节:前言机器学习 ...
《机器学习系列教程》第三章深度学习基础
@[第三章深度学习基础] 第三章深度学习基础 3.1 基本概念 3.1.1 神经网络组成? 为了描述神经网络,我们先从最简单的神经网络说起. 感知机简单的感知机如下图所示: [外链图片转存失败( ...

【机器学习系列】MCMC第三讲：理解MCMC前必先弄懂这两点

一、MCMC核心思想

证明1：马氏链随着转移矩阵转变，当m−>∞m->\inftym−>∞时会趋向于平稳分布状态。

证明2、如何设置转态转移矩阵Q使得平稳分布状态下的概率分布qm(x)q^{m}(x)qm(x)接近p(x)p(x)p(x)

【机器学习系列】MCMC第三讲：理解MCMC前必先弄懂这两点相关推荐

最新文章

热门文章