作者:CHEONG

公众号:AI机器学习与知识图谱

研究方向:自然语言处理与知识图谱

阅读本文之前,首先注意以下两点:

1. 机器学习系列文章常含有大量公式推导证明,为了更好理解,文章在最开始会给出本文的重要结论,方便最快速度理解本文核心。需要进一步了解推导细节可继续往后看。

2. 文中含有大量公式,若读者需要获取含公式原稿Word文档,可关注公众号【AI机器学习与知识图谱】后回复:MCMC第三讲,可添加微信号【17865190919】进学习交流群,加好友时备注来自CSDN。原创不易,转载请告知并注明出处!

本文先给出MCMC采样的核心思想,然后介绍MCMC采样策略成立的两个重要关键点。MCMC相关概念请看:

一、MCMC核心思想

传统拒绝采样和重要性采样想直接给出高维复杂概率分布p(x)p(x)p(x)相近的q(x)q(x)q(x)是十分复杂的;

MCMC就试图间接找到这样的q(x)q(x)q(x),即先构造一条马氏链,通过假设合适的转态转移矩阵,让马氏链最后进入平稳分布状态概率分布qm(x)q^{m}(x)qm(x),且qm(x)q^{m}(x)qm(x)和p(x)p(x)p(x)相近,这样通过对qm(x)q^{m}(x)qm(x)进行采样来代替高维复杂概率分布p(x)p(x)p(x),这就是MCMC采样的思想,所以关键在于如何构造合适的状态转移矩阵,让马氏链最终能够平稳分布并接近p(x)p(x)p(x)。

因此从MCMC采样想法中需要说明两个关键点:

1、马氏链是否可以趋近于平稳分布状态,概率分布qm(x)q^{m}(x)qm(x);

2、如何设置转态转移矩阵使得平稳分布状态下的概率分布qm(x)q^{m}(x)qm(x)接近p(x)p(x)p(x)

证明1:马氏链随着转移矩阵转变,当m−>∞m->\inftym−>∞时会趋向于平稳分布状态。

如上存在的马氏链,假设每个时刻的概率分布q(t+1)(x)q^{(t+1)}(x)q(t+1)(x)共有K个状态:

则可以令q(t+1)(x)q^{(t+1)}(x)q(t+1)(x)是一个1∗K1*K1∗K维的向量:

则状态转移矩阵,也称为随机矩阵为:

若马氏链的状态从t时刻的xix_ixi​到t+1时刻的xjx_jxj​,则可以写出:

将上式带入到q(t+1)(x)q^{(t+1)}(x)q(t+1)(x)向量表示中展开为:

因此有:

所以继续迭代推导有:

随机矩阵QQQ具有一个性质,即特征值的绝对值都小于等于1,则对随机矩阵QQQ进行分解为:

其中:

因此特征值绝对值都小于等于1,不妨假设只有一个特征值为1,其他都小于1,则有:

因此存在足够大的mmm,则有:

即对角线上只有一个为1,其他对于小于1的足够大的指数运算后都趋近于0,所以

因此有:

至此得出结论,当m足够大时,马氏链趋向于平稳分布。

证明2、如何设置转态转移矩阵Q使得平稳分布状态下的概率分布qm(x)q^{m}(x)qm(x)接近p(x)p(x)p(x)

MCMC如何利用马尔科夫链收敛于平稳分布,来设计转态转移矩阵Q,使得平稳分布qm(x)q^{m}(x)qm(x)约等于目标分布p(x)p(x)p(x),马尔科夫链收敛到的平稳分布qm(x)q^{m}(x)qm(x)和初始分布没有关系,只和状态转移矩阵Q有关。具体怎么设置转态转移矩阵Q,参见MH采样算法和Gibbs采样算法,在下一节中将详细介绍具体的采样策略。

【机器学习系列】MCMC第三讲:理解MCMC前必先弄懂这两点相关推荐

  1. sklearn与机器学习系列专题之降维(五)一文弄懂Isomap特征筛选降维

    目录 1.Isomap算法简介 2.Isomap算法原理 3.Isomap算法优缺点 4.python实战Isomap 5.下篇预告 1.Isomap算法简介 等度量映射(Isometric Feat ...

  2. 转 机器学习系列 08:深入理解拉格朗日乘子法、KKT 条件和拉格朗日对偶性

    深度理解拉格朗日乘子法.KKT条件与线性规划对偶理论的微妙关系 https://blog.csdn.net/benzhujie1245com/article/details/85270058?utm_ ...

  3. 【机器学习系列】概率图模型第三讲:深入浅出无向图中的条件独立性和因子分解

    作者:CHEONG 公众号:AI机器学习与知识图谱 研究方向:自然语言处理与知识图谱 阅读本文之前,先注意一下两点: 1. 机器学习系列文章常含有大量公式推导证明,为了更好理解,文章在最开始会给出本文 ...

  4. 马尔可夫蒙特卡洛方法(MCMC)简单理解

    本文没有理论推导证明,旨在用简单的例子理解MCMC方法. 引入 p(T∣D)=p(D∣T)p(T)p(D)(1)p(T|D) = \frac{p(D|T)p(T)}{p(D)} \tag{1} p(T ...

  5. 机器学习系列(2)_从初等数学视角解读逻辑回归

    作者:龙心尘 && 寒小阳  时间:2015年10月.  出处:http://blog.csdn.net/longxinchen_ml/article/details/49284391 ...

  6. Weka中数据挖掘与机器学习系列之Exploer界面(七)

    不多说,直接上干货! Weka的Explorer(探索者)界面,是Weka的主要图形化用户界面,其全部功能都可通过菜单选择或表单填写进行访问.本博客将详细介绍Weka探索者界面的图形化用户界面.预处理 ...

  7. 逻辑回归原理梳理_以python为工具 【Python机器学习系列(九)】

    逻辑回归原理梳理_以python为工具 [Python机器学习系列(九)] 文章目录 1.传统线性回归 2.引入sigmoid函数并复合 3. 代价函数 4.似然函数也可以 5. python梯度下降 ...

  8. 机器学习系列(4)_机器学习算法一览,应用建议与解决思路

    作者:寒小阳 时间:2016年1月. 出处:http://blog.csdn.net/han_xiaoyang/article/details/50469334 声明:版权所有,转载请联系作者并注明出 ...

  9. 吴恩达《机器学习系列课程》学习笔记(一)

    大家都想做在线教育,结果最后,B 站反而更像中国的 YouTube. 在 B 站上看到吴恩达的<机器学习系列课程>,看了看发现挺有意思,就梳理一下在此形成学习笔记. 第一节:前言 机器学习 ...

  10. 《机器学习系列教程》第三章 深度学习基础

    @[第三章 深度学习基础] 第三章 深度学习基础 3.1 基本概念 3.1.1 神经网络组成? 为了描述神经网络,我们先从最简单的神经网络说起. 感知机 简单的感知机如下图所示: [外链图片转存失败( ...

最新文章

  1. SQL2K数据库开发十一之表操作创建UNIQUE约束
  2. 域控制器服务器端和客户端设置
  3. centos7中安装、配置、验证、卸载redis
  4. openresty开发系列2--nginx的简单安装,正向、反向代理及常用命令和信号控制介绍...
  5. agent docker zabbix_docker部署zabbix
  6. 【转】msyql使用-用户创建/权限配置
  7. js实现一键复制到剪切板上_js实现各种复制到剪贴板的方法
  8. (2)Node.js介绍
  9. N天学习一个linux命令之rsync
  10. c语言loop until用法,流程控制中的while、until、for循环
  11. 小程序毕设作品之微信酒店预订小程序毕业设计(8)毕业设计论文模板
  12. 【疑难解决】将设备通过Ehome协议接入EasyCVR,级联后视频无法播放如何解决?
  13. ArcGIS笔记1_如何为shapefile要素定义坐标系
  14. VM虚拟机装Windows XP系统
  15. 批处理命令%~dp0详解
  16. springboot基于微信小程序的在线考试系统
  17. 雅诗兰黛公司将收购Dr. Jart+
  18. AI 金融行业案例清单
  19. 分享129个ASP源码,总有一款适合您
  20. 读书笔记:《编程之美》

热门文章

  1. Android手势监听类GestureDetector的使用
  2. 配置Keepalived双实例高可用Nginx
  3. 侧滑面板(对viewGroup的自定义)
  4. WAF实现扫描器识别
  5. Aaron Swartz Rewriting Reddit中关于web.py的创建思路
  6. 矢量数据压缩:道格拉斯普克算
  7. NDK编译时指定NDK_MODULE_PATH的方法
  8. 招聘senior.net software engineer
  9. edui 富文本编辑_百度umeditor富文本编辑器插件扩展
  10. python注释程序_Python程序里的注释和#号