【机器学习系列】MCMC第三讲:理解MCMC前必先弄懂这两点
作者:CHEONG
公众号:AI机器学习与知识图谱
研究方向:自然语言处理与知识图谱
阅读本文之前,首先注意以下两点:
1. 机器学习系列文章常含有大量公式推导证明,为了更好理解,文章在最开始会给出本文的重要结论,方便最快速度理解本文核心。需要进一步了解推导细节可继续往后看。
2. 文中含有大量公式,若读者需要获取含公式原稿Word文档,可关注公众号【AI机器学习与知识图谱】后回复:MCMC第三讲,可添加微信号【17865190919】进学习交流群,加好友时备注来自CSDN。原创不易,转载请告知并注明出处!
本文先给出MCMC采样的核心思想,然后介绍MCMC采样策略成立的两个重要关键点。MCMC相关概念请看:
一、MCMC核心思想
传统拒绝采样和重要性采样想直接给出高维复杂概率分布p(x)p(x)p(x)相近的q(x)q(x)q(x)是十分复杂的;
MCMC就试图间接找到这样的q(x)q(x)q(x),即先构造一条马氏链,通过假设合适的转态转移矩阵,让马氏链最后进入平稳分布状态概率分布qm(x)q^{m}(x)qm(x),且qm(x)q^{m}(x)qm(x)和p(x)p(x)p(x)相近,这样通过对qm(x)q^{m}(x)qm(x)进行采样来代替高维复杂概率分布p(x)p(x)p(x),这就是MCMC采样的思想,所以关键在于如何构造合适的状态转移矩阵,让马氏链最终能够平稳分布并接近p(x)p(x)p(x)。
因此从MCMC采样想法中需要说明两个关键点:
1、马氏链是否可以趋近于平稳分布状态,概率分布qm(x)q^{m}(x)qm(x);
2、如何设置转态转移矩阵使得平稳分布状态下的概率分布qm(x)q^{m}(x)qm(x)接近p(x)p(x)p(x)
证明1:马氏链随着转移矩阵转变,当m−>∞m->\inftym−>∞时会趋向于平稳分布状态。
如上存在的马氏链,假设每个时刻的概率分布q(t+1)(x)q^{(t+1)}(x)q(t+1)(x)共有K个状态:
则可以令q(t+1)(x)q^{(t+1)}(x)q(t+1)(x)是一个1∗K1*K1∗K维的向量:
则状态转移矩阵,也称为随机矩阵为:
若马氏链的状态从t时刻的xix_ixi到t+1时刻的xjx_jxj,则可以写出:
将上式带入到q(t+1)(x)q^{(t+1)}(x)q(t+1)(x)向量表示中展开为:
因此有:
所以继续迭代推导有:
随机矩阵QQQ具有一个性质,即特征值的绝对值都小于等于1,则对随机矩阵QQQ进行分解为:
其中:
因此特征值绝对值都小于等于1,不妨假设只有一个特征值为1,其他都小于1,则有:
因此存在足够大的mmm,则有:
即对角线上只有一个为1,其他对于小于1的足够大的指数运算后都趋近于0,所以
因此有:
至此得出结论,当m足够大时,马氏链趋向于平稳分布。
证明2、如何设置转态转移矩阵Q使得平稳分布状态下的概率分布qm(x)q^{m}(x)qm(x)接近p(x)p(x)p(x)
MCMC如何利用马尔科夫链收敛于平稳分布,来设计转态转移矩阵Q,使得平稳分布qm(x)q^{m}(x)qm(x)约等于目标分布p(x)p(x)p(x),马尔科夫链收敛到的平稳分布qm(x)q^{m}(x)qm(x)和初始分布没有关系,只和状态转移矩阵Q有关。具体怎么设置转态转移矩阵Q,参见MH采样算法和Gibbs采样算法,在下一节中将详细介绍具体的采样策略。
【机器学习系列】MCMC第三讲:理解MCMC前必先弄懂这两点相关推荐
- sklearn与机器学习系列专题之降维(五)一文弄懂Isomap特征筛选降维
目录 1.Isomap算法简介 2.Isomap算法原理 3.Isomap算法优缺点 4.python实战Isomap 5.下篇预告 1.Isomap算法简介 等度量映射(Isometric Feat ...
- 转 机器学习系列 08:深入理解拉格朗日乘子法、KKT 条件和拉格朗日对偶性
深度理解拉格朗日乘子法.KKT条件与线性规划对偶理论的微妙关系 https://blog.csdn.net/benzhujie1245com/article/details/85270058?utm_ ...
- 【机器学习系列】概率图模型第三讲:深入浅出无向图中的条件独立性和因子分解
作者:CHEONG 公众号:AI机器学习与知识图谱 研究方向:自然语言处理与知识图谱 阅读本文之前,先注意一下两点: 1. 机器学习系列文章常含有大量公式推导证明,为了更好理解,文章在最开始会给出本文 ...
- 马尔可夫蒙特卡洛方法(MCMC)简单理解
本文没有理论推导证明,旨在用简单的例子理解MCMC方法. 引入 p(T∣D)=p(D∣T)p(T)p(D)(1)p(T|D) = \frac{p(D|T)p(T)}{p(D)} \tag{1} p(T ...
- 机器学习系列(2)_从初等数学视角解读逻辑回归
作者:龙心尘 && 寒小阳 时间:2015年10月. 出处:http://blog.csdn.net/longxinchen_ml/article/details/49284391 ...
- Weka中数据挖掘与机器学习系列之Exploer界面(七)
不多说,直接上干货! Weka的Explorer(探索者)界面,是Weka的主要图形化用户界面,其全部功能都可通过菜单选择或表单填写进行访问.本博客将详细介绍Weka探索者界面的图形化用户界面.预处理 ...
- 逻辑回归原理梳理_以python为工具 【Python机器学习系列(九)】
逻辑回归原理梳理_以python为工具 [Python机器学习系列(九)] 文章目录 1.传统线性回归 2.引入sigmoid函数并复合 3. 代价函数 4.似然函数也可以 5. python梯度下降 ...
- 机器学习系列(4)_机器学习算法一览,应用建议与解决思路
作者:寒小阳 时间:2016年1月. 出处:http://blog.csdn.net/han_xiaoyang/article/details/50469334 声明:版权所有,转载请联系作者并注明出 ...
- 吴恩达《机器学习系列课程》学习笔记(一)
大家都想做在线教育,结果最后,B 站反而更像中国的 YouTube. 在 B 站上看到吴恩达的<机器学习系列课程>,看了看发现挺有意思,就梳理一下在此形成学习笔记. 第一节:前言 机器学习 ...
- 《机器学习系列教程》第三章 深度学习基础
@[第三章 深度学习基础] 第三章 深度学习基础 3.1 基本概念 3.1.1 神经网络组成? 为了描述神经网络,我们先从最简单的神经网络说起. 感知机 简单的感知机如下图所示: [外链图片转存失败( ...
最新文章
- SQL2K数据库开发十一之表操作创建UNIQUE约束
- 域控制器服务器端和客户端设置
- centos7中安装、配置、验证、卸载redis
- openresty开发系列2--nginx的简单安装,正向、反向代理及常用命令和信号控制介绍...
- agent docker zabbix_docker部署zabbix
- 【转】msyql使用-用户创建/权限配置
- js实现一键复制到剪切板上_js实现各种复制到剪贴板的方法
- (2)Node.js介绍
- N天学习一个linux命令之rsync
- c语言loop until用法,流程控制中的while、until、for循环
- 小程序毕设作品之微信酒店预订小程序毕业设计(8)毕业设计论文模板
- 【疑难解决】将设备通过Ehome协议接入EasyCVR,级联后视频无法播放如何解决?
- ArcGIS笔记1_如何为shapefile要素定义坐标系
- VM虚拟机装Windows XP系统
- 批处理命令%~dp0详解
- springboot基于微信小程序的在线考试系统
- 雅诗兰黛公司将收购Dr. Jart+
- AI 金融行业案例清单
- 分享129个ASP源码,总有一款适合您
- 读书笔记:《编程之美》
热门文章
- Android手势监听类GestureDetector的使用
- 配置Keepalived双实例高可用Nginx
- 侧滑面板(对viewGroup的自定义)
- WAF实现扫描器识别
- Aaron Swartz Rewriting Reddit中关于web.py的创建思路
- 矢量数据压缩:道格拉斯普克算
- NDK编译时指定NDK_MODULE_PATH的方法
- 招聘senior.net software engineer
- edui 富文本编辑_百度umeditor富文本编辑器插件扩展
- python注释程序_Python程序里的注释和#号