1、MCMC概述

  从名字我们可以看出,MCMC由两个MC组成,即蒙特卡罗方法(Monte Carlo Simulation,简称MC)和马尔科夫链(Markov Chain ,也简称MC)。之前已经介绍过蒙特卡洛方法,接下来介绍马尔科夫链,以及结合两者的采样算法。

2、马尔科夫链

  马尔科夫链的概念在很多地方都被提及过,它的核心思想是某一时刻状态转移的概率只依赖于它的前一个状态。  

  我们用数学定义来描述,则假设我们的序列状态是...Xt2, Xt1, Xt, Xt+1,...,那么我们的在时刻Xt+1的状态的条件概率仅仅依赖于时刻Xt,即:

  

  既然某一时刻状态转移的概率只依赖于它的前一个状态,那么我们只要能求出系统中任意两个状态之间的转换概率,这个马尔科夫链的模型就定了。状态转移情况如下图所示

  

  则状态转移矩阵可以表示为

  

  此时,我们给定一个初始状态,然后经过该状态转移矩阵的转换,最终会收敛到一个稳定的状态,具体如马尔科夫链定理所示

  

  由于马尔科夫链能收敛到平稳分布, 于是有了一个想法:如果我们能构造一个转移矩阵为P的马氏链,使得该马氏链的平稳分布恰好是p(x), 那么我们从任何一个初始状态x0出发沿着马氏链转移, 得到一个转移序列 x0, x1, x2,⋯xn, xn+1⋯, 如果马氏链在第n步已经收敛了,于是我们就得到了 π(x) 的样本xn, xn+1⋯(也就是从第n步收敛时开始,之后的x都服从同一个平稳分布,我们可以将这个分布设定为我们的目标采样分布)。

  从上面可以看出马尔科夫链的平稳分布收敛主要依赖于状态转移矩阵,所以关键是如何构建状态转移矩阵,使得最终的平稳分布是我们所要的分布。想做到这一点主要依赖于细致平稳定理

  

3、MCMC采样和M-H采样

  在MCMC采样中先随机一个状态转移矩阵Q,然而该矩阵不一定能满足细致平稳定理,一次会做一些改进,具体过程如下

  

  MCMC采样算法的具体流程如下

  

  然而关于MCMC采样有收敛太慢的问题,所以在MCMC的基础上进行改进,引出M-H采样算法

  

  M-H算法的具体流程如下

  

  M-H算法在高维时同样适用

  

  一般来说M-H采样算法较MCMC算法应用更广泛,然而在大数据时代,M-H算法面临着两个问题:

  1)在高维时的计算量很大,算法效率很低,同时存在拒绝转移的问题,也会加大计算量

  2)由于特征维度大,很多时候我们甚至很难求出目标的各特征维度联合分布,但是可以方便求出各个特征之间的条件概率分布(因此就思考是否能只知道条件概率分布的情况下进行采样)。

4、Gibbs采样

  

  

  因此可以得出在二维的情况下Gibbs采样算法的流程如下

  

  而在多维的情况下,比如一个n维的概率分布π(x1, x2, ...xn),我们可以通过在n个坐标轴上轮换采样,来得到新的样本。对于轮换到的任意一个坐标轴xi上的转移,马尔科夫链的状态转移概率为P(xi|x1, x2, ..., xi1, xi+1, ..., xn),即固定n−1个坐标轴,在某一个坐标轴上移动。而在多维的情况下Gibbs采样算法的流程如下

  

  由于Gibbs采样在高维特征时的优势,目前我们通常意义上的MCMC采样都是用的Gibbs采样。当然Gibbs采样是从M-H采样的基础上的进化而来的,同时Gibbs采样要求数据至少有两个维度,一维概率分布的采样是没法用Gibbs采样的,这时M-H采样仍然成立。

转载于:https://www.cnblogs.com/jiangxinyang/p/9359276.html

机器学习之MCMC算法相关推荐

  1. 收藏 | 机器学习模型与算法最全分类汇总!

    题图 | AltumCode 机器学习模型与算法包括线性回归.对数几率回归.LASSO回归.Ridge回归.LDA.k近邻.决策树.感知机.神经网络.支持向量机.AdaBoost.GBDT.XGBoo ...

  2. python比c语言开发速度快多少倍_Python语言其实很慢,为什么机器学习这种快速算法步骤通常还是用呢?...

    原标题:Python语言其实很慢,为什么机器学习这种快速算法步骤通常还是用呢? 作为python的忠实粉丝,看见这个题目就情不自禁想怼回去.鉴于和谐社会,我决定慢慢讲道理. 首先,相对于c语言,pyt ...

  3. 五分钟了解机器学习十大算法

    作者 | Fahim ul Haq    译者 | 刘志勇 策划 | 赵钰莹 编辑 | 程序员大白公众号 仅作学术交流,如有侵权,请联系删文 本文为有志于成为数据科学家或对此感兴趣的读者们介绍最流行的 ...

  4. 应用随机过程张波商豪_Markov链的应用一:MCMC算法

    本文是张迪同学对马尔链的应用的介绍 应用一:Markov链在MCMC算法中的应用 1. MCMC概念 MCMC即马尔科夫链蒙特卡洛方法(Markov Chain Monte Carlo).该方法将Ma ...

  5. 一文图解机器学习的基本算法!

    来源:软件定义世界 本文长度为2877字,建议阅读6分钟 本文为你分析如何选择机器学习的各种方法. 每当提到机器学习,大家总是被其中的各种各样的算法和方法搞晕,觉得无从下手.确实,机器学习的各种套路确 ...

  6. 【机器学习】机器学习的经典算法

    [机器学习]机器学习的经典算法 https://www.cnblogs.com/DicksonJYL/p/9517025.html 本文为整篇文章第二部分,整篇文章主要目录如下: 1:一个故事说明什么 ...

  7. 强化学习ppt_机器学习原理、算法与应用配套PPT第四部分(深度学习概论、自动编码器、强化学习、聚类算法、半监督学习等)...

    本文是SIGAI公众号文章作者雷明编写的<机器学习>课程新版PPT第四部分,包含了课程内容的深度学习概论,自动编码器,受限玻尔兹曼机,聚类算法1,聚类算法2,聚类算法3,半监督学习,强化学 ...

  8. 机器学习算法_五分钟了解机器学习十大算法

    本文为有志于成为数据科学家或对此感兴趣的读者们介绍最流行的机器学习算法. 机器学习是该行业的一个创新且重要的领域.我们为机器学习程序选择的算法类型,取决于我们想要实现的目标. 现在,机器学习有很多算法 ...

  9. 【机器学习】Apriori 算法进行关联分析和FP-growth算法

    [机器学习]Apriori 算法进行关联分析和FP-growth算法 文章目录 1 关联分析 2 FP-growth算法理解和实现 3 FP增长算法的频繁项集产生 4 FP-Growth关联分析算法在 ...

  10. DNS通道检测 国内学术界研究情况——研究方法:基于特征或者流量,使用机器学习决策树分类算法居多...

    http://xuewen.cnki.net/DownloadArticle.aspx?filename=BMKJ201104017&dbtype=CJFD <浅析基于DNS协议的隐蔽通 ...

最新文章

  1. Error:java: 无效的源发行版: 11
  2. 栈与队列9——最大值减去最小值小于或等于num的子数组的数量
  3. AI算法领域常用的39个术语(上)
  4. Python正则表达式re模块简明笔记
  5. 2字段添加注释_Tableau学习系列(7):计算字段
  6. Nginx 配置TCP和UDP负载均衡
  7. php中带?错误,参考-此错误在PHP中意味着什么?
  8. masked_fill【将mask中值为True的位置对应的待填充的张量设置为value值】
  9. 系统补丁自动批量安装
  10. UI设计素材|汉堡按钮/菜单
  11. 挨批评了!Chrome 对用户隐私保护还不如 IE?
  12. 看看五年MacBook使用经验平常都用那些软件
  13. 惊帆健康监测模块,心率检测模块
  14. 打印机扫描找不到计算机用户名,打印机扫描到pc显示不可用 打印机扫描到pc显示不可用的解决方法...
  15. Allegro删除Out of data shape铜皮框
  16. 计算机网络谢希仁第七版课后习题答案(第七章)
  17. termux使用教程python手机_渗透测试|利用手机攻击电脑(Termux终端初体验)
  18. 有什么好用的微信公众号编辑器?快来看看这3款
  19. 邮件 发送excel表格做正文
  20. [小知識] 判斷是否為繁體字(Big5)

热门文章

  1. mklink实现软件搬家清理C盘空间
  2. android imagebutton 动画,android – ImageButton Icon Tint基于State
  3. 数据库原理及应用(MySQL版)
  4. ssd变频器说明书_变频器说明书大全
  5. python爬取快手视频_【原创开源】快手爬虫,根据id批量爬取用户的所有图集和视频...
  6. 服务器远程桌面日志,记录远程桌面连接登录日志的方法及注意事项
  7. 金蝶K3销售退货案例教程
  8. 淘淘商城项目mysql,idea搭建淘淘商城项目
  9. 红黑所-1996-2011年中国黑客大事记
  10. aria2,破解限速的傻瓜式教程