大学本科时代开始学习的概率论,从变着花样从箱子里取不同颜色的球计算概率,到计算各种离散或连续的随机分布期望、方差,再高深点就是利用生成函数求期望和方差,再就是估计理论,包括点估计、极大似然估计和区间估计等,然后是一些假设检验,最后,会加上一点随机过程的知识。
       和所有中国教育中的基础理论教学一样,我们被训练去求给定分布(一般会给一些复杂的分布)的期望和方差,我们去背复杂的估计理论和假设检验公式,概率学习变成了一个技术活。在我的印象里,概率论总感觉是一门“形而上”的学问。
       直到不久前,我还是不知道大数定理和中心极限定理那章的作用,但现在,个人感觉,这章实际是概率论体现理论源于实践又反过来指导实践的最佳哲学证明,是甩掉概率论“形而上学”的核心武器。从大数定理,我们知道大量的随机变量(函数)样本平均值依概率趋近于该随机变量(函数)的期望。实际应用中的概率分布往往并不是如同泊松分布、指数分布那样的简单分布,而是解析式非常复杂,甚至没有解析式,而这些分布的期望往往可以帮助我们估计分布的参数或其他重要性质,这时候通过计算机生成符合该分布的采样值的方法就非常重要。
       我们知道,对于常见的经典分布,(0,1)均匀分布可以利用线性同余生成器、斐波那契生成器等生成;其他非均匀分布,如泊松分布、指数分布等可以通过利用反变换、舍选法、卷积法等生成,但这些方法对实际中的大量分布还是无能为力,甚至尽管可以用这些方法,但如果需要生成大量的样本,一些现有的方法效率太低,例如产生指数分布样本需要计算开销巨大的lnx函数。
      MCMC就是一种很牛的采样方法,它的想法是,假设需要产生密度函数为f(x)的样本,设计一个马尔科夫链,使其平稳分布恰好是f(x),等到该链平衡时开始采样。这和以前已知markov chain求equilibrium distribution恰恰相反。根据建立Markov chain方法的不同,两类最重要的MCMC方法为就是Metropolis-Hastings Algorithm和Gibbs Sampling,前者常设计成随机游走(Random walk),后者则基于conditional sampling。当然这里,如何设计这个Markov chain是一个很高超的技术,有兴趣的可以再深入查阅。
       另外一种也不错的采样方法叫sequential importance sampling。具体原理我也不太清楚,大致意思是通过迭代采样逐步建立一个逼近原分布f(x)的分布g(x),大名鼎鼎的particle filtering粒子滤波就是基于这个思想来的。
       除了在概率论中使用,随机思想也渗透到各种确定性领域。面对传统很多确定性领域无法得到解析式的困难,如求高维积分,将其转换成求一个特定函数的期望,或一些经典的科学问题,设计一个特殊分布,使待求变量等于该分布的期望,则通过MCMC等采样方法加上大数定理,即可得出高精度的近似解。

从概率论到Markov Chain Monte Carlo(MCMC)-- 转相关推荐

  1. 【ML】Markov Chain Monte Carlo(MCMC)---Slice sampler(切片采样)和Hierarchical Models(层次模型)

    导航 Slice sampler 2D slice sample General Slice Sampler Hierarchical models python Code download Refe ...

  2. R语言与Markov Chain Monte Carlo(MCMC)方法学习笔记(2)

    前面已经大致的叙述了MCMC方法.今天来分享一下R中的一个实现MCMC算法的包mcmc. mcmc包的一个核心函数就是metrop,其调用格式为: metrop(obj, initial, nbatc ...

  3. 13 MCMC(Markov Chain Monte Carlo)

    13 MCMC(Markov Chain Monte Carlo) 0 MCMC思想 1 采样方法 1.1概率分布采样 1.2 拒绝采样(Rejection Sampling) 1.3 重要性采样(I ...

  4. 马尔可夫链蒙特卡罗法(Markov Chain Monte Carlo,MCMC)

    文章目录 1. 蒙特卡罗法 2. 马尔可夫链 3. 马尔可夫链蒙特卡罗法 4. Metropolis-Hastings 算法 5. 吉布斯抽样 蒙特卡罗法(Monte Carlo method),也称 ...

  5. 论文辅助笔记(代码实现):Bayesian Probabilistic Matrix Factorizationusing Markov Chain Monte Carlo

    1 主要思路回顾 具体可见:论文笔记 Bayesian Probabilistic Matrix Factorizationusing Markov Chain Monte Carlo (ICML 2 ...

  6. Markov Chain Monte Carlo

    转载至https://zhuanlan.zhihu.com/p/25610149 [数据分析] Markov Chain Monte Carlo Markov Chain Monte Carlo简称M ...

  7. Markov Chain Monte Carlo 和 Gibbs Sampling算法

    Welcome To My Blog 一.蒙特卡洛模拟 蒙特卡洛模拟(Monte Carlo Simulation)是随机模拟的别名,关于随机模拟的一个重要的问题就是:给定一个概率分布p(x),如何生 ...

  8. 论文笔记 Bayesian Probabilistic Matrix Factorizationusing Markov Chain Monte Carlo (ICML 2008)

    0 摘要 低秩矩阵逼近方法是协同过滤中最简单.最有效的方法之一.这类模型通常通过寻找模型参数的MAP估计来拟合数据,这一过程即使在非常大的数据集上也能有效地执行. 然而,除非正则化参数被仔细地调整,否 ...

  9. martingale、markov chain、Monte Carlo、MCMC

    文章结构如下: 1: MCMC 1.1 MCMC是什么 1.2 为什么需要MCMC 2: 蒙特卡罗 2.1 引入 2.2 均匀分布,Box-Muller 变换 2.3 拒绝接受采样(Acceptanc ...

最新文章

  1. 计算机科学与技术类高水平国际学术刊物,莘莘学子 | 计算机科学与技术学院本科生薛传雨在国际期刊上发表高水平学术论文...
  2. java子类有参构造函数吗_为什么我需要在这个Java通用子类中有一个构造函数?...
  3. KDD CUP 2020之Debiasing赛道方案 (Rush)
  4. JSTL-EL表达式 函数fn
  5. Laravel源码学习文章汇总
  6. 百度发布小度智能音箱大金刚:秒变投屏电视 售价199元
  7. ELK logstash 处理MySQL慢查询日志
  8. dw显示云服务器的数据库,dw如何读取服务器数据库
  9. Nginx源码分析 - 模块的赋值及编号 --- 方便了解nginx模块
  10. cmd 查看端口占用情况,及对应进程,杀进程
  11. 音乐网站Spotify将融资4亿美元,估值84亿美元
  12. 聚沙成塔,浙江形成1000 万千瓦“虚拟电厂”
  13. 联想拯救者y7000电脑开机一直是锁屏界面,点一下就黑屏,无法进入输密码界面
  14. 百度地图的POI帮助文件
  15. Anaconda如何卸载干净
  16. 论文排版中MathType的使用(论文投稿必备)
  17. 数字逻辑 易错点 地线 GROUND 与 GND/DGND
  18. QQ空间将不再支持免费备份原图?附QQ空间相册导出工具合集
  19. STC51单片机数码管显示程序和仿真
  20. 关于嵌入式系统的应用分析

热门文章

  1. 科大星云诗社动态20210227
  2. Python的第一个程序 Hello world
  3. 新兴机器学习算法:迁移学习
  4. 利用WinRAR命令行压缩文件或文件夹
  5. GetCursorPos/WindowFromPoint/SendMessage
  6. 在Navicat中直接向表里添加数据
  7. Linux-0.00 代码解析(三)
  8. 【快乐水题】1716. 计算力扣银行的钱
  9. JAVA的三种常量池
  10. STM32开发 -- UART应用层通信协议分析