马尔可夫“折棍子”过程 Markovian Stick-breaking Process 简介

  • Markovian Stick-breaking Process的构造
    • GEM分布
    • Generator
    • Markovian Stick-breaking

Markovian Stick-breaking Process的构造

假设X⊂N\mathcal{X} \subset \mathbb{N}X⊂N是一个离散事件空间,μ\muμ是X\mathcal{X}X上的一个测度,另外引入参数θ>0\theta>0θ>0;(X,2X,μ)(\mathcal{X},2^{\mathcal{X}},\mu)(X,2X,μ)上参数为(μ,θ)(\mu,\theta)(μ,θ)的Dirichlet Process是可测空间(X,2X)\mathcal{X},2^{\mathcal{X}})X,2X)上所有概率测度组成的集合MXM_{\mathcal{X}}MX​上的概率测度,如果PPP是Dirichlet Process对应于X\mathcal{X}X的分割{Ai}i=1n\{A_i\}_{i=1}^n{Ai​}i=1n​的一个样本,那么
(P(A1),⋯,P(An))∼Dirichlet(θμ(A1),⋯,θμ(An))(P(A_1),\cdots,P(A_n)) \sim Dirichlet(\theta \mu(A_1),\cdots,\theta \mu(A_n))(P(A1​),⋯,P(An​))∼Dirichlet(θμ(A1​),⋯,θμ(An​))关于Dirichlet分布的介绍可以看UA MATH564 概率论 Dirichlet分布。

Dirichlet Process可以用“折棍子”过程(Stick-breaking Process)来表示(A constructive definition of Dirichlet priors, J Sethuraman 1994)。折棍子过程的直观介绍可以参考从折棍子(Stick Breaking)模型到狄利克雷过程(DP)。对于Dirichlet Process的样本PPP,
P=∑j=1∞PjδTjP = \sum_{j=1}^{\infty}P_j\delta_{T_j}P=j=1∑∞​Pj​δTj​​

其中P={Pj}j≥1\textbf{P}=\{P_j\}_{j \ge 1}P={Pj​}j≥1​服从GEM(θ)GEM(\theta)GEM(θ)分布,下文再详细介绍这个分布;T={Tj}j≥1\textbf{T}=\{T_j\}_{j \ge 1}T={Tj​}j≥1​是iid的序列,样本空间为X\mathcal{X}X且分布为μ\muμ;∑j=1∞PjδTj\sum_{j=1}^{\infty}P_j\delta_{T_j}∑j=1∞​Pj​δTj​​这种构造被称为折棍子过程。如果{Tj}j≥1\{T_j\}_{j \ge 1}{Tj​}j≥1​由Markov Chain定义,那么这个过程就叫Markovian Stick-breaking Process(Dietz, Z., Lippitt, W., Sethuraman, S.: Stick-breaking processes, clumping, and Markov chain occupation laws. Under review, https://www.math.arizona.edu/ sethuram/papers/DLS.pdf),具体的构造如下:

定义一个Markov transition kernel (可以参考UA MATH565C 随机微分方程V Markov Family简介)
Q=I+G/θQ = I+G/\thetaQ=I+G/θ

其中GGG是generator matrix,G={Gij:i,j∈X}G=\{G_{ij}:i,j \in \mathcal{X}\}G={Gij​:i,j∈X}满足
Gij>0Gii=−∑j≠iGijG_{ij}>0 \\ G_{ii} = -\sum_{j \ne i}G_{ij}Gij​>0Gii​=−j​=i∑​Gij​

T\textbf TT服从transition kernel为QQQ的平稳Markov Chain。

GEM分布

GEM的全名是Griffiths-Engel-McCloskey,它是一个residual allocation sequence,作用是把一个资源分配给无限个单位:我们先把这一个资源的X1X_1X1​分给第一个单位,假设X1∼Beta(1,θ)X_1 \sim Beta(1,\theta)X1​∼Beta(1,θ),则第一个单位分得
P1=X1P_1=X_1P1​=X1​

则剩下的资源为1−P11-P_11−P1​;然后我们把剩下的资源的X2X_2X2​分给第二个单位,X2∼Beta(1,θ)X_2 \sim Beta(1,\theta)X2​∼Beta(1,θ)且与X1X_1X1​独立,则第二个单位分得
P2=X2(1−P1)=X2(1−X1)P_2=X_2(1-P_1)=X_2(1-X_1)P2​=X2​(1−P1​)=X2​(1−X1​)且剩下的资源为1−P1−P2=1−X1−X2(1−X1)=(1−X2)(1−X1)1-P_1-P_2=1-X_1-X_2(1-X_1)=(1-X_2)(1-X_1)1−P1​−P2​=1−X1​−X2​(1−X1​)=(1−X2​)(1−X1​);以此类推,第jjj个单位分得的资源为
Pj=Xj∏i=1j−1(1−Xi)P_j = X_j \prod_{i=1}^{j-1}(1-X_i)Pj​=Xj​i=1∏j−1​(1−Xi​)

且剩余资源为∏i=1j(1−Xi)\prod_{i=1}^j(1-X_i)∏i=1j​(1−Xi​)。记P={Pj}j≥1\textbf P=\{P_j\}_{j \ge 1}P={Pj​}j≥1​,这个序列表示我们分配在每个单位上的资源,称P\textbf PP服从的分布为GEM(θ)GEM(\theta)GEM(θ)。

Generator

称实值矩阵G=(Gxy)x,y∈XG=(G_{xy})_{x,y \in \mathcal{X}}G=(Gxy​)x,y∈X​为generator kernel (or say generator matrix) over X\mathcal{X}X,如果

  1. ∀x,y∈X\forall x,y \in \mathcal{X}∀x,y∈X, x≠yx \ne yx​=y, Gxy≥0G_{xy} \ge 0Gxy​≥0
  2. ∀x∈X\forall x \in \mathcal{X}∀x∈X, Gxx=−∑y∈X∖{x}GxyG_{xx}=-\sum_{y \in \mathcal{X}\setminus \{x\}}G_{xy}Gxx​=−∑y∈X∖{x}​Gxy​
  3. θG=sup⁡x∈X∣Gxx∣<∞\theta^G=\sup_{x \in \mathcal{X}}|G_{xx}|<\inftyθG=supx∈X​∣Gxx​∣<∞

如果μ\muμ是X\mathcal{X}X上的一个概率测度,并且μTG=0\mu^TG=0μTG=0,则称μ\muμ是GGG的平稳概率分布。

用一个比较具体的例子来说明这个定义。考虑掷色子的事件空间X={1,2,3,4,5,6}\mathcal{X}=\{1,2,3,4,5,6\}X={1,2,3,4,5,6},取Gxy=∣x−y∣G_{xy}=|x-y|Gxy​=∣x−y∣,则
G=[−15123451−15234512−15345123−15451234−15512345−15]G=\left[ \begin{matrix} -15& 1 & 2 & 3 & 4 & 5 \\ 1 & -15 & 2 & 3 & 4 & 5 \\ 1 & 2 & -15 & 3 & 4 & 5 \\ 1 & 2 & 3 & -15 & 4 & 5 \\ 1& 2 & 3 & 4 & -15 & 5 \\ 1 & 2 & 3& 4 & 5 & -15 \end{matrix} \right]G=⎣⎢⎢⎢⎢⎢⎢⎡​−1511111​1−152222​22−15333​333−1544​4444−155​55555−15​⎦⎥⎥⎥⎥⎥⎥⎤​

这个矩阵就是一个generator;如果这个色子是公平的,那么它的概率分布就是
μ=[1/61/61/61/61/61/6]\mu=\left[ \begin{matrix}1/6 & 1/6 & 1/6 & 1/6 & 1/6 & 1/6 \end{matrix} \right]μ=[1/6​1/6​1/6​1/6​1/6​1/6​]

不难验证,μTG=0\mu^TG=0μTG=0,也就是说μ\muμ关于generator GGG是平稳分布。需要注意的是generator matrix可能不止一个。

Markovian Stick-breaking

假设GGG是X\mathcal{X}X一个不可约、正定、常返的Generator matrix,且平稳分布为μ\muμ,取θ>θG\theta>\theta^Gθ>θG,定义Q=I+G/θQ=I+G/\thetaQ=I+G/θ,如果P∼GEM(θ)\textbf{P}\sim GEM(\theta)P∼GEM(θ),T\textbf TT服从transition kernel为QQQ的平稳、齐次马尔可夫链,且与P\textbf PP独立,则X\mathcal{X}X上的random measure
ν=∑j≥1PjδTj\nu = \sum_{j \ge 1}P_j \delta_{T_j}ν=j≥1∑​Pj​δTj​​与T1T_1T1​构成的二元组(ν,T1)(\nu,T_1)(ν,T1​)服从Markovian Stick-breaking process,记为(ν,T1)∼MSB(G)(\nu,T_1) \sim MSB(G)(ν,T1​)∼MSB(G)。

马尔可夫“折棍子”过程 Markovian Stick-breaking Process 简介相关推荐

  1. 马尔可夫“折棍子”过程 Markovian Stick-breaking Process 在直方图平滑中的应用

    马尔可夫"折棍子"过程 Markovian Stick-breaking Process 在直方图平滑中的应用 用Dirichlet prior做Histogram Smoothi ...

  2. 从随机过程的熵率和马尔科夫稳态过程引出的一些思考 - 人生逃不过一场马尔科夫稳态...

    1. 引言 0x1:人生就是一个马尔科夫稳态 每一秒我们都在做各种各样的选择,要吃青菜还是红烧肉.看电影还是看书.跑步还是睡觉,咋一看起来,每一个选择都是随机的,而人生又是由无数个这样的随机选择组成的 ...

  3. 【强化学习】MOVE37-Introduction(导论)/马尔科夫链/马尔科夫决策过程

    写在前面的话:从今日起,我会边跟着硅谷大牛Siraj的MOVE 37系列课程学习Reinforcement Learning(强化学习算法),边更新这个系列.课程包含视频和文字,课堂笔记会按视频为单位 ...

  4. NLP --- 隐马尔可夫HMM(概念详解、三个基本问题详解)

    本节将进入隐马尔可夫环节,再次提醒不懂马尔科夫过程的同学建议先搞懂什么是马尔科夫过程,什么是马尔科夫链,同时需要懂一点语言模型的知识,下面会用到一点点,本人打算详细总结隐马尔可夫算法思想,因此讲解的会 ...

  5. 预测未来的神技——有趣的马尔科夫链

    本文为量子金服原创文章,转载须授权 作为概率论的一个重要分支,随机过程撑起了概率论的半壁江山,如今,它广泛使用在诸如天气预报.统计物理.天体物理.运筹决策.经济数学.安全科学.人口理论.可靠性及计算机 ...

  6. AR-HMM模型 自回归隐马尔可夫模型

    AR-HMM模型 自回归隐马尔可夫模型 数据处理过程 输入的视频数据首先需要被裁剪以适合动物的大小,在这之后考虑到模型建立的目的为行为状态的分类,于是需要消除可能一帧里带有多个动作状态的行为成分,这个 ...

  7. 灰色马尔可夫模型的Python代码实现

    本文通过Python实现了灰色模型的编写,并经过spssau初步验证,此外,本文将随机过程的马尔可夫和灰色模型相结合,以此来预测具有随机性.未来性的时间序列 文章目录 灰色模型 前沿 1.什么是灰色模 ...

  8. 强化学习note1——马尔科夫奖励过程MRP和马尔科夫决策过程MDP各个函数的定义与区别

    马尔科夫奖励过程MRP 状态转移函数:P(St+1=s′∣st=s)P\left(S_{t+1}=s^{\prime} \mid s_{t}=s\right)P(St+1​=s′∣st​=s) 奖励函 ...

  9. 马尔可夫Markov决策过程 MDP、马尔可夫奖励过程MRP

    引言 在概率论及统计学中,马尔可夫过程(英语:Markov process)是一个具备了马尔可夫性质的随机过程,因为俄国数学家安德雷·马尔可夫得名.马尔可夫过程是不具备记忆特质的(memoryless ...

最新文章

  1. sqlserver查询当月的每一天_SQLServer 查询最近一天,三天,一周,一月,一季度数据的方法...
  2. Stanford UFLDL教程 线性解码器
  3. 频域/s域/z域三大变换的性质对比
  4. 全国计算机等级考试题库二级C操作题100套(第46套)
  5. Linux下python安装升级详细步骤 | Python2 升级 Python3
  6. 教育部正式宣布:9年义务教育大变动!与孩子息息相关
  7. RT-Thread中自定义 FinSH 命令
  8. jQuery 学习笔记 事件委派
  9. 解决Jquery Kendo.xxx is not a function 的方法
  10. springboot接收多对象_springboot实现邮件发送
  11. HTML5七夕情人节表白网页制作【流星动画3D相册】HTML+CSS+JavaScript
  12. 【驱动】DM9000网卡驱动分析
  13. 深度解析大快DKadoop大数据运维管理平台功能
  14. 23计算机考研复习规划和经验分享
  15. MATLAB学习0基础
  16. ❤️‍Spring从入门到大神--事务管理(搞笑漫画讲解!简单易懂!!)
  17. 【Linux】Linux操作系统对文件系统的管理
  18. 计算机408知识点大全,2022计算机408考研知识点:输入输出系统
  19. 每日一题(二二)var fullname = 'a'; var obj = { fullname: 'b', prop : { fullname: 'c'
  20. matlab并行计算 parfor

热门文章

  1. Kernel Method的理解
  2. 【Python-ML】感知器学习算法(perceptron)
  3. 离线轻量级大数据平台Spark之MLib机器学习库朴素贝叶斯实例
  4. Oracle\Sqlserver\Mysql\Sybase\DB2五类数据库通信协议
  5. Leetcode 200. 岛屿数量 解题思路及C++实现
  6. gorm 返回多条数据_如何优雅的操作数据库?
  7. 事件——事件绑定||事件函数传参||事件修饰符||按键修饰符||自定义按键修饰符
  8. 思维导图 - 测试技术扩展:Postman接口测试、Sonar白盒测试、Sonic移动测试、Python操作FTP服务器
  9. Oracle 数据库impdp导入数据库版本和dmp数据库文件版本不匹配问题解决方法,ORA-39142版本号不兼容、ORA-39000转储文件说明错误解决方法
  10. 微信登录电脑,手机接收消息仍有提示音设置方法