从马尔科夫链到吉布斯采样与PageRank
马尔科夫链表示state
的链式关系,下一个state
只跟上一个state
有关。
吉布斯采样通过采样条件概率分布得到的样本点,近似估计概率分布P(z)P(z)。PageRank通过节点间的连接,估计节点的重要程度rr。吉布斯采样中,state
代表不同的样本点,state
的分布就是P(z)P(z)。PageRank中,state
代表不同节点的分数,state
的分布就是要求的rr。不论吉布斯采样还是PageRank,state
的分布本质上都是马尔科夫链,而最后都希望state
的分布是独一并且稳定的。
- Markov Chain
- 介绍
- 稳定态
- Gibbs Sampling
- 介绍
- Gibbs Sampling与Markov
- Page Rank
- 介绍
- 稳定性
- 稀疏计算
Markov Chain
介绍
上图表示了一个典型的马尔科夫链,每个城市A、B、C代表不同的state
。该图描述了不同state
间的转移变化关系。并且下一个时间的state
只和上一个时间的state
有关。
稳定态
想象上述的马尔科夫链,state
不停的变化,我们可以求出不同state
的概率,也就是state
的概率分布。
最简单的办法是列出不同state
的概率公式,然后解线性方程组求解,如下:
可是,单一稳定的state
不一定存在,例如下面两种情况:
Spider trap
,a⇔ba \Leftrightarrow b,相当于状态被困在某区域(多个状态)。Dead End
,a⇒ba \Rightarrow b,相当于状态被困在单个状态中。那么,什么情况下才有单一稳定的
state
的存在呢?单一稳定的
state
分布的存在的充分条件是:对于任意两个state
s1,s2s_1,s_2,它们之间的状态转移概率不为0。也就是p(s1|s2)>0p(s_1|s_2)>0。也就是说,state
间(包含自身)都有连接,这样的话便存在单一稳定的state
分布。Gibbs Sampling
介绍
Gibbs Sampling遇到的问题是:在已知P(zi|z1,...,zi−1,zi+1,...zN)P(z_i|z_1,...,z_{i-1},z_{i+1},...z_{N})分布的情况下,求变量P(z)(z=z1,...,zN)P(z) (z = {z_1,...,z_N})的分布。
Gibbs Sampling的解决办法是:设置外循环tt,遍历采样点数;设置内循环kk,遍历特征数,对于每一个特征值ztkz_k^t,根据分布ztk∼P(zk=ztk|z1=zt1,z2=zt2,...)z_k^t \sim P(z_k = z_k^t | z_1 =z_1^t, z_2 =z_2^t,...)采样ztkz_k^t。最后,根据z1,z2,z3,...{z^1,z^2,z^3,...}得到P(z)(z=z1,...,zN)P(z) (z = {z_1,...,z_N})的分布。
Gibbs Sampling与Markov
吉布斯采样的数据z1,z2,z3,...{z^1,z^2,z^3,...}相当于马尔科夫链中不同的
state
(因为ztz^t只和zt−1z^{t-1}有关)。如果马尔科夫链存在单一且稳定的状态分布,那么就可以通过采样求出P(z)(z=z1,...,zN)P(z) (z = {z_1,...,z_N})。下面,分两个步骤证明:
- Gibbs Sampling存在单一且稳定的状态分布。
- Gibbs Sampling单一且稳定的状态分布就是P(z)P(z)。
Gibbs Sampling中条件概率没有0值确保了Gibbs Sampling存在单一且稳定的状态分布。
根据概率公式,可推导Gibbs Sampling单一且稳定的状态分布就是P(z)P(z)。
Page Rank
介绍
Page Rank的哲学是:一个点的重要性跟这个点的in-link有关,不同的in-link权重不一样,score越大的节点对应的in-link也就越重要。
令节点的score向量为rr,节点的邻接矩阵为MM。那么,rr和MM的关系可写作:r=Mrr = Mr
示例如下:
这个例子中,可以把矩阵MM和向量rr相乘当做MM的列以向量rr为权重进行线性组合,矩阵MM同一列的不同行代表该节点向其他节点的分发连接。这样理解起来就比较清晰了。
rr的求解可以使用特征值-特征向量分解,最大特征值对应的特征向量即是rr。
稳定性
rr的值在满足特定情况下才是单一且稳定的。
实际计算Page Rank中,需要增加一个条件:每个节点都有1N\frac{1}{N}的概率变换到任何其他节点状态。
原来的式子是:
r=Mrr = Mr
考虑稳定性后的式子是:
Ar=βM+(1−β)1N11T=Ar\begin{split} A &= \beta M + (1-\beta) \frac{1}{N} \mathbf{1} \mathbf{1}^T \\ r &= Ar \end{split}
示例如下:
稀疏计算
在上面的计算公式中,矩阵AA是稠密的,空间复杂度是O(N2)O(N^2),占得空间很大。
因此,改进计算如下:
Arr=βM+(1−β)1N11T=Ar=βMr+1−βN\begin{split} A &= \beta M + (1-\beta) \frac{1}{N} \mathbf{1} \mathbf{1}^T \\ r &= Ar \\ r &= \beta M r + \frac{1-\beta}{N} \end{split}
从马尔科夫链到吉布斯采样与PageRank相关推荐
- 蒙特卡罗 马尔科夫链 与Gibbs采样
这几个概念看了挺多遍都还是含混不清,最近看了几篇博客,才算大致理解了一点点皮毛,所以来总结一下. MCMC概述 从名字我们可以看出,MCMC由两个MC组成,即蒙特卡罗方法(Monte Carlo Si ...
- 从马尔科夫过程到吉布斯采样(附程序示例)
目标:如何采取满足某个概率分布的一组数据,比如如何给出满足标准正太分布的1000个点,当然该分布比较简单,生成满足此分布的1000个点并不难,对matlab,python 等都是一行语句的事,但是如果 ...
- 马尔科夫过程与吉布斯采样
随机模拟(或者统计模拟)方法有一个很酷的别名是蒙特卡罗方法(Monte Carlo Simulation).这个方法的发展始于20世纪40年代,和原子弹制造的曼哈顿计划密切相关,当时的几个大牛,包括乌 ...
- 第十五课.马尔科夫链蒙特卡洛方法
目录 M-H采样 Metropolis-Hastings采样原理 M-H采样步骤 Gibbs方法 Gibbs核心流程 Gibbs采样的合理性证明 Gibbs采样实验 在 第十四课中讲述了马尔科夫链与其 ...
- 马尔科夫链和马尔科夫链蒙特卡洛方法
前言 译自:<Training Restricted Boltzmann Machines: An Introduction > 马尔科夫链在RBM的训练中占据重要地位,因为它提供了从复杂 ...
- 蒙特卡洛法(三)马尔科夫链蒙特卡洛法
马尔科夫链蒙特卡洛法适合于随机变量是多元的.密度函数是非标准形式的随机变量各分量不独立的情况.如何构建具体的马尔科夫链是这个方法的关键,离散变量的时候,需要定义转移矩阵,构建可逆马尔科夫链,保证遍历定 ...
- 结对编程-马尔科夫链作业成绩
结对编程-马尔科夫链作业成绩 作业博客:http://www.cnblogs.com/vertextao/p/6881960.html 问题 本次作业仅有三位同学按时提交,两位同学延迟提交,出人意料, ...
- 第十四课.马尔科夫链
目录 马尔科夫链 马尔科夫链的平稳分布 马尔科夫链进入稳态的转移过程 马尔科夫链稳态的意义 稳态判定:细致平稳条件 马尔科夫链 随机过程指的是一个随机变量序列:{Xt}\left\{X_{t}\rig ...
- MCMC+马尔科夫链蒙特卡罗
MCMC+马尔科夫链蒙特卡罗 为了解决什么问题,所以出现了这一种方法? 后来又因为出现了什么新情况,所以产生了对应的变种?
最新文章
- Java 包的概述和讲解
- node.js 搭建blog
- 2017—2018 实验报告:实验一
- activiti高亮显示图片_【正点原子FPGA连载】第二十章SD卡读BMP图片HDMI显示实验领航者 ZYNQ 之嵌入式开发指南...
- DEKR 解构式人体关键点回归(二):标签分配(Label Assignment)
- 阿里云SLB上http强制跳转到https问题处理
- 2021年吉林高考成绩怎么查询,2021年吉林高考成绩查询登录网址入口怎么查 附查询方法...
- ThinkPHP 使用极光推送给ios推送消息
- android activty动画,Activity动画效果
- 韩顺平Linux操作系统视频教程
- P2P中DHT网络介绍
- 无人机系统测试软件,无人机航测软件(pix4D)
- 思科实验4.网络层:路由器IP地址配置
- html5 js获取设备信息,js怎么获取电脑硬件信息
- 高纯度钨酸铜粉末/钨酸铁粉末/钨酸亚铁粉末/硫化铋粉末/铬酸铋粉末/氧化锆粉末/铬酸钡粉末
- 怎么压缩过大的GIF图片?三步缩小动态图片
- 如何利用LaTex的写毕业论文
- html页面导出pdf截断问题,html2canvas 与 jspdf 相结合生成 pdf 内容被截断的终极解决方案...
- python画蝴蝶曲线图
- 读书札记:knowledge and Virtue
热门文章
- python3语法糖------装饰器
- CVPR 2021 | 视觉目标检测大模型GAIA:面向行业的视觉物体检测一站式解决方案
- LIC-Fusion 2.0:基于滑动窗口法平面特征跟踪的激光雷达惯性相机里程计
- 汇总|基于激光雷达的3D目标检测开源项目数据集
- 形态学滤波:腐蚀与膨胀(浅谈)
- 如何查看linux系统服务器磁盘大小和文件占用情况
- Matplotlib绘制指向点箭头
- 基于RDKit的溶解度预测的机器学习模型
- 执行公式_法院诉讼费、保全费、执行费速算公式
- envoy实现_微服务之服务治理:Envoy 全局 gRPC 限速服务 lyft/ratelimit 详解