关于周志华老师的《机器学习》这本书的学习笔记
记录学习过程
本博客记录Chapter14

文章目录

  • 1 隐马尔可夫模型
  • 2 马尔可夫随机场
  • 3 条件随机场
  • 4 学习与推断
  • 5 近似推断
  • 6 话题模型

1 隐马尔可夫模型

概率图模型(probabilistic graphical model):用图来表达变量相关关系的概率模型。最常见的是用一个结点表示一个或一组随机变量,节点之间的边表示变量间的概率相关关系,即变量关系图。概率图模型大概可以分类为:

  • 有向无环图(有向图模型或贝叶斯网)
  • 无向图(无向图模型或马尔可夫网)

隐马尔可夫模型(HMM):是结构最简单的动态贝叶斯网,是一种著名的有向图模型。主要应用于时间序列数据建模。隐马尔可夫模型中有两类变量:

  • 状态变量(隐变量):表示第iii时刻的系统状态{y1,y2,⋯,yn}\{y_1,y_2,\cdots,y_n\}{y1​,y2​,⋯,yn​},一般是隐藏的、不可被观测的。
  • 观测变量:{x1,x2,⋯,xn}\{x_1,x_2,\cdots, x_n\}{x1​,x2​,⋯,xn​},表示第iii时刻的观测值。

在隐马尔可夫模型中,系统通常在多个状态{s1,s2,⋯,sN}\{s_1,s_2,\cdots,s_N\}{s1​,s2​,⋯,sN​}之间转换,因此状态变量yiy_iyi​的取值范围通常是有NNN个可能取值的离散空间,因此状态变量yiy_iyi​的取值范围YYY通常是有NNN个可能取值的离散空间(Y⊂SY \subset SY⊂S)。观测变量可以是离散型也可以是连续型。为便于讨论,我们假定其取值范围X={o1,o2,⋯,oM}X=\{o_1,o_2,\cdots,o_M\}X={o1​,o2​,⋯,oM​}。

在任一时刻,观测变量的取值xtx_txt​仅由状态变量yty_tyt​确定,与其他状态变量以及观测变量的取值无关。同时ttt时刻的状态yty_tyt​仅依赖于t−1t-1t−1时刻的状态yt−1y_{t-1}yt−1​,与其余n−2n-2n−2个状态无关,这就是所谓的 “马尔可夫链”系统下一时刻的状态仅有当前状态决定,不依赖于以往的任何状态。 所有变量的联合概率分布定义为:
P(x1,y1,⋯,xn,yn)=P(y1)P(x1∣y1)∏i=2nP(yi∣yi−1)P(xi∣yi)P(x_1,y_1,\cdots,x_n,y_n)=P(y_1)P(x_1|y_1)\prod_{i=2}^nP(y_i|y_{i-1})P(x_i|y_i) P(x1​,y1​,⋯,xn​,yn​)=P(y1​)P(x1​∣y1​)i=2∏n​P(yi​∣yi−1​)P(xi​∣yi​)
除了结构信息,欲确定一个隐马尔可夫模型还需要以下三组参数:

  • 状态转移概率:
    aij=P(yt+1=sj∣yt=si),1≤i,j≤Na_{ij}=P(y_{t+1}=s_j|y_t=s_i),\ \ \ \ \ 1\le i,j\le N aij​=P(yt+1​=sj​∣yt​=si​),     1≤i,j≤N

  • 输出观测概率:
    bij=P(xt=oj∣yt=si)b_{ij}=P(x_t=o_j|y_t=s_i) bij​=P(xt​=oj​∣yt​=si​)

  • 初始状态概率:
    πi=P(y1=si)\pi_i=P(y_1=s_i) πi​=P(y1​=si​)


2 马尔可夫随机场

马尔可夫随机场(MRF):典型的马尔可夫网,是一种著名的无向图模型:

  • 结点:一个或一组变量
  • 边:变量之间的依赖关系

马尔可夫随机场有一组势函数(potential functions),也叫做“因子”,即定义在变量子集上的非负实函数,主要用于定义概率分布函数。

马尔可夫随机场中,对于图中结点的一个子集,如果其中任意两个结点都有边连接,则称该结点子集为一个“团”,若团中再加入一个结点,则无法构成团,则称为“极大团”。

在马尔可夫随机场中,多个变量之间的联合概率分布能基于团分解为多个因子的乘积,每个因子仅与一个团相关。具体来说,对于nnn个变量X={x1,x2,⋯,xn}X=\{x_1,x_2,\cdots, x_n\}X={x1​,x2​,⋯,xn​} , 所有团构成的集合为CCC,与团 Q∈CQ\in CQ∈C对应的变量集合记为XQX_QXQ​ ,则联合概率P(X)P(X)P(X)定义为
P(X)=1Z∏Q∈Cψ(XQ)P(X)=\frac{1}{Z}\prod_{Q\in C} \psi(X_Q) P(X)=Z1​Q∈C∏​ψ(XQ​)
在马尔可夫随机场中如何得到“条件独立性”呢?同样借助分离的概念。如下图所示,若从结点集A中的结点到B中的结点都必须经过结点集C中的结点,则称结点集A和B被结点集C分离, C称为"分离集" (separating set)。

对马尔可夫随机场,有 “全局马尔可夫性” (global Markov property):给定两个变量子集的分离集,则这两个变量子集条件独立。也就是说,图中若令 A, B和C对应的变量集分别为XA,XB,XCX_A,X_B, X_CXA​,XB​,XC​, 则XAX_AXA​ 和XBX_BXB​ 在给定XCX_CXC​的条件下独立,记为XA⊥XB∣XCXA\perp XB|X_CXA⊥XB∣XC​。

由全局马尔可夫性,可以得到两个有用的推论:

  • 局部马尔科夫性: 给定某变量的邻接变量,则该变量条件独立于其他变量。
  • 成对马尔可夫性: 给定所有其他变量,两个非邻接变量条件独立。

下面来考察马尔可夫随机场中的势函数,其作用是定量刻画变量集XQX_QXQ​中变量的相关关系 (非负函数),且在所偏好的变量取值上有较大的函数值

为了满足非负性,指数函数常被定义势函数:
ψQ(XQ)=e−HQ(XQ)\psi_Q(X_Q)=e^{-H_Q(X_Q)} ψQ​(XQ​)=e−HQ​(XQ​)

3 条件随机场

条件随机场(Conditional Random Field,简称 CRF) 是一种判别式无向图模型,是判别式模型。条件随机场试图对多个变量在给定观测值后的条件概率进行建模。

令G=(V,E)G=(V,E)G=(V,E)表示结点与标记变量yyy中元素一一对应的无向图,yvy_vyv​表示与结点vvv对应的标记变量, n(v)n(v)n(v)表示结点vvv的邻接结点, 若图GGG的每个变量yvy_vyv​都满足马尔可夫性,即
P(yv∣x,yV\{v})=P(yv∣x,yn(v))P(y_v|x,y_{V\backslash \{v\}})=P(y_v|x,y_{n(v)}) P(yv​∣x,yV\{v}​)=P(yv​∣x,yn(v)​)
则(y,x)(y,x)(y,x)构成一个条件随机场。

4 学习与推断

  • 变量消去

  • 信念传播

5 近似推断

  • MCMC采样:关键在于通过构造"平稳分布为ppp的马尔同夫链" 来产生样本。
  • 变分推断:通过使用己知简单分布来逼近需推断的复杂分布,并通过限制近似分布的类型,从而得到一种局部最优、但具有确定解的近似后验分布。

6 话题模型

话题模型(topic model)是一族生成式有向图模型,主要用于处理离散型的数据(如文本集合),在信息检索、自然语言处理等领域有广泛应用。隐狄利克雷分配模型(Latent Dirichlet Allocation,简称LDA) 是话题模型的典型代表。

话题模型中的基本概念:

  • 词(word):最基本离散单元
  • 文档(document):不计顺序(词袋)
  • 话题(topic):一系列相关的词,以及它们在该概率下出现的概率

不妨假定数据集中一共包含KKK个话题和TTT篇文档,文档中的词来自一个包含NNN个词的词典。我们用TTT个NNN维向量w={w1,w2,⋯,wT}w=\{w_1,w_2,\cdots,w_T\}w={w1​,w2​,⋯,wT​}表示数据集(即文档集合), KKK个NNN维向量βk(k=1,2,⋯,K)\beta_k\ \ (k=1 ,2,\cdots, K)βk​  (k=1,2,⋯,K)表示话题,其中wT∈RNw_T\in \mathbb R^NwT​∈RN的第nnn个分量wt,nw_{t,n}wt,n​表示文档ttt中词nnn的词频,βk∈RN\beta_k\in \mathbb R^Nβk​∈RN的第nnn个分量βk,n\beta_{k,n}βk,n​表示话题kkk中词nnn的词频。

LDA从生成式模型的角度来看待文档和话题。具体来说,LDA认为每篇文档包含多个话题,不妨用向量θt∈RN\theta_t\in \mathbb R^Nθt​∈RN表示文档ttt中所包含的每个话题的比例,θt,k\theta_{t,k}θt,k​表示文档ttt中包含话题kkk的比例,进而通过下面的步骤由话题"生成"文档ttt:

  • 根据参数α\alphaα的迪利克雷分布随机采样一个话题分布θt\theta_tθt​
  • 按如下步骤生成文档中的NNN个词
    • 根据θt\theta_tθt​进行话题指派,得到文档ttt中词nnn的话题zt,nz_{t,n}zt,n​
    • 根据指派的话题所对应的词频分布βk\beta_kβk​随机采样生成词

机器学习(周志华) 第十四章概率图模型相关推荐

  1. 机器学习(周志华) 参考答案 第十四章 概率图模型 14.9

    机器学习(周志华西瓜书) 参考答案 总目录 http://blog.csdn.net/icefire_tyh/article/details/52064910 机器学习(周志华) 参考答案 第十四章 ...

  2. 机器学习-周志华-学习记录-第一章绪论

    文章目录 绪论 一.什么是机器学习 二.基本术语 三.假设空间 四.归纳偏好 总结 参考链接 绪论 为了更早地适应研究生的生活,我决定重新学习周志华老师的机器学习这本书.同时也为了能够养成博客记录的习 ...

  3. 《机器学习》 周志华学习笔记第十四章 概率图模型(课后习题)python实现

    一.基本内容 1.隐马尔可夫模型 1.1. 假定所有关心的变量集合为Y,可观测变量集合为O,其他变量集合为R, 生成式模型考虑联合分布P(Y,R,O),判别式模型考虑条件分布P(Y,R|O),给定一组 ...

  4. 西瓜书(机器学习 周志华)读书笔记--第一章 绪论

    1.1 引言 略 1.2 基本术语 1.2.1 数据集相关的基本概念 假定我们收集了一批关于西瓜的数据,例如(色泽=青绿;根蒂=蜷缩;敲声=浊响), (色泽=乌黑;根蒂=稍蜷;敲声=沉闷), (色泽= ...

  5. 机器学习(周志华西瓜书) 参考答案 总目录

    转自:http://blog.csdn.net/icefire_tyh/article/details/52064910 从刚开始学习机器学习到现在也有几个月了,期间看过PDF,上过MOOC,总感觉知 ...

  6. 小吴的《机器学习 周志华》学习笔记 第二章 2.4 比较检验、2.5 偏差与方差

    小吴的<机器学习 周志华>学习笔记 第二章 2.4 比较检验. 2.5 偏差与方差 2.4 比较检验 上一周提到了实验的评价方法和性能量度,步骤简单可以看成:先使用某种实验评估方法测得学习 ...

  7. 机器学习 周志华 第一章课后习题

    机器学习 周志华 第一章课后习题 1.1 1.2 1.3 1.4 1.5 1.1 在下面这张图片中若只包含编号为1和4的两个样例,试给出相应的版本空间. 书上实例: 1.表 1.1 对应的假设空间如下 ...

  8. 小吴的《机器学习 周志华》学习笔记 第二章 模型评估与选择

    小吴的<机器学习 周志华>学习笔记 第二章 模型评估与选择 上一周我们介绍了第一章的基础概念,这一次将带来第二章的前三节.后面的2.4 比较检验与2.5 偏差与方差,涉及概率论与数理统计概 ...

  9. 小吴的《机器学习 周志华》学习笔记 第一章 绪论

    小吴的<机器学习 周志华>学习笔记 第一章 绪论 近一年时间接触到不少机器学习的知识,虽然断断续续学了一些,总感觉还没有入门(只学会了疯狂调包).因此,最近开始系统学习Machine Le ...

最新文章

  1. 人脸识别迁移学习的应用
  2. ArcGIS Engine空间高效查询(IIdentify方法)
  3. 解决不是有效的win32应用程序
  4. Spring-AOP 通过配置文件实现 前置增强
  5. 检索数据_9_返回的字段在某个范围内的数据
  6. 牛客 - Strange Bulbs(bitset优化拓扑)
  7. 【LOJ6072】苹果树【折半搜索】【矩阵树定理】【二项式反演】
  8. php txtsql 说明,PHP学习笔记(2)txtSQL文档错误
  9. 做深度学习需要知道哪些linux指令?
  10. 2021爱分析·快消品牌商数字化厂商全景报告
  11. 数字虚拟人metahuman,苹果手机做动作捕捉
  12. Shopee平台不活跃商品清理规则更新
  13. ZBrush与数位板雕刻模型如何才能结合
  14. 用WinRAR分割文件
  15. 新浪微博下拉菜单制作(DOM小练习)
  16. Unity初级案例-愤怒的小鸟:六:17把粒子系统显示在UI之前+18让星星一颗一颗的显示+19添加暂停动画
  17. socket函数接口
  18. web前端学习路线(含20个真实web开发项目集合)
  19. 2021地理高考成绩查询,安徽高考成绩查分时间2021
  20. WEB2.0相关概念

热门文章

  1. 在ppt Excel world中 批量删除超链接
  2. DNS 服务与邮件服务器应用--配置DNS正向解析与反向解析
  3. Fe3O4@SiO2硅包铁核壳纳米颗粒|链霉亲和素修饰的四氧化三铁颗粒|正硅酸乙酯(TEOS)进修饰改性磁性Fe3O4纳米颗粒
  4. Ubuntu18.04安装GNSS 处理软件 u-center
  5. 燕十八php笔记_燕十八ph视频教程笔记(PHP基础部分).doc
  6. 昨日关注:Herb Sutter:告别免费午餐时代,迎接20年来最大编程变革
  7. 【庖丁解牛】configure: error: Cannot find libpq-fe.h. Please specify correct PostgreSQL installation path
  8. 物联网发展历程,一步步从概念走向了成熟
  9. android 拨号器 目录,Android 电话拨号器
  10. pdf转换成word转换器在线哪个最好