文章目录

  • 引言
  • 一、概率图模型
  • 二、CRF模型
    • 1.条件随机场的矩阵形式
    • 2. HMM模型与CRF模型比较
    • 3. 条件随机场的三个基本问题
      • 3.1 概率计算问题
      • 3.2 预测问题(Inference)
      • 3.3 参数估计问题

nlp基础—9.条件随机场模型(CRF算法)上一节主要依据《统计学习方法》这本书来学习条件随机场模型;这一节从原论文角度来学习条件随机场模型。


引言

  所谓线性链条件随机场就是逻辑回归的引申,相当于它的每一个时间步都是一个独立的逻辑回归模型,我们只需要将逻辑回归连起来就可以得到线性链的条件随机场。如果不考虑隐变量之间简单的依赖关系,就可以得到一般的条件随机场模型。

HMM模型是生成式模型,CRF模型是判别式模型。

一、概率图模型

  概率图模型是由图表示的概率分布,用于刻画随机变量之间的依赖关系。我们有两种刻画方式,一种是有向图模型

  • 每个节点对应一个随机变量
  • 通过条件概率P(xi│Parents(xi))P(x_i│Parents(x_i))P(xi​│Parents(xi​))刻画父节点对xix_ixi​的影响
  • 图中无回路

    其概率为:
    P(a,b,c,d,e)=P(a)P(b│a)P(c│b)P(d│b)P(e∣c,d)P(a,b,c,d,e )=P(a)P(b│a)P(c│b)P(d│b)P(e|c,d)P(a,b,c,d,e)=P(a)P(b│a)P(c│b)P(d│b)P(e∣c,d)

一种是无向图模型:

  • 每个节点对应一个随机变量
  • 每条边表示随机变量之间的依赖关系
  • 联合概率分布满足局部马尔科夫性


最大团:无向图中任何两个结点均有边连接的结点子集称为团。如果C是一个团,并且不能再加进任何一个结点使其成为更大的团,则称C为最大团
Hammersley-Clifford定理:概率无向图模型的联合概率分布P(Y)可以表示为如下形式:
P(Y)=1/Z∏Cψc(Yc)Z=∑Y∏Cψc(Yc)ψc(Yc∣θ)=exp[∑j=1nwiFi(Yc)]n:特征的数量Fi(Yc):Yc这个团上所提取出的特征P(Y)=1/Z∏_Cψ_c(Y_c)\\Z=∑_Y∏_Cψ_c(Y_c)\\ψ_c(Y_c|θ)=exp[∑_{j=1}^nw_iF_i(Y_c)]\\n: 特征的数量 \\F_i(Y_c): Y_c这个团上所提取出的特征 P(Y)=1/ZC∏​ψc​(Yc​)Z=Y∑​C∏​ψc​(Yc​)ψc​(Yc​∣θ)=exp[j=1∑n​wi​Fi​(Yc​)]n:特征的数量Fi​(Yc​):Yc​这个团上所提取出的特征
那么,上面无向图模型的联合概率分布为:
P(a,b,c,d,e)=1/Zψ1(a,b,d)ψ2(b,c)ψ3(c,e)P(a,b,c,d,e )=1/Zψ_1(a,b,d)ψ_2(b,c)ψ_3(c,e)P(a,b,c,d,e)=1/Zψ1​(a,b,d)ψ2​(b,c)ψ3​(c,e)

二、CRF模型

  奥卡姆剃须刀原理告诉我们:若非必要,勿增实体。在序列标注方面,HMM模型会遇到什么问题呢?HMM模型在生成每个词时,只考虑当前这个词的状态,不能很好的考虑上下文。

1.条件随机场的矩阵形式


x=(x1,x2,x3)y=(y1,y2,y3)P(y∣x,w)=1/Z(w,x)∏i=1Cexp[∑j=1nwjfj(x,yi,yi−1)]x=(x_1,x_2,x_3)\\y=(y_1,y_2,y_3)\\P(y|x,w)=1/Z(w,x)∏_{i=1}^Cexp[∑_{j=1}^nw_jf_j(x, y_i,y_i−1)]x=(x1​,x2​,x3​)y=(y1​,y2​,y3​)P(y∣x,w)=1/Z(w,x)i=1∏C​exp[j=1∑n​wj​fj​(x,yi​,yi​−1)]
由于在各个势函数之间共享了权重,则可以写成:
P(y∣x,w)=1/Z(w,x)∏i=1Cexp[∑j=1nwjfj(x,yi,yi−1)]argmaxw∏i=1NP(y∣x,w)P(y|x,w)=1/Z(w,x)∏_{i=1}^Cexp[∑_{j=1}^nw_jf_j(x, y_i,y_i−1)]\\arg max_w∏_{i=1}^NP(y|x,w)P(y∣x,w)=1/Z(w,x)i=1∏C​exp[j=1∑n​wj​fj​(x,yi​,yi​−1)]argmaxw​i=1∏N​P(y∣x,w)

2. HMM模型与CRF模型比较

  将隐马尔可夫模型写成条件概率的形式就成了条件随机场模型。

3. 条件随机场的三个基本问题

3.1 概率计算问题

  给定w,x,y,计算P(y∣x,w)给定w,x,y,计算P(y|x,w)给定w,x,y,计算P(y∣x,w)
重点:计算Z(w,x)计算Z(w,x)计算Z(w,x)
Z(w,x)=∑yexp[∑j=1nwj∑i=1Cfj(x,yi,yi−1)]=∑yexp[∑i=1C∑j=1nwjfj(x,yi,yi−1)]=∑yexp[∑i=1Cgi(x,yi,yi−1)]gi(x,yi,yi−1)=∑j=1nwjfj(x,yi,yi−1)Z(w,x)=∑_yexp[∑_{j=1}^nw_j∑_{i=1}^Cf_j(x, y_i,y_i−1)]\\=∑_yexp[∑_{i=1}^C∑_{j=1}^nw_jf_j(x, y_i,y_i−1)]\\=∑_yexp[∑_{i=1}^Cg_i(x,y_i,y_i−1) ]\\g_i(x,y_i, y_i−1)=∑_{j=1}^nw_jf_j(x, y_i,y_i−1) Z(w,x)=y∑​exp[j=1∑n​wj​i=1∑C​fj​(x,yi​,yi​−1)]=y∑​exp[i=1∑C​j=1∑n​wj​fj​(x,yi​,yi​−1)]=y∑​exp[i=1∑C​gi​(x,yi​,yi​−1)]gi​(x,yi​,yi​−1)=j=1∑n​wj​fj​(x,yi​,yi​−1)
然后再用前向后向算法计算。

3.2 预测问题(Inference)

  给定w,x,计算y′=argmaxyP(y∣x,w)给定w,x,计算 y^′=arg max_yP(y|x,w)给定w,x,计算y′=argmaxy​P(y∣x,w)

3.3 参数估计问题

  给定x,y,计算w′=argmaxwP(y∣x,w)给定x,y,计算 w^′=arg max_wP(y|x,w)给定x,y,计算w′=argmaxw​P(y∣x,w)


如果对您有帮助,麻烦点赞关注,这真的对我很重要!!!如果需要互关,请评论或者私信!


nlp基础—11.条件随机场模型(CRF)模型补充相关推荐

  1. 概率图模型笔记(三)条件随机场(CRF)基础

    写在前面 前面写完了HMM,比较重点的就是HMM的三个问题,需要好好消化.这篇博客主要介绍条件随机场,相比于HMM,CRF的应用可能会更广.从刚接触CRF开始也很久了,但是由于书上公式非常晦涩难懂,而 ...

  2. 条件随机场(CRF)极简原理与超详细代码解析

    条件随机场(CRF)极简原理与超详细代码解析 1. 原理 1.1 从名称说起 1.2 优化的目标 1.3 如何计算 2. 代码 2.1 基本结构 2.2 模型初始化 2.3 BERT提取的特征如何输入 ...

  3. 机器学习理论《统计学习方法》学习笔记:第十一章 条件随机场(CRF)

    第十一章 条件随机场(CRF) 摘要 1 概率无向图模型 1.1 概率无向图模型定义 1.2 概率无向图模型的因子分解 1.3 D-划分 1.4 马尔可夫随机场在图像中的应用 2 条件随机场的定义与形 ...

  4. 如何轻松愉快的理解条件随机场(CRF)

    转载自  如何轻松愉快的理解条件随机场(CRF) 如何轻松愉快的理解条件随机场(CRF)? 理解条件随机场最好的办法就是用一个现实的例子来说明它. 但是目前中文的条件随机场文章鲜有这样干的,可能写文章 ...

  5. 条件随机场(CRF)

    一.条件随机场(Conditional Random Fields). 条件随机场(CRF)是在给定一组输入随机变量条件下另外一组输出随机变量的条件概率分布模型,它是一种判别式的概率无向图模型,既然是 ...

  6. 条件随机场(CRF)和隐马尔科夫模型(HMM)最大区别在哪里?CRF的全局最优体现在哪里?

    作者:尔总的马甲 链接:https://www.zhihu.com/question/53458773/answer/554436625 来源:知乎 著作权归作者所有.商业转载请联系作者获得授权,非商 ...

  7. 条件随机场(CRF)模型详解

    近期做一个小整理,把之前学过的一些模型重新拿出来学习一下.而CRF(Conditional Random Fields,条件随机场)模型是自己了解到的第一批模型之一,所以拿过来复习一下 假设你有许多小 ...

  8. 自然语言处理(NLP)学习笔记——HMM与CRF模型

    一.HMM模型 1.HMM模型的输入和输出 HMM(Hidden Markov Model),中文称作隐含马尔可夫模型,因俄国数学家马尔可夫而得名.它一般以文本序列数据为输入,以该序列对应得隐含序列为 ...

  9. 经典算法复现!(条件随机场)CRF原理及实现代码

    Datawhale 作者:丁媛媛,Datawhale优秀学习者 寄语:本文先对马尔可夫过程及隐马尔可夫算法进行了简单的介绍:然后,对条件随机场的定义及其三种形式进行了详细推导:最后,介绍了条件随机场的 ...

  10. 机器学习之条件随机场(CRF)

    什么是CRF CRF即条件随机场(Conditional Random Fields),是在给定一组输入随机变量条件下另外一组输出随机变量的条件概率分布模型,它是一种判别式的概率无向图模型,既然是判别 ...

最新文章

  1. 【Cmake】Cmake学习记录
  2. putty完全使用手册--多窗口---git提交---连接数据库--自动日志显示
  3. 网络协议——TCP/IP协议
  4. Mac OS使用技巧之十三:Finder中标记的使用
  5. 浅谈C++ STL中的优先队列(priority_queue)
  6. react 遍历对象_React 和 Vue 之间的相爱相杀
  7. 马哥Linux2016最新高薪运维视频课程
  8. Mac字体管理工具: RightFont
  9. 正样本和负样本,前景类/ 背景,hard negative mining
  10. 第十八期 Amesim视频教程热交换器建模仿真专题
  11. 把 14 亿中国人都拉到一个微信群,在技术上能实现吗?
  12. Camera 图像处理原理分析- 色彩篇 二
  13. 幸福加油站(EAP)——忙碌的心里意义
  14. 计算机一级评分原理,计算机一级Word和Excel操作自动评分的实现探究
  15. 2048Game/2048游戏(自制版)
  16. 解决Echarts柱形图正负数在同一侧,并设置正负值不同颜色
  17. 很好用的壁纸网站源码分享,仅供学习,请勿商用。
  18. (Note)答辩经验
  19. 中文版sublime text3的下载网址和注意方法
  20. Git如何查看本地已登录的用户账号及切换账号

热门文章

  1. 【转载】Java的接口和抽象类
  2. NSString的形式--可变字符串--查方法
  3. 《零基础学习Liunx之三》 The following takes place between 04:00PM and 05:00PM
  4. 驳熊节和Martin Fowler的Java消亡论!
  5. 【翻译】IdentityServer4:基于资源的配置
  6. 520 简单表白代码(JS)
  7. Web 基础架构:负载均衡和LVS
  8. 将对象序列化和反序列化
  9. (转)蜜果私塾:http协议学习和总结系列--深入了解篇
  10. 在ubuntu下使用搜狗的教育网代理