nlp基础—9.条件随机场模型(CRF算法)
文章目录
- 引言
- 一、概率无向图模型
- 1. 概率无向图模型的定义
- 2. 概率无向图模型的因子分解
- 二、条件随机场的定义与形式
- 1. 条件随机场的定义
- 2. 条件随机场的参数化形式
- 3. 条件随机场的简化形式
- 4.条件随机场的矩阵形式
- 三、条件随机场的三个基本问题
- 1.概率计算问题
- 2. 学习问题
- 3. 预测问题
引言
CRF算法与HMM算法在分词方面的应用相当于在隐变量序列输出后再进行一定的调整。CRF算法的知识体系如下:
本文首先介绍概率无向图模型,然后叙述条件随机场的定义与各种表示方法,最后介绍条件随机场的三个基本问题:概率计算问题、学习问题和预测问题。
一、概率无向图模型
1. 概率无向图模型的定义
概率图模型是由图表示的概率分布。概率图模型分为有向图(贝叶斯网络)与无向图(马尔科夫随机场)。概率无向图模型是一个可以由无向图表示的联合概率分布。概率无向图模型的最大特点是易于因子分解。
概率无向图模型的定义为:设有联合概率分布P(Y)P(Y)P(Y),由无向图G=(V,E)G=(V,E)G=(V,E)表示,在图GGG中,结点表示随机变量,边表示随机变量之间的依赖关系。如果联合概率分布P(Y)P(Y)P(Y)满足成对、局部或全局马尔可夫性,就称此联合概率分布为概率无向图模型( probability undirectedgraphical model),或马尔可夫随机场(Markov random field)。
下面分别介绍无向图表示的随机变量之间存在的成对马尔可夫性、局部马尔可夫性和全局马尔可夫性。
成对马尔可夫性:
P(Yu,Yv∣YO)=P(Yu∣YO)P(Yv∣YO)P(Y_u,Y_v|Y_O)=P(Y_u|Y_O)P(Y_v|Y_O)P(Yu,Yv∣YO)=P(Yu∣YO)P(Yv∣YO)
局部马尔可夫性:
全局马尔可夫性:
2. 概率无向图模型的因子分解
下面分别给出团与因子分解的定义。无向图GGG中任何两个结点均有边连接的结点子集称为团。
将概率无向图模型的联合概率分布表示为其最大团上的随机变量的函数的乘积形式操作,称为概率无向图模型的因子分解。
ψC(YC)=exp{−E(YC)}ψC(YC)称为势函数\psi_C(Y_C)=exp\{-E(Y_C)\}\\\psi_C(Y_C)称为势函数ψC(YC)=exp{−E(YC)}ψC(YC)称为势函数
二、条件随机场的定义与形式
1. 条件随机场的定义
一般的条件随机场定义为:
该公式表示:对任意一个节点vvv,给定其他所有节点时vvv的分布等于给定与它直接相连的节点时vvv的分布(局部马尔科夫性)。
线性链条件随机场定义为:
线性链条件随机场的一个重要应用是标注问题与找最佳路径(对其他模型所出的标注进行纠正)。
2. 条件随机场的参数化形式
tkt_ktk为转移特征,依赖于当前和前一个位置;sls_lsl为状态特征,依赖于当前位置。通常tkt_ktk与sls_lsl取值为1或0;当满足特征条件时,取值为1,否则为0。条件随机场完全由特征函数tkt_ktk与sls_lsl以及对应的权值λk\lambda_kλk,ulu_lul确定。
3. 条件随机场的简化形式
在条件随机场的参数化形式的基础上,对同一特征的各个位置求和,将局部特征函数转化为一个全局特征函数,这样就可以将条件随机场写成权值向量和特征向量的内积形式。
4.条件随机场的矩阵形式
三、条件随机场的三个基本问题
1.概率计算问题
条件随机场的概率计算问题是给定条件随机场P(Y∣X)P(Y |X)P(Y∣X),输入序列xxx和输出序列yyy,计算条件概率P(Yi=yi∣x)P(Y_i=y_i|x)P(Yi=yi∣x),P(Yi−1=yi−1,Yi=yi∣x)P(Y_{i-1}=y_{i-1},Y_i=y_i|x)P(Yi−1=yi−1,Yi=yi∣x)以及相应的数学期望的问题。条件随机场的概率计算算法是前向-后向算法。
2. 学习问题
条件随机场的学习问题是求定义在时序数据上的对数线性模型参数www。条件随机场的学习算法是改进的迭代尺度法与拟牛顿法。
3. 预测问题
条件随机场的预测问题是给定条件随机场P(Y∣X)P(Y|X)P(Y∣X)和输入序列(观测序列)xxx,求条件概率最大的输出序列y∗y^*y∗,即对观测序列进行标注。条件随机场的预测算法是维特比算法(动态规划)。
如果对您有帮助,麻烦点赞关注,这真的对我很重要!!!如果需要互关,请评论或者私信!
nlp基础—9.条件随机场模型(CRF算法)相关推荐
- 概率图模型笔记(三)条件随机场(CRF)基础
写在前面 前面写完了HMM,比较重点的就是HMM的三个问题,需要好好消化.这篇博客主要介绍条件随机场,相比于HMM,CRF的应用可能会更广.从刚接触CRF开始也很久了,但是由于书上公式非常晦涩难懂,而 ...
- 条件随机场(CRF)和隐马尔科夫模型(HMM)最大区别在哪里?CRF的全局最优体现在哪里?
作者:尔总的马甲 链接:https://www.zhihu.com/question/53458773/answer/554436625 来源:知乎 著作权归作者所有.商业转载请联系作者获得授权,非商 ...
- 使用条件随机场模型解决文本分类问题(附Python代码)
对深度学习感兴趣,热爱Tensorflow的小伙伴,欢迎关注我们的网站!http://www.tensorflownews.com.我们的公众号:磐创AI. 一. 介绍 世界上每天都在生成数量惊人的文 ...
- 马尔可夫模型与条件随机场模型
https://blog.csdn.net/s151506879/article/details/51912595 条件随机场模型是由Lafferty在2001年提出的一种典型的判别式模型.它在观测序 ...
- 机器学习理论《统计学习方法》学习笔记:第十一章 条件随机场(CRF)
第十一章 条件随机场(CRF) 摘要 1 概率无向图模型 1.1 概率无向图模型定义 1.2 概率无向图模型的因子分解 1.3 D-划分 1.4 马尔可夫随机场在图像中的应用 2 条件随机场的定义与形 ...
- 条件随机场(CRF)的详细解释
条件随机场(CRF)由Lafferty等人于2001年提出,结合了最大熵模型和隐马尔可夫模型的特点,是一种无向图模型,常用于标注或分析序列资料,如自然语言文字或是生物序列.近年来在分词.词性标注和命名 ...
- 条件随机场(CRF)极简原理与超详细代码解析
条件随机场(CRF)极简原理与超详细代码解析 1. 原理 1.1 从名称说起 1.2 优化的目标 1.3 如何计算 2. 代码 2.1 基本结构 2.2 模型初始化 2.3 BERT提取的特征如何输入 ...
- 如何轻松愉快的理解条件随机场(CRF)
转载自 如何轻松愉快的理解条件随机场(CRF) 如何轻松愉快的理解条件随机场(CRF)? 理解条件随机场最好的办法就是用一个现实的例子来说明它. 但是目前中文的条件随机场文章鲜有这样干的,可能写文章 ...
- 条件随机场(CRF)
一.条件随机场(Conditional Random Fields). 条件随机场(CRF)是在给定一组输入随机变量条件下另外一组输出随机变量的条件概率分布模型,它是一种判别式的概率无向图模型,既然是 ...
- 基于条件随机场模型的中文分词改进(Python中文分词)
目录 改进分词速度 一.更改存储特征值的数据结构 二.缩短对语料库的遍历时间(对语料库的预处理) 三.先将所有的特征值保存到数据库中 改进分词的准确度 实验项目和结果截图 实验项目 保存特征值时采用多 ...
最新文章
- 普通高中计算机课程软件,普通高中信息技术课程标准(2017 年版)(4):选修课程...
- Nmap源码分析(主机发现)
- [IE9] GPU硬件加速到底是实用创新还是噱头
- 图像局部显著性—线特征
- 团队作业6——展示博客(Alpha版本)
- phoneGap2.9+eclipse开发环境和helloword案例
- python shelve模块
- java中Cookie中文字符乱码问题
- Enter passphrase for key '/home/mha/.ssh/id_rsa解决方法
- C语言——机器平台对强制类型转换的影响
- js 音乐播放器(audio属性及其使用方法)
- Cacti监控Varnish
- ajax 关闭弹窗并跳转到url_Python 爬虫 | Ajax数据爬取
- 手机游戏开发工程师培训教程
- 无限火力无法连接到服务器,“无限火力”回来啦!连拳头都要世界聚焦于你 全新7777装备即将上线!...
- Http 417错误
- java一只母牛 一年生头小牛_Java实现:工厂有一头母牛,一年生一头小母牛,小母牛五年后可以生小牛,问20年工厂有多少头牛?...
- 推荐25种自媒体运营必备工具 (建议收藏)
- 优秀的 Node.js 包汇总
- oracle显示无效的月份,Oracle插入失败:无效的月份