自然语言处理(NLP)-语言模型【用来判断一句话语法上是否通顺】:N-gram语言模型(基于语料库的统计结果)--> N-gram神经网络语言模型 【语言模型的评估(①:PPL困惑度;②:BPC)】
统计语言模型实际上是一个概率模型,所以常见的概率模型都可以用于求解这些参数
常见的概率模型有:N-gram 模型、决策树、最大熵模型、隐马尔可夫模型、条件随机场、神经网络等
目前常用于语言模型的是 N-gram 模型和神经网络语言模型
一、概率的链式规则(Chain Rule)
朴素贝叶斯中使用的独立性假设为
P(x1,x2,x3,...,xn)=P(x1)P(x2)P(x3)...P(xn)(1)P(x_1,x_2,x_3,...,x_n)=P(x_1)P(x_2)P(x_3)...P(x_n) \tag{1}P(x1,x2,x3,...,xn)=P(x1)P(x2)P(x3)...P(xn)(1)
去掉独立性假设,有下面这个恒等式,即联合概率链规则
P(x1,x2,x3,...,xn)=P(x1)P(x2∣x1)P(x3∣x1,x2)...P(xn∣x1,x2,...,xn−1)(2)P(x_1,x_2,x_3,...,x_n)=P(x_1)P(x_2|x_1)P(x_3|x_1,x_2)...P(x_n|x_1,x_2,...,x_{n-1}) \tag{2}P(x1,x2,x3,...,xn)=P(x1)P(x2∣x1)P(x3∣x1,x2)...P(xn∣x1,x2,...,xn−1)(2)
其中, xix_ixi代表一个词,联合概率链规则表示句子中每个词都跟前面一个词有关,而独立性假设则是忽略了一个句子中词与词之间的前后关系。
例如:S = 我爱北京天安门,那么此时我们希望知道这句话合理的可能性有多少? 就需要计算
自然语言处理(NLP)-语言模型【用来判断一句话语法上是否通顺】:N-gram语言模型(基于语料库的统计结果)--> N-gram神经网络语言模型 【语言模型的评估(①:PPL困惑度;②:BPC)】相关推荐
- 语言模型 python实现uni-gram和bi-gram 使用ppl困惑度对比模型效果 山东大学2019 NLP实验1
语言模型 实验目的 实验内容 数据集 Example: 实验环境 实验思路 train test 代码实现 一元语法 train test 二元语法 Train test 测试结果 实验目的 理解并实 ...
- 自然语言处理(NLP)之三:语言模型
语言模型的定义 语言模型是一种预测语句符合语法规范1的概率的计算方法.对给定语句S=W1,W2,-,WnS = W_1, W_2, \dots, W_nS=W1,W2,-,Wn,其符合语法规范的 ...
- 自然语言处理NLP——ERNIE-M:基于回译机制的“预训练-微调”多语言模型
目录 系列文章目录 一.背景介绍 1.多语言任务 1.1 多语言任务定义 1.2 多语言任务难题 2.多语言模型 2.1 多语言模型定义与原理 2.2 多语言模型困难 3.论文简介 3.1 背景与开发 ...
- 自然语言处理NLP之语义相似度、语言模型、doc2vec
自然语言处理NLP之语义相似度.语言模型.doc2vec 目录 自然语言处理NLP之语义相似度.语言模型.doc2vec 语义相似度
- 自然语言处理NLP(3)——神经网络语言模型、词向量
在上一部分中,我们了解到了统计语言模型,n-gram模型以及语料库的基本知识: 自然语言处理NLP(2)--统计语言模型.语料库 在这一部分中,我们将在此基础上介绍神经网络语言模型以及词向量的相关知识 ...
- 独家 | 一文读懂自然语言处理NLP(附学习资料)
前言 自然语言处理是文本挖掘的研究领域之一,是人工智能和语言学领域的分支学科.在此领域中探讨如何处理及运用自然语言. 对于自然语言处理的发展历程,可以从哲学中的经验主义和理性主义说起.基于统计的自然语 ...
- 自然语言处理nlp全领域综述
************************* 精华总结,时间不够只看这个部分就行了 1.书和课 Michael Collins:COMS W4705: Natural Language Proc ...
- 自然语言处理NLP(10)——语义分析
在上一部分中,我们介绍了句法分析中的局部句法分析以及依存关系分析(自然语言处理NLP(9)--句法分析c:局部句法分析.依存关系分析),至此,繁复冗长的句法分析部分就结束了. 在这一部分中,我们将要介 ...
- [深度学习] 自然语言处理 --- NLP入门指南
NLP的全称是Natuarl Language Processing,中文意思是自然语言处理,是人工智能领域的一个重要方向 自然语言处理(NLP)的一个最伟大的方面是跨越多个领域的计算研究,从人工智能 ...
最新文章
- 行人识别,无需Anchor | CVPR 2021
- js date 前一天
- 易创互联 php,易创网站管理系统(DIRCMS) 2011 SP3 UTF8
- 施一公的三位杰出女弟子
- 我开源的软件只能我拿来赚钱
- Unity MegaFiers 顶点动画
- vue 后台重定向不成功_VUE 重定向不起效果了。
- (25)VHDL实现与(数据流描述)
- Oracle11g客户端安装配置
- JSON DATE 转换标准的一些资料(收集)
- java 二进制置位,重置
- 一种去除U盘写保护的可行方法(dd 命令解决)
- 局域网联通公网小部分知识点
- [LaTex] 如何插入多个图片及子图片(subfigure)
- 【NOIP2016普及组】复赛——魔法阵
- 小鸡腿U T6 2013FINAL
- “2021流行趋势发布·新品试骑活动”引爆羊城
- Dijkstra算法讲解(通过边实现松弛)
- c#:使用网易邮箱账号发送电子邮件
- python——annotate函数