统计语言模型实际上是一个概率模型,所以常见的概率模型都可以用于求解这些参数

常见的概率模型有:N-gram 模型、决策树、最大熵模型、隐马尔可夫模型、条件随机场、神经网络等

目前常用于语言模型的是 N-gram 模型和神经网络语言模型

一、概率的链式规则(Chain Rule)

朴素贝叶斯中使用的独立性假设为
P(x1,x2,x3,...,xn)=P(x1)P(x2)P(x3)...P(xn)(1)P(x_1,x_2,x_3,...,x_n)=P(x_1)P(x_2)P(x_3)...P(x_n) \tag{1}P(x1,x2,x3,...,xn)=P(x1)P(x2)P(x3)...P(xn)(1)
去掉独立性假设,有下面这个恒等式,即联合概率链规则
P(x1,x2,x3,...,xn)=P(x1)P(x2∣x1)P(x3∣x1,x2)...P(xn∣x1,x2,...,xn−1)(2)P(x_1,x_2,x_3,...,x_n)=P(x_1)P(x_2|x_1)P(x_3|x_1,x_2)...P(x_n|x_1,x_2,...,x_{n-1}) \tag{2}P(x1,x2,x3,...,xn)=P(x1)P(x2x1)P(x3x1,x2)...P(xnx1,x2,...,xn1)(2)
其中, xix_ixi代表一个词,联合概率链规则表示句子中每个词都跟前面一个词有关,而独立性假设则是忽略了一个句子中词与词之间的前后关系。

例如:S = 我爱北京天安门,那么此时我们希望知道这句话合理的可能性有多少? 就需要计算

自然语言处理(NLP)-语言模型【用来判断一句话语法上是否通顺】:N-gram语言模型(基于语料库的统计结果)--> N-gram神经网络语言模型 【语言模型的评估(①:PPL困惑度;②:BPC)】相关推荐

  1. 语言模型 python实现uni-gram和bi-gram 使用ppl困惑度对比模型效果 山东大学2019 NLP实验1

    语言模型 实验目的 实验内容 数据集 Example: 实验环境 实验思路 train test 代码实现 一元语法 train test 二元语法 Train test 测试结果 实验目的 理解并实 ...

  2. 自然语言处理(NLP)之三:语言模型

    语言模型的定义 语言模型是一种预测语句符合语法规范1的概率的计算方法.对给定语句S=W1,W2,-,WnS = W_1, W_2, \dots, W_nS=W1​,W2​,-,Wn​,其符合语法规范的 ...

  3. 自然语言处理NLP——ERNIE-M:基于回译机制的“预训练-微调”多语言模型

    目录 系列文章目录 一.背景介绍 1.多语言任务 1.1 多语言任务定义 1.2 多语言任务难题 2.多语言模型 2.1 多语言模型定义与原理 2.2 多语言模型困难 3.论文简介 3.1 背景与开发 ...

  4. 自然语言处理NLP之语义相似度、语言模型、doc2vec

    自然语言处理NLP之语义相似度.语言模型.doc2vec 目录 自然语言处理NLP之语义相似度.语言模型.doc2vec 语义相似度

  5. 自然语言处理NLP(3)——神经网络语言模型、词向量

    在上一部分中,我们了解到了统计语言模型,n-gram模型以及语料库的基本知识: 自然语言处理NLP(2)--统计语言模型.语料库 在这一部分中,我们将在此基础上介绍神经网络语言模型以及词向量的相关知识 ...

  6. 独家 | 一文读懂自然语言处理NLP(附学习资料)

    前言 自然语言处理是文本挖掘的研究领域之一,是人工智能和语言学领域的分支学科.在此领域中探讨如何处理及运用自然语言. 对于自然语言处理的发展历程,可以从哲学中的经验主义和理性主义说起.基于统计的自然语 ...

  7. 自然语言处理nlp全领域综述

    ************************* 精华总结,时间不够只看这个部分就行了 1.书和课 Michael Collins:COMS W4705: Natural Language Proc ...

  8. 自然语言处理NLP(10)——语义分析

    在上一部分中,我们介绍了句法分析中的局部句法分析以及依存关系分析(自然语言处理NLP(9)--句法分析c:局部句法分析.依存关系分析),至此,繁复冗长的句法分析部分就结束了. 在这一部分中,我们将要介 ...

  9. [深度学习] 自然语言处理 --- NLP入门指南

    NLP的全称是Natuarl Language Processing,中文意思是自然语言处理,是人工智能领域的一个重要方向 自然语言处理(NLP)的一个最伟大的方面是跨越多个领域的计算研究,从人工智能 ...

最新文章

  1. 行人识别,无需Anchor | CVPR 2021
  2. js date 前一天
  3. 易创互联 php,易创网站管理系统(DIRCMS) 2011 SP3 UTF8
  4. 施一公的三位杰出女弟子
  5. 我开源的软件只能我拿来赚钱
  6. Unity MegaFiers 顶点动画
  7. vue 后台重定向不成功_VUE 重定向不起效果了。
  8. (25)VHDL实现与(数据流描述)
  9. Oracle11g客户端安装配置
  10. JSON DATE 转换标准的一些资料(收集)
  11. java 二进制置位,重置
  12. 一种去除U盘写保护的可行方法(dd 命令解决)
  13. 局域网联通公网小部分知识点
  14. [LaTex] 如何插入多个图片及子图片(subfigure)
  15. 【NOIP2016普及组】复赛——魔法阵
  16. 小鸡腿U T6 2013FINAL
  17. “2021流行趋势发布·新品试骑活动”引爆羊城
  18. Dijkstra算法讲解(通过边实现松弛)
  19. c#:使用网易邮箱账号发送电子邮件
  20. python——annotate函数

热门文章

  1. 域名解析错误分析及解决
  2. cordova版本更新_如何升级cordova插件
  3. MT6765 + Android9.0修改开机动画
  4. 如何使用LaTeX制作PPT?
  5. 关于谷歌浏览崩溃 打不开设置界面
  6. Linux驱动开发 | 模块驱动
  7. Ylmf OS 4.0正式版已经发布
  8. 每日10行代码156:Python实现简单的文件加密解密
  9. hd4600黑苹果html5死机,黑苹果懒人版10.10.5驱动HD4600
  10. C语言(一)认识了解C语言