n-gram的n大小对性能的影响

  • n更大的时候
    n: 对下一个词出现的约束性信息更多,更大的辨别力,但是更稀疏,并且n-gram的总数也更多,为 V^n 个(V为词汇表的大小)
  • n更小的时候
  • 在训练语料库中出现的次数更多,更可靠的统计结果,更高的可靠性 ,但是约束信息更少

其中当N为特定值的时候,我们来看一下n-gram可能的总数,如下表:

对于上图,我用一个例子来进行解释,加入目前词汇表中就只有三个单词,”我爱你“,那么bigram的总数是3^2=9个,有”我我“,我爱,我你,爱爱,爱你,爱我,你你,你我,你爱这9个,所以对应上面的表示是bigrams是20000^2=400000000,trigrams=20000^3 = 8*10e12

好,到这里讲解了n-gram的基本内容了。

https://zhuanlan.zhihu.com/p/32829048

N-GRAM模型的概率公式相关推荐

  1. 估计中的概率公式总结

    估计中的概率公式总结 0.引言 1.基本概念 2.贝叶斯公式 3.独立 4.条件联合分布 5.条件贝叶斯公式 6.马尔科夫 0.引言 近期遇到的概率公式,整理一下. 1.基本概念 条件概率 P(A∣B ...

  2. 模型违约概率到信用评分的转化

    模型违约概率到信用评分的转化 定义坏好比 o d d s = p / ( 1 − p ) odds=p/(1-p) odds=p/(1−p) P是LR计算的违约概率(即坏人的概率),1-p即好人的概率 ...

  3. R语言glm拟合logistic回归模型:模型评估(模型预测概率的分组密度图、混淆矩阵、准确率、精确度、召回率、ROC、AUC)、PRTPlot函数获取logistic模型最优阈值(改变阈值以优化)

    R语言glm拟合logistic回归模型:模型评估(模型预测概率的分组密度图.混淆矩阵.Accuray.Precision.Recall.ROC.AUC).PRTPlot函数可视化获取logistic ...

  4. 计算机公式加法A C,概率公式c怎么计算

    概率公式c计算方法:一般地,C(n,k)=n(n-1)(n-2)...(n-k+1)/k!,其中k≤n.例如,C(12,3)=12x11x10/3!=1320/(3x2x1)=1320/6=220. ...

  5. macd的python代码同花顺_超牛MACD(代编写程序化交易模型)-同花顺公式 -程序化交易(CXH99.COM)...

    相关标签: 5 13 21最绝的均线战法 . macd参数设置 13 34 5 . macd指标使用技巧口诀 . 日线macd参数最佳设置 . macd参数最佳调整原理 . 日线macd最优参数 . ...

  6. 概论_第2章_一维均匀分布的概率公式

    均匀分布的概率计算有一个概率公式: 设X~U(a, b), a≤c<d≤b, 即 [c, d] ⊂ [a, b], 则 P{c≤X≤d} = 使用这个公式计算概率很方便, 例如, X~U(0, ...

  7. 概率论基础 —— 2. 条件概率、全概率、贝叶斯概率公式

    文章目录 条件概率 全概率 贝叶斯概率 条件概率 条件概率是一种比较特殊的概率体系,和我们前面提到过的基本概率(交事件)有所不同.它最大的特点在于事件发生时有一定的限制前提,通常一般是说在事件A发生后 ...

  8. 数学-先验概率和后验概率和一系列概率公式理解

    自用. 一. 先验概率和后验概率理解 这两个都是描述某个结论H发生的概率. 假如我当前什么证据都没有,就根据之前的人生经历,思索下说P(H)=0.99,认为结论H发生的可能高达99%,那这时的P(H) ...

  9. H.B.Pacejke轮胎模型(魔术公式)

    轮胎的非线性特性对汽车的转向特性及行驶稳定性有非常重要的影响.进行汽车控制研究往往要建立精确的轮胎模型.目前应用比较广泛的轮胎模型有: Fiala轮胎模型 UA轮胎模型 郭孔辉轮胎模型(幂指数公式) ...

最新文章

  1. Effective C++ Item 30 inline里里外外
  2. 图片加载利器Picasso 解析
  3. docker tomcat mysql_Docker下Tomcat容器中使用Mysql的方法
  4. 有道云笔记到简书的迁移工具
  5. 删除microsoft_如何从您的Microsoft帐户中删除设备
  6. SQLi LABS Less 17 报错注入
  7. c语言数组及其下标引用,C语言之数组下标引用与间接引用
  8. 汇智创科机器人,【汇智创科机器人】这个周六,和孩子一起“动手不动口”,比比看谁最棒!...
  9. 服务器电脑怎么样装系统,如何给服务器安装系统,是不是和PC机一样安装?
  10. Windows 11快捷键功能大全 28个Windows 11快捷键功能介绍
  11. 糜烂性胃炎吃什么药?
  12. jQuery实现小游戏源代码--打灰太狼
  13. 用正温度系数的热敏电阻PT100如何设计温度采集电路?
  14. HTML——HTML 简介
  15. 《C陷阱与缺陷》书评兼感想
  16. js实现页面刷新、全屏、退出全屏
  17. 2K20安卓修改器服务器到期,nba2k20手机版修改器
  18. 将数字代码转成对应的地区缩写
  19. 怎么修复佳能相机断电死机DAT文件为MOV或MP4视频
  20. 鸿蒙安卓双系统手机,华为P50再次确认!鸿蒙/安卓双系统版本加持:或成绝版旗舰机...

热门文章

  1. idea 更改自动补全返回值_整理了一些 IDEA 中比较骚的技巧
  2. calabash-android教程,自动化测试工具_Calabash-android调研
  3. Docker学习(7)——常用的镜像构建方式简介
  4. python使用什么函数接收用户输入的数据_python 3.x:调用和执行函数的用户输入...
  5. ca 自建 颁发证书_openssl自建CA后颁发证书
  6. pycahrm配置path_Pycharm常用配置
  7. springboot过滤字段_SpringBoot自定义过滤器的两种方式及过滤器执行顺序
  8. 运行时常量池在哪里_Java虚拟机详解(二)------运行时内存结构
  9. mysql python 接口_Python中的MySQL接口:PyMySQL MySQLdb
  10. cmd指令大全指令_Linux 超全实用指令大全 | CSDN 博文精选