引用wiki上的话

“A model of an unknown probability distribution p, may be proposed based on a training sample that was drawn from p. Given a proposed probability model q, one may evaluate q by asking how well it predicts a separate test sample x1, x2, ..., xN also drawn from p. The perplexity of the model q is defined as

where  b is customarily 2. Better models q of the unknown distribution p will tend to assign higher probabilities q(xi) to the test events. Thus, they have lower perplexity: they are less surprised by the test sample.”

p为未知的概率分布,q为训练得到的概率模型,一般来说,训练的概率模型越好,q(x)会趋向于给的更高,困惑度就会越低,对测试集的泛化能力越好。

“The exponent may also be regarded as a cross-entropy,

P = 2^H(p,q)

where p denotes the empirical distribution of the test sample (i.e., p(x)=n/N} if x appeared n times in the test sample of size N).”

困惑度也可以认为是交叉熵的指数形式,两者都是用于度量两个概率分布间的差异性信息,p为测试集的经验分布,q为训练出的概率模型,两个模型越接近,交叉熵越小,困惑度也越小。

Perplexity困惑度解释相关推荐

  1. Perplexity(困惑度)

    转载请注明出处,谢谢. #什么是Perplexity(困惑度)? 在信息论中,perplexity(困惑度)用来度量一个概率分布或概率模型预测样本的好坏程度.它也可以用来比较两个概率分布或概率模型.( ...

  2. 【LM】(八)语言模型评价指标——困惑度Perplexity原理及代码

    0.语言模型 语言模型(Language Model,LM),基于统计的语言模型,给出一句话的前k个词,预测第k+1个词,即求第k+1个词出现的概率p(xk+1|x1,x2,...,xk).在深度网络 ...

  3. 困惑度 (perplexity)

    困惑度 (perplexity) 在自然语言处理中,对于一个语言模型,一般用困惑度来衡量它的好坏,困惑度越低,说明语言模型面对一句话感到困惑的程度越低,语言模型就越好. 对于LDA模型,最常用的两个评 ...

  4. 机器翻译, 文本生成等任务评价指标 BLEU, ROUGE, PPL(困惑度)

    一:BLEU  1.1  BLEU 的全称是 Bilingual evaluation understudy,BLEU 的分数取值范围是 0-1,分数越接近1,说明翻译的质量越高.BLEU 主要是基于 ...

  5. perplexity 衡量指标_通俗解释困惑度 (Perplexity)-评价语言模型的好坏

    一.语言模型 本文尽量通俗解释一下困惑度的概念.既然题目中写了是用来评价语言模型的好坏,那么首先来看一下语言模型:忆臻:深入浅出讲解语言模型​zhuanlan.zhihu.com 简单地说,语言模型就 ...

  6. perplexity 衡量指标_困惑度(perplexity)的基本概念及多种模型下的计算(N-gram, 主题模型, 神经网络)...

    让人困惑的困惑度 发现网络上流传的关于困惑度(perplexity)大多数都是利用了N-gram或者主题模型的例子来阐述的.但是现在这个年代来学习这个指标的人多半都是想研究神经网络的,而两者对困惑度 ...

  7. 困惑度 perplexity

    在自然语言处理中,困惑度是用来衡量语言模型优劣的一个方法.它的值是对交叉熵损失函数做指数运算后得到的结果. 交叉熵损失函数 单个训练样本的损失: loss=−1n∑i=1nyilogyi^=−logy ...

  8. 语言模型评价指标 bpc(bits-per-character)和困惑度ppl(perplexity)

    首先简单介绍下语言模型的标准评价指标: 1. 混淆度 (Perplexity) 用来衡量一个语言模型在未见过的的字符串S上的表现.对于一个长度为N的字符串S,语言模型给出概率P(S),对应的混淆度 ( ...

  9. NLP基础知识点:困惑度(Perplexity)

    本篇内容翻译自Speech and Language Processing. Daniel Jurafsky & James H. Martin. 链接:https://web.stanfor ...

最新文章

  1. 快来试试 Spring Boot 应用可视化监控,一目了然!
  2. 2022新冠两大毒王合体?印媒炒作高危变异毒株缝合怪「Delmicron」
  3. php和js中,utf-8编码转成base64编码
  4. [Winform]检测exe是否已经运行,并将其置顶
  5. PHP Fatal error: Class #39;DOMDocument#39; not found
  6. 部署在sae上的servlet程序出现is not a javax.servlet.Servlet 错误
  7. 安装LAMP环境(PHP5.4)
  8. 1298 FORZA David Beckham
  9. ZJOI2008 生日聚会
  10. Access入门之基本操作和认识
  11. hadoop的map和reduce
  12. 4.7开发者日:创业工场麦刚认为创业者活下去最重要
  13. AutoJs学习-截屏器
  14. hive静态与动态分区理解
  15. LINUX时间格式查看
  16. 【雕爷学编程】Arduino动手做(42)---PM2.5粉尘传感器
  17. html怎么让视频背景固定不动,视频如何做到背景不动人物动的效果?背景动人物不动的视频...
  18. 国外卫星地图 Sentinel Hub EO Browser的使用
  19. 计算机毕业设计Java中医药院校科研会议系统(源码+系统+mysql数据库+Lw文档)
  20. 山东师范大学计算机专硕考研人数,考研高校就业和薪酬数据统计:山东师范大学...

热门文章

  1. 你知道判断高防抗ddos的能力吗?
  2. json字符串转换成list对象
  3. paddle 图标注_UI进阶干货 如何标注才能高度还原设计稿?
  4. LNMP一键安装包如何重装Nginx
  5. win10重置网络后所有网卡都消失了
  6. LA 4986 hdu3756 Dome of Circus 三分答案
  7. 小手一敲,让JS Map现原形
  8. 2020第二十四届软博会数据治理专场演讲嘉宾及日程安排
  9. python你已经是个成熟的软件了_你已经是个成熟的系列表情包大全_支付宝微信等软件中招_软吧...
  10. Mac字体怎么安装?如何在macOS电脑导入字体文件?