机器翻译评测方法——BLEU

BLEU(Bilingual Evaluation understudy)方法由IBM提出,这种方法认为如果熟译系统魏译文越接近人工翻翻译结果,那么它的翻译质量越高。所以,评测关键就在于如何定义系统译文与参考译文之间的相似度。BLEU 采用的方式是比较并统计共同出现的n元词的个数,即统计同时出现在系统译文和参考译文中的n元词的个数,最后把匹配到的n元词的数目除以系统译文的单词数目,得到评测结果。

最开始提出的BLEU法虽然简单易行,但是它没有考虑到翻译的召回率。

后对BLEU做了修正,首先计算出一个n元词在一个句子中最大可能出现的次数MaxRefCount(n-gram),然后跟候选译文中的这个n元词出现的次数作比较,取它们之间最小值作为这个n元词的最终匹配个数。

参考:

https://www.cnblogs.com/by-dream/p/7679284.html

https://www.jianshu.com/p/1517a75af993

机器翻译评测方法——BLEU相关推荐

  1. 基于词汇衔接的文档级扩展机器翻译评测指标

    摘要 本文提出了通过词汇链接的使用来提高文档级别机器翻译评估性能的想法.作为一种实现文字连贯的语言手段,词汇衔接通过相同或相关的意思的单词将句子连在一起组成一个有意义的交织结构.机器翻译与人工翻译进行 ...

  2. 自动文摘评测方法:Rouge-L、Rouge-N

    Rouge-L 的初认识 本人参加百度机器阅读理解比赛,发现阅读理解比赛的评价标注,以Rouge-L为主,若 Rouge-L相同的 话,则看 BLEU-4.由此可见,Rough-L 作为自动文摘评测方 ...

  3. AI芯片评测如何与时俱进?地平线提出全新MAPS评测方法,帮助用户理解AI芯片性能...

    允中 发自 凹非寺 量子位 编辑 | 公众号 QbitAI AI芯片性能该如何评估?目前业界内有两种: 一是峰值算力,它反映AI芯片理论上的最大算力,但却不能反映其在实际场景中的处理能力: 二是目前行 ...

  4. 中文分词器分词效果的评测方法

    [原创]中文分词器分词效果的评测方法 2013年8月27日 由 learnhard留言 » 转载请注明出处:http://www.codelast.com/ 现在有很多开源的中文分词器库,如果你的项目 ...

  5. 云计算公网质量评测方法和最佳实践

    简介:云计算的公网质量评测作为企业上云选型的关键流程已经变得越来越重要,但当前业界并没有一套完整的云计算公网质量的评测方法和原则的指导. 本文对国内和海外的云计算公网质量评测方法做了较深入的分析,并提 ...

  6. Android App性能自动化评测方法

    前言 App运行在设备上的性能表现也是质量保障的一个重要环节.因此,当我们确保了基本功能的准确之后,还需要有一定的方法评测App在不同设备上的性能表现.本文将从性能指标,评测方法,自动化体系建设等三个 ...

  7. 性能评测方法、各评测项标准总结

    1.前言 性能测评涵盖众多方面,在测试收集每一项数据的时候,要注意考虑其为什么可以表征某一方面性能的强弱好坏.这是从选取指标的角度来考虑. 然后,每一个指标,具体需要哪些数据才可以计算得到.这是从计算 ...

  8. matlab计算后验概率,基于深度神经网络后验概率算法的口语发音评测方法与流程...

    本发明涉及发音评测领域,特别涉及一种基于深度神经网络后验概率算法的口语发音评测方法. 背景技术: 常用的语音评测技术,比如用于英语口语教学中的语音评测,一般都是采用智能打分技术对学习者的口语进行评测, ...

  9. 中文文字检测与识别的评测方法

    评测代码github地址 如果对您有所帮助请star一下,谢谢 这是我将下面介绍的两种方法的代码合并了,并且该了一些原有的bug,如-p参数不能用等,还加了end to end的识别结果的评测方法. ...

最新文章

  1. IDEA在debug环境下,端口被占用
  2. SpringBatch 自定义ItemReader和可重新启动Reader(十五)
  3. 设计模式的理解: 职责链模式 (Chain of Responsibility)
  4. 测试GPU的材质填充率
  5. Java用TCP手写聊天室 可以 私聊版加群聊版
  6. C++ — 智能指针的简单实现以及循环引用问题
  7. Request 部分功能
  8. 为什么我使用Java
  9. Unity2019.2中文更新日志速览版
  10. gcc观察运行时链接符号绑定
  11. Android 移动应用开发模拟题
  12. 23种设计模式设计原则
  13. 有哪些资本运作的经典案例?
  14. 程序员如何提升自己的能力
  15. 使用MOno Cecil 的相关开源项目
  16. 牛腩新闻发布--本地超链接打不开
  17. 北京游玩攻略,-怎么游玩清华北大
  18. Cascading Convolutional Color Constancy
  19. 怎么调大计算机浏览器内字体,W7系统浏览器字体大小设置的方法
  20. 电子学会图形化二级编程题解析含答案:魔法星空

热门文章

  1. 护照 MRZ码编码规则
  2. Cay S.Horstmann:从Java新特性看Java的未来
  3. 5-2基于贝叶斯算法的新闻分类任务实战
  4. 鸿蒙坐骑九彩祥云,封神演义五大神兽坐骑排名,第一名太出人意料了!
  5. poj 1659 Havel-hakimi定理
  6. 孩子,你在家乡还好妈
  7. java导出的excel数字过长_用POI导出excel时,较长的数字不想被自动变为科学计数法的解决方式(转)...
  8. maxcms整合html5播放器,【整合】马克斯cms4.0以上版本整合ckplayer6.8[支持PC+手机WAP]ckplayerX...
  9. pandas中计算总体标准差
  10. 如何写长尾关键词的文章