自动文摘评测方法:Rouge-L、Rouge-N
Rouge-L 的初认识
本人参加百度机器阅读理解比赛,发现阅读理解比赛的评价标注,以Rouge-L为主,若 Rouge-L相同的 话,则看 BLEU-4。由此可见,Rough-L 作为自动文摘评测方法是特别有用的,接下来我讲解一下。
Rouge-L 论文:
https://www.aclweb.org/anthology/W04-1013
BLEU-4 的学习,可以看我的另一篇博客,有助于理解Rouge-N:
https://blog.csdn.net/ding_programmer/article/details/89740078
什么是Rouge呢?
Rouge(Recall-Oriented Understudy for Gisting Evaluation),是评估自动文摘以及机器翻译的一组指标。它通过将自动生成的摘要或翻译与一组参考摘要(通常是人工生成的)进行比较计算,得出相应的分值,以衡量自动生成的摘要或翻译与参考摘要之间的“相似度”。
Rouge-N
Rouge-1、Rouge-2、Rouge-N
分母是n-gram的个数,分子是参考摘要和自动摘要共有的n-gram的个数。直接借用文章[2]中的例子说明一下:
自动摘要YY(一般是自动生成的):
the cat was found under the bed
参考摘要(标准答案),X1X1(gold standard ,人工生成的):
the cat was under the bed
summary的1-gram、2-gram如下,N-gram以此类推:
分子是待评测摘要和参考摘要都出现的1-gram的个数,分子是参考摘要的1-gram个数。(其实分母也可以是待评测摘要的,但是在精确率和召回率之间,我们更关心的是召回率Recall,同时这也和上面ROUGN-N的公式相同)
同样,
Rouge-L
L即是LCS(longest common subsequence,最长公共子序列)的首字母,因为Rouge-L使用了最长公共子序列。Rouge-L计算方式如下图:
其中 是X和Y的最长公共子序列的长度,考虑顺序。
分别表示参考摘要(人工摘要)和 自动摘要(机器生成的摘要)的长度(一般就是所含词的个数)
分别表示召回率和准确率。最后的
即是我们所说的Rouge-L。
对于什么是召回率、什么是准确率,F-measure 可以看我的另一篇博客:
https://blog.csdn.net/ding_programmer/article/details/89740668
当 很大的时候
所以 当, 被设置为一个很大的数,所以 Rouge_L几乎只考虑了
,与上文所说的一般只考虑召回率对应。
参考文献:
https://blog.csdn.net/qq_25222361/article/details/78694617#t2
https://www.aclweb.org/anthology/W04-1013
自动文摘评测方法:Rouge-L、Rouge-N相关推荐
- 自动文摘评测方法:Rouge-1、Rouge-2、Rouge-L、Rouge-S
关于ROUGE ROUGE(Recall-Oriented Understudy for Gisting Evaluation),在2004年由ISI的Chin-Yew Lin提出的一种自动摘要评价方 ...
- 几个机器翻译与自动文摘评价指标
文章目录 总体认识 客观评价指标 BLEU METEOR ROUGE ROUGE-N ROUGE-L ROUGE-S 参考资料 总体认识 自然语言中的机器翻译或者自动文摘任务的评价指标主要分为两大类: ...
- 【CIPS 2016】(8-10章)信息抽取、情感分析自动文摘 (研究进展、现状趋势)
CIPS 2016 笔记整理 <中文信息处理发展报告(2016)>是中国中文信息学会召集专家对本领域学科方 向和前沿技术的一次梳理,官方定位是深度科普,旨在向政府.企业.媒体等对中文 信息 ...
- 简易中文自动文摘系统(合集)
目录 简易中文自动文摘系统(一):绪论 自动文摘的介绍 自动文摘分类 简易中文自动文摘系统(二):中文语料库的准备 中文语料库 jieba分词 简易中文自动文摘系统(三):模型训练 词向量 word2 ...
- 自然语言处理NLP——中文抽取式自动文摘(包括中文语料库处理、三种方法实现自动文摘、Rouge评价方法对自动文摘进行打分)
利用三种方法实现抽取式自动摘要,并给摘要结果打分(一.textrank 二.word2vec+textrank 三.MMR 四.Rouge评测) 具体代码我上传到了Github上,其中有45篇小论文( ...
- Rouge | 自动文摘及机器翻译评价指标
tag:评价指标,摘要,nlp Rouge(Recall-Oriented Understudy for Gisting Evaluation),是评估自动文摘以及机器翻译的一组指标.它通过将自动生成 ...
- AAAI 2020 | 多模态基准指导的生成式多模态自动文摘
2020-01-06 10:17 导语:基本想法是优化多模态摘要训练的目标函数~ 作者 | 朱军楠.张家俊 多模态自动文摘是指利用计算机实现从含有两种或两种以上模态(如图片.文本等)的信息中生成图文式 ...
- 论文浅尝 - AAAI2020 | 多模态基准指导的多模态自动文摘
论文笔记整理:刘雅,天津大学硕士. 链接: https://aaai.org/ojs/index.php/AAAI/article/view/6525 动机 近年来,随着计算机视觉以及自然语言处理技术 ...
- 中文自动文摘关键技术总结
中文自动文摘关键技术总结 搜索微信公众号:'AI-ming3526'或者'计算机视觉这件小事' 获取更多AI干货 csdn:https://blog.csdn.net/abcgkj github:ht ...
最新文章
- pandas 知识点补充:绘图plot
- Flink 分别读取kafka和mysql作为source
- 小课堂?小视频?小商店?
- .NET面试题解析(04)-类型、方法与继承
- MaxCompute - ODPS重装上阵 第一弹 - 善用MaxCompute编译器的错误和警告
- php $key{$x},Thinkphp 3.x key可控注入(?)
- HTML5截取视频第一帧作为预览图片
- 分布排序(distribution sorts)算法大串讲
- python求解二次规划问题
- c++vs解决字符常量过多
- python中ix用法_Python Pandas Series.ix用法及代码示例
- PJzhang:我发现一个有两个答案的数独题
- [经验] 系统封装常见问题大总结(非官方)
- 天水市师院计算机系好吗,天水师范学院专业排名及介绍 哪些专业最好
- 机器人波波熊_【菠菠智能悦读机器人绘本更新篇】新技能get!BoBo本周新增绘本103本!...
- origin作图怎样延伸_Origin使用
- 检索 国家自然科学基金
- 普通最小二乘法( Ordinary Least Square,OLS)
- 不再依赖光荣,全新脚本引擎还原《三国志曹操传》
- 深度强化学习面试问题集锦