文章地址:ROUGE: A Package for Automatic Evaluation of Summaries

代码地址(非官方):https://github.com/tylin/coco-caption

文章由University of Southern California发表在2004ACL上。

ROUGE为 Recall-Oriented Understudy for Gisting Evaluation的缩写。文章ROUGE提出了用来评价文本摘要算法的评价集,里面包含了四个评价算法,分别为ROUGE-N、ROUGE-L、ROUGE-W、ROUGE-S。在image-captioning中采用了其中的ROUGE-L评价方法。

一、LCS的定义

在解释ROUGE-L之前,先解释一下LCS(Longest Common Subsequence)的含义。

当有一个序列 Z = [ z 1 , z 2 , . . . , z n ] Z=[z_1, z_2, ..., z_n] Z=[z1​,z2​,...,zn​],对于另一个序列 X = [ x 1 , x 2 , . . . , x m ] X=[x_1, x_2, ..., x_m] X=[x1​,x2​,...,xm​],存在关系 x i j = z j x_{i_j}=z_j xij​​=zj​,那么就称Z为X的子序列。其中 [ i 1 , i 2 , . . . , i k ] [i_1, i_2, ..., i_k] [i1​,i2​,...,ik​]为增序的索引,且 j = 1 , 2 , . . . , k j=1, 2, ..., k j=1,2,...,k。

二、Sentence-Level LCS

LCS想表达的意思是,如果两个摘要句子的LCS越大,那么两个摘要就越相似。基于这种思考本文提出基于LCS的F-measure。F-measure作为评测指标在很多任务中都有用到,它是准确率和召回率的hmean,也称为调和平均数。

对于一个长度为m的reference summary sentence X和一个长度为n的candidate summary sentence Y,基于LCS的F-measure计算方法如下:

R l c s = L C S ( X , Y ) m R_{lcs}=\frac{LCS(X,Y)}{m} Rlcs​=mLCS(X,Y)​

P l c s = L C S ( X , Y ) n P_{lcs}=\frac{LCS(X,Y)}{n} Plcs​=nLCS(X,Y)​

F l c s = ( 1 + β 2 ) R l c s P l c s R l c s + β 2 P l c s F_{lcs}=\frac{(1+\beta^2)R_{lcs}P_{lcs}}{R_{lcs}+\beta^2P_{lcs}} Flcs​=Rlcs​+β2Plcs​(1+β2)Rlcs​Plcs​​

上式中,LCS(X,Y)表示X和Y的最大公共子字符串(LCS)的长度, β \beta β是一个超参数。

使用LCS作为计算评测的方法由两个优势:

  1. 不用像n元组(n-gram)那类的方法,只关心连续的字符串匹配
  2. 不用像n元组那类方法,需要设置n的大小

三、image captioning中的ROUGE-L

由于image captioning中一张图片生成的一个描述 Y i Y_i Yi​,但是一张图片的参考描述存在多个 X i j X_{ij} Xij​

那么对于一张图片描述的评价结果计算如下:

R l c s i = m a x j L C S ( X i j , Y i ) m j R_{lcs_i}=max_j\frac{LCS(X_{ij},Y_{i})}{m_j} Rlcsi​​=maxj​mj​LCS(Xij​,Yi​)​

P l c s i = m a x j L C S ( X i j , Y i ) n i P_{lcs_i}=max_j\frac{LCS(X_{ij},Y_{i})}{n_i} Plcsi​​=maxj​ni​LCS(Xij​,Yi​)​

F l c s i = ( 1 + β 2 ) R l c s i P l c s i R l c s i + β 2 P l c s i F_{lcs_i}=\frac{(1+\beta^2)R_{lcs_i}P_{lcs_i}}{R_{lcs_i}+\beta^2P_{lcs_i}} Flcsi​​=Rlcsi​​+β2Plcsi​​(1+β2)Rlcsi​​Plcsi​​​

其中 n i n_i ni​为 Y i Y_{i} Yi​的长度(包含的单词数),即 n i = l e n ( Y i ) n_i=len(Y_{i}) ni​=len(Yi​),同理 m j = l e n ( X i j ) m_j=len(X_{ij}) mj​=len(Xij​), m a x j max_j maxj​为生成的描述在不同参考描述下求得的结果取最大值。注意对于 Y i Y_i Yi​取得 R c l s i R_{cls_i} Rclsi​​和 P c l s i P_{cls_i} Pclsi​​时, m a x j max_j maxj​中的j可以不相同。

对于一个待评测集合来说,最终的ROUGE-L为所有的 F l c s i F_{lcs_i} Flcsi​​求平均得到。

Image captioning评价方法之ROUGE-L相关推荐

  1. Image captioning评价方法之BLEU (bilingual evaluation understudy)

    文章地址:BLEU: a Method for Automatic Evaluation of Machine Translation 代码地址(非官方):https://github.com/tyl ...

  2. Image captioning评价方法之Meteor

    项目地址:http://www.cs.cmu.edu/~alavie/METEOR/ 代码地址(非官方实现,实现的是项目地址中的1.5版本):https://github.com/tylin/coco ...

  3. MPB:东林牛犇组玉米根系简化细菌群落的定量与其生物防治效果的评价方法(视频)...

    为进一步提高<微生物组实验手册>稿件质量,本项目新增大众评审环节.文章在通过同行评审后,采用公众号推送方式分享全文,任何人均可在线提交修改意见.公众号格式显示略有问题,建议电脑端点击文末阅 ...

  4. 模式识别的评价方法:ROC曲线, DET曲线, FPPW, FPPI

    转载自:http://blog.csdn.net/pb09013037/article/details/48949037 因个人在做模式识别相关的工作,模式识别算法最终的性能评价是关键.但苦于网上很难 ...

  5. 【图像融合】评价方法(熵、均方根误差)

    图像融合质量评价方法   一般分为主观和客观两类: 1.主观方法主要是观察者来评价融合结果的质量. 2.客观方法又分为两类:    (1)无参考图像评价方法(如信息熵).     1)单一图像统计特征 ...

  6. python图像融合算法_图像融合质量评价方法的python代码实现——MS-SSIM

    图像融合质量评价方法的python代码实现--MS-SSIM 图像融合质量评价方法的python代码实现--MS-SSIM 文章目录 1 前言 2 MS-SSIM介绍 2 MS-SSIM的代码 2.1 ...

  7. 飞机座舱布局工效综合评价与评价方法初探

    随着飞机性能的不断提高,飞行员的工作负荷及操作难度不断增大,经常导致误判和误操作.因此从工效学的角度开展座舱设计的工效学综合评价对提高飞行员工效.减少人为失误影响甚大. 座舱布局涉及到工效问题很多,如 ...

  8. 医学图像质量评价方法SSIM

    医学图像质量评价中的梯度加权SSIM探说 来源:http://pklunwen.com/ 摘要:Zhou Wang等人提出了著名的图像客观质量评价方法:结构相似度(SSIM),其理论基础是人眼视觉系统 ...

  9. 超级计算机有关文献,超级计算机系统性能平衡性预先评价方法研究

    摘要: 超级计算机系统峰值运算能力持续提升,而其实际应用却效率低下,随着两者矛盾的日益突出,超级计算机系统的性能平衡性研究逐渐引起业界的广泛关注和重视.研究超级计算机系统的性能平衡性预先评价方法,有助 ...

最新文章

  1. python划分代码_多分类评价指标python代码
  2. 利用graphviz模块展示斐波那契数列的递归函数调用图(Python)
  3. Aim Controller:所有游戏都支持的PSVR
  4. Java8 - Future 接口
  5. python-玉米(小米)商城作业
  6. JDK8新特性(七)之Stream流的count()、filter()、limit()、skip()方法
  7. java classpath详解_java Classpath全解(转)
  8. 【XSY2774】学习 带花树
  9. java 三大特性_java的三大特性是什么?
  10. java 录制_Java屏幕录像
  11. Android实现图片(拍照+相册)上传功能
  12. python--修改证件照的大小
  13. arp-scan使用
  14. MacBook Air开启CPU虚拟化支持(Windows10)
  15. 旅游产品分析:要出发周边游
  16. 布道微服务_03服务的发布和引用
  17. 沐风:小程序推广高手速成秘笈
  18. 我的世界手游服务器修改密码,阿瓦隆之王怎么修改密码 | 手游网游页游攻略大全...
  19. 如何提交form表单嵌套(提交表单外的数据方法 )
  20. XiaoHu日志 9/27~10/18

热门文章

  1. Android——检测摄像头是否可用
  2. 聊聊Kafka中值得我们学习的优秀设计
  3. python爬取微博数据词云_爬虫篇:使用Python动态爬取某大V微博,再用词云分析...
  4. 16,甲流疫情死亡率
  5. C语言——大小写字母转换
  6. C++虚函数概念及使用(基础)
  7. 你的简历能帮你争取到面试机会吗
  8. 巴法络nas硬盘挂linux,教你轻松DIY——巴法络家用NAS使用详解
  9. QQ聊天快捷键【很好用的哦】
  10. dwg格式文件怎么打开