1.rouge评估,英文中文都可以。

中文,都可以使用rouge评估,代码:

# -*- coding: utf-8 -*-
from rouge import Rouge
hypothesis = "我 爱 最美 的 中国"
reference = "我 爱 中国"
rouge = Rouge()
scores = rouge.get_scores(hypothesis, reference)
print("rouge-1:",scores[0]['rouge-1'])
print("rouge-2:",scores[0]['rouge-2'])
print("rouge-l:",scores[0]['rouge-l'])

效果:

rouge-1: {'f': 0.7499999953125, 'p': 0.6, 'r': 1.0}
rouge-2: {'f': 0.33333332888888895, 'p': 0.25, 'r': 0.5}
rouge-l: {'f': 0.7499999953125, 'p': 0.6, 'r': 1.0}

英文:

# -*- coding: utf-8 -*-
from rouge import Rouge
hypothesis = "there is an apple on the desktop"
reference = "there is an apple"
rouge = Rouge()
scores = rouge.get_scores(hypothesis, reference)
print("rouge-1:",scores[0]['rouge-1'])
print("rouge-2:",scores[0]['rouge-2'])
print("rouge-l:",scores[0]['rouge-l'])

效果:

rouge-1: {'f': 0.7272727226446282, 'p': 0.5714285714285714, 'r': 1.0}
rouge-2: {'f': 0.6666666622222223, 'p': 0.5, 'r': 1.0}
rouge-l: {'f': 0.7272727226446282, 'p': 0.5714285714285714, 'r': 1.0}

2.pyrouge评估,只有英文可以

# -*- coding: utf-8 -*-
from pyrouge import Rouge155
r = Rouge155()r.system_dir = 'system_summaries'
r.model_dir = 'model_summaries'
r.system_filename_pattern = '(\d+).txt' #参考摘要
r.model_filename_pattern = '#ID#_reference.txt'#生成摘要output = r.convert_and_evaluate()
print(output)

注意命名格式

效果:

区别:后者可以显示更多评估,前者是只有rouge-1、rouge-2、rouge-l三种。

评估 | 自动摘要评估相关推荐

  1. 27 FI配置-财务会计-外币评估-定义评估方范围

    业务背景:定义评估方范围 事务码: SPRO SPRO路径:SPRO->财务会计->总账会计->定期处理->评估->定义评估方范围 第1步,SPRO路径进入 第2步,通过 ...

  2. SAP MM 评估类型 评估类别

    同一物料的使用,既有"自制品",又有"外购品",并且其来源不同,如同一外购品由不同的供应商提供,价格也不相同.也就是说:同一物料有不同的价值指派,即在不同的条件 ...

  3. 分类的评估标准_机器学习:模型评估之评估指标

    要评估模型的好坏光有评估方法还不行,还得确定评估指标.评估指标就是衡量模型泛化能力好坏的评估标准,反映了任务需求:使用不同的评估指标往往会导致不同的评估结果. 在分类预测任务中,给定测试样例集,评估分 ...

  4. 回归模型评估_评估回归模型的方法

    回归模型评估 Evaluation metrics; 评估指标: Mean/Median of prediction预测的均值/中位数 Standard Deviation of prediction ...

  5. IQA+不懂︱图像清洗:图像质量评估(评估指标、传统检测方法)

    深度学习技术如火如荼,但是训练的图像集都是标注好.质量高的,那么笔者对如何进行图像清洗表示好奇.难道只有让工人肉眼看吗?一些传统的IQA都是基于图像本身质量去评价,那么我想知道,之外的图像信息质量该如 ...

  6. 商用密码应用安全性评估量化评估规则(2021版)

    量化评估框架 参考 GM/T BBBB<信息系统密码应用测评要求>,本规则从三个方面进行量化评估: 密码使用安全(Cryptography Deployment security)是指,密 ...

  7. 模型评估:评估矩阵和打分

    文章目录 目标优先 二分类问题的评价指标 第一类错误和第二类错误 非均匀数据集 混淆矩阵.正确率.精确率.召回率和f-score 不知道标签均匀性的情况 精度-召回曲线和ROC曲线 精度-召回曲线( ...

  8. 计算机软件行业的环境评估,计算机软件评估研究

    摘要: 随着社会的发展和科研技术的进步,计算机软件的发展日新月异,计算机软件越来越多的融入国民经济和日常生活的各方面.以计算机软件为对象的资产业务迅速发展:一方面,计算机软件作为产品而被软件生产企业大 ...

  9. 山西大学计算机科学技术学科评估排名,山西大学排名第44位,全国第四轮学科评估高校评估统计出炉...

    信息来源丨大学从未如此有料 青塔 教育部学位与研究生教育发展中心公布全国第四轮学科评估结果.第四轮评估于2016年在95个一级学科范围内开展(不含军事学门类等16个学科),共有513个单位的7449个 ...

最新文章

  1. 什么是DDOS攻击?怎么防御?
  2. linux串口工具 SRT,汇编语言实现串口通信(PC和单片机间).doc
  3. 在eclipse中如何查看JAVA JDK的源代码
  4. pwm控制的基本原理_最详细的电机控制说明
  5. 2015蓝桥杯省赛---java---B---3(三羊献瑞)
  6. H5工程师在谷歌浏览器调试并开发原生APP项目的解决办法
  7. 战线长一点的飞秋实现原理
  8. element-UI级联选择器(Cascader)获取label值 - 代码篇
  9. tp mysql 去重
  10. Error creating bean with name 'dataSource' defined in class path resource [spring/spring-dao.xml]:
  11. js获取request参数值(javascript 获取request参数值的方法)
  12. Redis Sentinel实现高可用配置
  13. 数据库原理及应用(MySQL版)
  14. 制作卡通人物的3种简单方法
  15. 【flv解析】Audio Specific Config 协议及解析
  16. 互联网快讯:粉笔科技双轨并进未来可期;猿辅导优质教学获赞赏;网红奶茶古茗被罚
  17. android 设置路由器,192.168.1.1路由器设置手机登陆
  18. 英语音乐---三、Cry on my shoulder
  19. 音频源和音频监听脚本
  20. html怎么移动按钮位置,CSS Nav按钮向左下方移动(CSS Nav buttons move bottom left)

热门文章

  1. 冒泡排序算法[C++]
  2. jQuery_2_常规选择器-进阶选择器
  3. linux消息队列的使用
  4. typedef和#define的用法与区别
  5. 数据库自动备份还原成新库脚本
  6. hdu 4419 Colourful Rectangle (离散化扫描线线段树)
  7. PHP之父评价Facebook的HipHop项目:别当作银弹
  8. Java - 自己动手之在线书店(2)
  9. 冲刺阶段——Day5
  10. Referenced file contains errors (http://www.springframework.org/schema/beans/spring-beans-4.3.xsd).