2020
paper: https://arxiv.org/pdf/2003.08612.pdf

切入点:factual correctness

提出两个模型

  1. Fact-Aware Summarization model, FASUM:which extracts factual relations from the article to build a knowledge graph and integrates it into the neural decoding process.
  2. a Factual Corrector model, FC:that can modify abstractive summaries generated by any
    summarization model to improve factual correctness.

结论

  1. FASUM can generate summaries with higher factual correctness compared with state-of-the-art abstractive summarization systems.
  2. FC improves the factual correctness of summaries generated by various models via only modifying several entity tokens.

细节参考香侬科技,如下只记录了本文关注的点。

测评指标&结果:

测评数据集:CNN/DailyMail 和 Xsum

  1. FC指标:为了测评factual correctness。FactCC模型在xxx进行fine-tune之后用于评估。可以看到整理结果:

  2. Noval n-grams:Diab论文中提到"less abstractive summaries are more factual consistent with the article",所以作者想看看是否自己的模型"boost factual correctness simply by copying
    more portions of the article"。为此,计算了sum中出现article不存在的n-gram的比例,越高说明抽象程度越高。

  3. Relation Matching Rate RMR:为了测评factual correctness。将对事实的评估转化到从summary中抽取到三元组的准确率。具体来说从生成的sum中抽取出三元组合集Rs=(si,ri,oi)R_s = {(s_i,r_i,o_i)}Rs​=(si​,ri​,oi​) ,同样从原始的article中抽出三元组合集RaR_aRa​,(si,ri,oi)(s_i,r_i,o_i)(si​,ri​,oi​)和RaR_aRa​比较会出现三种情况:Correct hit (CCC)命中、Wrong hit (WWW)、Miss (MMM)就是其他情况。基于此,定义RMR为:
    RMR1=100×CC+WRMR_1=100 \times \frac{C}{C+W}RMR1​=100×C+WC​
    RMR2=100×CC+W+MRMR_2=100 \times \frac{C}{C+W+M}RMR2​=100×C+W+MC​
    为了评估RMR指标的质量,文章计算了人评估RMR指标之间的correlation coefficient γ\gammaγ,计算得到γ=0.43\gamma=0.43γ=0.43,说明了RMR和人工评估结果之前存在可观察的关系。

  4. Natural Language Inference NLI models:为了测评factual correctness。用BERT-large模型在MNLI数据集上进行fine-tune,模型输出三种类型:entailment, neutral and contradiction. 对应到这个任务的度量上,NLI的输入和输出分别是article和sum,通过衡量NLI模型输出的contradiction的比例来衡量争取事实比例,比例越小说明 article和生成摘要的冲突越小。

  5. Human Evaluation:三个人,打分1-3,两个维度 factual correctnessinformativeness。效果如下

    为了测评FC部分的效果,作者从BottomUP和UNILM生成的sum中随机拿了100条,之后用FC进行correct,对比了corrected前后的效果,类似于业界的GSB吧,效果如下图,说明了FC能boost

[摘要生成]Boosting Factual Correctness of Abstractive Summarization with Knowledge Graph相关推荐

  1. 【文本生成】评价指标:事实一致性Evaluating the Factual Consistency of Abstractive Text Summarization

    论文:2019年<Evaluating the Factual Consistency of Abstractive Text Summarization> https://arxiv.o ...

  2. 相似度系列-7:单维度:Evaluating the Factual Consistency of Abstractive Text Summarization

    Evaluating the Factual Consistency of Abstractive Text Summarization 在研究方法上,还需要不是特别的精致,而且,和人类的correl ...

  3. Global Encoding for Abstractive Summarization 生成式文本摘要论文解读

    论文解读 https://blog.csdn.net/wu13599hao/article/details/87864788?spm=1001.2014.3001.5501#Global_Encodi ...

  4. TensorFlow文本摘要生成 - 基于注意力的序列到序列模型

    1 相关背景 维基百科对自动摘要生成的定义是, "使用计算机程序对一段文本进行处理, 生成一段长度被压缩的摘要, 并且这个摘要能保留原始文本的大部分重要信息". 摘要生成算法主要分 ...

  5. 知识图谱如何助力文本摘要生成

    来源:丁香园大数据 本文约3800字,建议阅读8分钟 本文基于摘要生成,重点考虑如何帮助模型生成特定领域的知识点,并简要介绍一些用于应对无关重复这类退化现象的方案. 引言 文本生成类任务应用场景广泛, ...

  6. TensorFlow 自动文本摘要生成模型,2016

    TensorFlow 自动文本摘要生成模型 textsum: Text summarization with TensorFlow | Google Research Blog (文/ 谷歌大脑软件工 ...

  7. ACL 2021 | SimCLS: 概念简单但足够有效的对比学习摘要生成框架

    ©PaperWeekly 原创 · 作者 | Maple小七 学校 | 北京邮电大学硕士生 研究方向 | 自然语言处理 作者提出了一个概念简单但足够有效的摘要生成框架:SimCLS,在当前的 SOTA ...

  8. Fast Abstractive Summarization with Reinforce-Selected Sentence Rewriting

    ACL 2018 Fast Abstractive SUmmarization with Reinforce-Selected Sentence Rewriting github 背景 对于文档摘要任 ...

  9. 【复盘比赛】SDP 2021@NAACL LongSumm 科学论⽂⻓摘要生成任务 第一名

    SDP 2021@NAACL LongSumm 科学论⽂⻓摘要生成任务 第一名 前言 任务介绍 问题描述 数据展示 模型尝试 抽取模型尝试 DGCNN抽取模型 BertSumm 生成模型尝试 End2 ...

最新文章

  1. 获取图片像素颜色,转换为CSS3 box-shadow显示
  2. python培训班价格-上海Python培训学费价格是多少
  3. 神经网络的参数迁移和共同本征态
  4. 启明云端分享 | SSD201\SSD202D 核心板如何批量烧录,母片制作教程分享
  5. Vue 3 —— 当 data 和 ref 相同时 运行时错误 [ReferenceError: xxx is not defined]
  6. 061 hive中的三种join与数据倾斜
  7. JavaScript 身份证号有效验证详解及实例代码
  8. Javascript - ExtJs - TreePanel组件
  9. windows下SecureCRT无法使用backspace(空格键)和上下左右键
  10. 学习前端开发,可提高Web开发效率的15类工具
  11. Google DeepMind 团队发布新算法,下一个被 AI 虐哭的是谁?
  12. ubuntu安装go 1.13.8
  13. 交叉火力dsp手机调音软件_可一键调音的车载DSP功放应用
  14. 查看浏览器保存的密码
  15. 「杰伦熊」暴跌96.6% 明星带货NFT为何遇冷?
  16. 搜狗输入法的桌面图标消失,无法打开设置怎么办
  17. 南阳oj 144 小柯的苦恼
  18. RestTemplate源码剖析:Encode
  19. Visio中添加《include》包含符号
  20. 教程篇(7.0) 03. FortiGate安全 防火墙策略 ❀ Fortinet 网络安全专家 NSE 4

热门文章

  1. 网络工程师辞职及成功转型的故事!!
  2. 制作学术海报之工具篇
  3. Linux下如何判断服务器是虚拟机还是物理机?
  4. 1 阿里物联网官方套件
  5. plc转单片机,永久使用
  6. #综合面经#同主题阅读:四个月骑驴找马终于结束,发面经回馈本版
  7. 2022年5月视频用户洞察:用户使用时长增长 平台降本增效初见成效
  8. php 批量插件下载,网页链接批量复制插件下载 Bulk URL Opener (网页链接批量复制插件) v1.11.1 免费版 下载-脚本之家...
  9. 机架服务器管理系统,搭建机架服务器管理系统Racktables
  10. html中向下移动怎么写,如何将div文本框向下移动