1、作者认为,一篇文章的被引用情况可以反映此文章的影响力,所以他产生的文摘是基于影响力的,他的模型在训练时,是使用了原始文本和文本的引用句子作为数据集,但是最终抽取句子形成文摘,缺是只从原始文本中抽取,引用句子的影响度用原文来表示(这也就是为什么他要寻找分布最相似的)。

2、他不用引用句子的原因是,引用句子大多会夹杂一些其他非我们关注的信息。

3、这里面他建立的一个语言语言模型。不同的是,它是以一个句子为单位。在这,这里他看的不是句子的频率(有词频得到),而是句子的影响力(这也是一个概率)。

3、他建立了两个语言模型,一个是针对整个样本集(原文,和Citation窗口句子),一个则是针对备选句子。然后计算这两个影响力分布的相似度。用KL撒。

4、这里面,我们如何来定义相似度呢,他将citation因素导入其中,将影响力分为在原文中的词频概率,和引文影响力,两者按照一定比例分配。同时,他又认为,每一个引文句子的影响力是不同的,不能等视之,因此加了一个权重。这个权重又由两部分构成,一个是权威度,一个是距离确切引用度的距离。而权威度,这里他用的是pagerank进行计算的。

5、大体上就是这样了。

转载于:https://www.cnblogs.com/Vanior/archive/2012/07/31/2617449.html

关于文章 Generating Impact-Based Summaries... By Mei qiaozhu相关推荐

  1. 文献记录(part13)--Hypergraph based geometric biclustering algorithm

    学习笔记,仅供参考,有错必纠 关键词:双聚类:霍夫变换:超图划分:基因芯片数据分析 文章目录 Hypergraph based geometric biclustering algorithm 摘要 ...

  2. 文献学习(part16)--Oracle Based Active Set Algorithm for Scalable Elastic Net Subspace Clustering

    学习笔记,仅供参考,有错必纠 文章目录 Oracle Based Active Set Algorithm for Scalable Elastic Net Subspace Clustering A ...

  3. Trunk Based Development介绍——TBD Workflow(一)

    前言 在介绍TBD Worflow的部署之前,我们先来看一下什么是TBD,以下文章参考 Trunk Based Development: Introduction 简介 TBD准确的说不是一种&quo ...

  4. A Transformer-based Approach for Source code Summarization 翻译

    A Transformer-based Approach for Source Code Summarization 全文翻译 本文最佳阅读方式:读完一段中文内容快速阅读对应的英文部分 欢迎关注我的公 ...

  5. 【复盘比赛】SDP 2021@NAACL LongSumm 科学论⽂⻓摘要生成任务 第一名

    SDP 2021@NAACL LongSumm 科学论⽂⻓摘要生成任务 第一名 前言 任务介绍 问题描述 数据展示 模型尝试 抽取模型尝试 DGCNN抽取模型 BertSumm 生成模型尝试 End2 ...

  6. ACL2021主会议论文汇总及分类

    转发自公众号:NLP工作站   知乎 刘聪NLP 主要包括10个分类,如下:(1)预训练语言模型及应用(58篇):(2)表征学习(9篇):(3)问答及检索(42篇):(4)文本生成(29篇):(5)摘 ...

  7. 在看不见的地方,AI正在7×24为你在线服务

    本文来自:微软研究院AI头条(ID:MSRAsia) 编者按:当你使用在线系统来搜索网页.编辑文档.存储图片.听音乐.看视频.玩游戏,并享受着行云流水般的顺畅服务时,正有几十万到上百万台服务器坚守在大 ...

  8. 2019计算机视觉论文精选速递(2019/1/23-2018/1/28)

    作者:朱政 原文:CV arXiv Daily:计算机视觉论文每日精选(2019/1/23-2018/1/28) 如有兴趣可以**点击加入极市CV专业微信群**,获取更多高质量干货 本系列文章转自计算 ...

  9. 小米 pegasus_使用Google的Pegasus库生成摘要

    小米 pegasus PEGASUS stands for Pre-training with Extracted Gap-sentences for Abstractive SUmmarizatio ...

最新文章

  1. 松本行弘:我的编程人生
  2. R语言为dataframe添加新的数据列(add new columns):使用R原生方法、data.table、dplyr等方案
  3. Running Builds
  4. 指针数组和数组指针和函数指针
  5. [vue] 使用vue开发过程你是怎么做接口管理的?
  6. rabbitmq报错:PRECONDITION_FAILED - parameters for queue ‘test-1‘ in vhost ‘/‘ not equivalent
  7. android gps转换度分秒,如何将GPS数据转换为度分秒
  8. Java程序员常用开发工具有哪些?
  9. Unity游戏开发客户端面经——性能优化(初级)
  10. 磁盘一把锁一个感叹号_Win10系统中如何解决磁盘图标上出现感叹号的情况
  11. xml 解析错误:语法错误 xml解析错误:找不到根元素
  12. [软件人生]关于个人所得税的讨论
  13. clickonce程序部署后,启动不成功的问题
  14. PHP有没有 原子性,PHP程序的原子性和PHP的文件锁
  15. 使用大白菜制作U盘启动器并安装win10 64位系统
  16. dayjs毫秒转换分秒格式
  17. Web GIS 智慧物流:打造超一流高效运转货运产线
  18. 让你的EXCEL表格每页都自动生成表头
  19. python 搜索pdf文件中的文字_使用python查找pdf文档中搜索字符串位于哪一页
  20. Python——~取反操作

热门文章

  1. 评论列表显示及排序,个人中心显示
  2. 安装软件the error code is 2203解决方法
  3. BZOJ 3732 Network
  4. 【Sass】+【Compass】学习笔记
  5. OpenStack Network --- introduction部分 阅读笔记
  6. Tomcat启动过程源码分析六
  7. Yii中POS和GET并用范例
  8. Objective-C设计模式——生成器Builder(对象创建)
  9. 读写属性/if判断那点事/数组
  10. 基于Kubernetes构建Docker集群管理详解