关于文章 Generating Impact-Based Summaries... By Mei qiaozhu
1、作者认为,一篇文章的被引用情况可以反映此文章的影响力,所以他产生的文摘是基于影响力的,他的模型在训练时,是使用了原始文本和文本的引用句子作为数据集,但是最终抽取句子形成文摘,缺是只从原始文本中抽取,引用句子的影响度用原文来表示(这也就是为什么他要寻找分布最相似的)。
2、他不用引用句子的原因是,引用句子大多会夹杂一些其他非我们关注的信息。
3、这里面他建立的一个语言语言模型。不同的是,它是以一个句子为单位。在这,这里他看的不是句子的频率(有词频得到),而是句子的影响力(这也是一个概率)。
3、他建立了两个语言模型,一个是针对整个样本集(原文,和Citation窗口句子),一个则是针对备选句子。然后计算这两个影响力分布的相似度。用KL撒。
4、这里面,我们如何来定义相似度呢,他将citation因素导入其中,将影响力分为在原文中的词频概率,和引文影响力,两者按照一定比例分配。同时,他又认为,每一个引文句子的影响力是不同的,不能等视之,因此加了一个权重。这个权重又由两部分构成,一个是权威度,一个是距离确切引用度的距离。而权威度,这里他用的是pagerank进行计算的。
5、大体上就是这样了。
转载于:https://www.cnblogs.com/Vanior/archive/2012/07/31/2617449.html
关于文章 Generating Impact-Based Summaries... By Mei qiaozhu相关推荐
- 文献记录(part13)--Hypergraph based geometric biclustering algorithm
学习笔记,仅供参考,有错必纠 关键词:双聚类:霍夫变换:超图划分:基因芯片数据分析 文章目录 Hypergraph based geometric biclustering algorithm 摘要 ...
- 文献学习(part16)--Oracle Based Active Set Algorithm for Scalable Elastic Net Subspace Clustering
学习笔记,仅供参考,有错必纠 文章目录 Oracle Based Active Set Algorithm for Scalable Elastic Net Subspace Clustering A ...
- Trunk Based Development介绍——TBD Workflow(一)
前言 在介绍TBD Worflow的部署之前,我们先来看一下什么是TBD,以下文章参考 Trunk Based Development: Introduction 简介 TBD准确的说不是一种&quo ...
- A Transformer-based Approach for Source code Summarization 翻译
A Transformer-based Approach for Source Code Summarization 全文翻译 本文最佳阅读方式:读完一段中文内容快速阅读对应的英文部分 欢迎关注我的公 ...
- 【复盘比赛】SDP 2021@NAACL LongSumm 科学论⽂⻓摘要生成任务 第一名
SDP 2021@NAACL LongSumm 科学论⽂⻓摘要生成任务 第一名 前言 任务介绍 问题描述 数据展示 模型尝试 抽取模型尝试 DGCNN抽取模型 BertSumm 生成模型尝试 End2 ...
- ACL2021主会议论文汇总及分类
转发自公众号:NLP工作站 知乎 刘聪NLP 主要包括10个分类,如下:(1)预训练语言模型及应用(58篇):(2)表征学习(9篇):(3)问答及检索(42篇):(4)文本生成(29篇):(5)摘 ...
- 在看不见的地方,AI正在7×24为你在线服务
本文来自:微软研究院AI头条(ID:MSRAsia) 编者按:当你使用在线系统来搜索网页.编辑文档.存储图片.听音乐.看视频.玩游戏,并享受着行云流水般的顺畅服务时,正有几十万到上百万台服务器坚守在大 ...
- 2019计算机视觉论文精选速递(2019/1/23-2018/1/28)
作者:朱政 原文:CV arXiv Daily:计算机视觉论文每日精选(2019/1/23-2018/1/28) 如有兴趣可以**点击加入极市CV专业微信群**,获取更多高质量干货 本系列文章转自计算 ...
- 小米 pegasus_使用Google的Pegasus库生成摘要
小米 pegasus PEGASUS stands for Pre-training with Extracted Gap-sentences for Abstractive SUmmarizatio ...
最新文章
- 松本行弘:我的编程人生
- R语言为dataframe添加新的数据列(add new columns):使用R原生方法、data.table、dplyr等方案
- Running Builds
- 指针数组和数组指针和函数指针
- [vue] 使用vue开发过程你是怎么做接口管理的?
- rabbitmq报错:PRECONDITION_FAILED - parameters for queue ‘test-1‘ in vhost ‘/‘ not equivalent
- android gps转换度分秒,如何将GPS数据转换为度分秒
- Java程序员常用开发工具有哪些?
- Unity游戏开发客户端面经——性能优化(初级)
- 磁盘一把锁一个感叹号_Win10系统中如何解决磁盘图标上出现感叹号的情况
- xml 解析错误:语法错误 xml解析错误:找不到根元素
- [软件人生]关于个人所得税的讨论
- clickonce程序部署后,启动不成功的问题
- PHP有没有 原子性,PHP程序的原子性和PHP的文件锁
- 使用大白菜制作U盘启动器并安装win10 64位系统
- dayjs毫秒转换分秒格式
- Web GIS 智慧物流:打造超一流高效运转货运产线
- 让你的EXCEL表格每页都自动生成表头
- python 搜索pdf文件中的文字_使用python查找pdf文档中搜索字符串位于哪一页
- Python——~取反操作