引言

EMNLP2020中,复旦大学数据智能与社会计算实验室 (Fudan DISC) 提出了一篇基于事实的问题生成工作,论文题目为:PathQG: Neural Question Generation from Facts,被录取为长文。

文章摘要

关于问题生成的当前研究通常将输入文本作为序列直接编码,而没有明确建模其中的事实信息,这会导致生成的问题和文本不太相关或者信息量较少。在这篇论文中,我们考虑结合文本中的事实以帮助问题生成。我们基于输入文本的事实信息构造了知识图,并提出了一个新任务:给定知识图中的一条query路径生成问题。任务可以被分为两个步骤,(1)对query表示的学习;(2)基于query的问题生成。我们首先将query表示学习定义为序列标记问题,以识别涉及的事实从而学习到一个query表示,之后使用基于RNN的生成器进行问题生成。我们以端到端的方式共同训练这两个模块,并提出通过变分框架加强这两个模块之间的交互。我们基于SQuAD构造了实验数据集,实验结果表明我们的模型优于其他方法,并且当目标问题复杂时,性能提升更多。通过人工评估,也验证了我们生成的问题的确和文本更相关且信息更丰富。

研究动机

本文关注基于文本的问题生成任务(Question Generation from Text):输入一段文本,自动生成对应的问题。

当前端到端的问题生成研究,通常对输入文本直接编码并学习一个隐表示,而没有对其中的语义信息进行明确建模,这会使得生成过程有较大不确定性,导致生成的问题包含和给定文本不相关的信息或者信息量较少,如下图显示,生成的问题Q2包含了不相关的信息“Everton Fc”,而Q1虽然正确但是缺少特定的信息描述,显得比较简略。

先对输入文本中的事实(facts)进行建模可以减轻这些问题,并且针对文本中的多个事实,可以生成较为复杂(complex)的问题。我们通过对给定文本构建知识图谱(Knowledge Graph,KG)来表示其中的事实,并提出一个新任务:给定知识图谱中的一条query path来生成问题,其中query path是一条由多个事实三元组构成的序列,每个事实三元组包含两个实体以及它们的关系。如上图(b)显示了一个KG以及其中的两条query paths。

由于query path中并非所有事实都会在目标问题中被提及,我们首先需要学习一个query representation来表示query path中会被提及的事实信息,并基于此生成对应的问题,因此任务可以分成两个步骤:(1)对query representation的学习;(2)基于query的问题生成。我们以端到端的方式共同训练这两个模块,并提出通过变分框架加强这两个模块之间的交互。

我们使用了数据集SQuAD,并且为了验证模型在复杂问题生成上的效果,基于SQuAD构造了一个复杂问题数据集,并分别进行了实验。

模型

Path-based Question Generation

给定query path的问题生成任务包含两个步骤,我们设计两个模块:Query Representation LearnerQuery-based Question Generator 分别进行任务中的两个步骤。我们首先以端到端的框架PathQG共同训练这两个模块,具体结构如下图显示。

1. Query Representation Learner

由于query path中的不同的实体和关系会对生成目标问题有不同的贡献度,我们首先计算它们各自的贡献权重,从而学到一个query representation来表示目标问题将涉及的事实信息。

贡献权重计算:将query path看作是一条由实体和关系相间构成的序列,并将query path中各个成分的贡献度计算看作是一个序列标记过程。并且对输入文本进行编码作为context,通过attention帮助序列标记的概率计算,最后将各个位置的sigmoid概率作为各自的贡献权重。

Query表示学习:得到query path的各个成分的贡献权重后,我们以加权的方式对query path编码,学习到对应的query representation L。考虑到query path由实体和关系相间构成的特殊结构,我们使用循环跳跃网络(recurrent skipping network, RSN)来对路径序列进行编码。

2. Query-based Question Generator

基于学到的query representation L,解码生成对应的问题。将最后的query representation和context表示联合作为解码器的初始状态,并分别对他们执行注意力机制,逐步生成问题。

Variational Path-based Question Generation

对query representation的学习可以看成是对query path的一个推断过程,参考变分推断的思想,我们将query representation的学习看作是推导query的先验分布(prior query distribution),而基于query的问题生成是在计算目标问题的likelihood,我们又引入了一个额外的后验query分布(posterior query distribution),通过将目标问题作为指导来帮助减少query representation学习的不确定性。并且通过训练,使得query的先验分布不断靠近后验分布,最终提升生成的问题质量。变分PathQG的结构如下图。

实验

我们在SQuAD数据集上进行了实验,对每一条文本,通过场景图解析器(scene garph parser)和词性标注器(part-of-speech tagger)自动构建了知识图谱,并且根据参考问题从知识图谱中抽取出对应的query path。为了进一步验证模型在复杂问题生成上的效果,我们还根据query path中事实三元组的个数从SQuAD中划分了一个复杂问题数据集。在全数据集和复杂数据集上的实验结果显示我们的模型都优于其他模型。

除了自动评估,我们还通过Amazon Mechanical Turk (AMT)进行了人工评估,分别从问题的流利度、正确性(和给定文本和答案一致)、信息量对不同模型生成的问题进行了两两比较,结果显示我们的模型也取得不错效果。

我们还通过对不同模型生成的问题和给定文本之间的重叠率进行比较,来评估生成问题和给定文本的相关性

最后还进行了一些案例分析,可以看出相对模型NQG+,我们生成的问题更加和文本相关和有信息量。在第一个样例中,我们生成的问题包含有特定信息“plymouth”和“late 18th”而*NQG+没有,而在第二个例子中NQG+*生成的问题包含不相关的“swazi economye”而我们生成的和给定文本更一致。

总结

这篇文章中,我们通过知识图谱对文本中的事实建模用于问题生成,并提出一个新任务:给定知识图谱中的一条query path,生成对应的问题。我们提出先学习一个query representation来表示问题中可能涉及的事实,再生成问题,将这两个模块联合进行训练并提出一个变分模型提升问题的生成。我们通过自动构建知识图谱并抽取出对应的query path构建了我们的实验数据集,结果验证了我们模型的有效性。

供稿丨王思远编辑丨袁    建责编丨林    耿来自 | 复旦DISC

下载一:中文版!学习TensorFlow、PyTorch、机器学习、深度学习和数据结构五件套!后台回复【五件套】
下载二:南大模式识别PPT后台回复【南大模式识别】

说个正事哈

由于微信平台算法改版,公号内容将不再以时间排序展示,如果大家想第一时间看到我们的推送,强烈建议星标我们和给我们多点点【在看】。星标具体步骤为:

(1)点击页面最上方深度学习自然语言处理”,进入公众号主页。

(2)点击右上角的小点点,在弹出页面点击“设为星标”,就可以啦。

感谢支持,比心

投稿或交流学习,备注:昵称-学校(公司)-方向,进入DL&NLP交流群。

方向有很多:机器学习、深度学习,python,情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。

记得备注呦

推荐两个专辑给大家:

专辑 | 李宏毅人类语言处理2020笔记

专辑 | NLP论文解读

专辑 | 情感分析


整理不易,还望给个在看!

【论文分享】PathQG: 基于事实的神经问题生成相关推荐

  1. 【论文分享】基于微信小程序的快递取寄系统设计与实现

    [论文分享]基于微信小程序的快递取寄系统设计与实现 免责声明:本文章已收录至<电脑知识与技术>,仅供参考学习,切勿抄袭或他用,搬运请注明来源,谢谢各位小伙伴的配合. 文章编号:1009-3 ...

  2. 复旦大学王思远:基于事实的自动问题生成研究

    ⬆⬆⬆              点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! 本次的AI TIME PhD直播间,我们邀请到了来自复旦大学自然语言处理组2018级的在读研究生 王思 ...

  3. 微软亚洲研究院论文解读:基于动态词表的对话生成研究(PPT+视频)

    本文为 12 月 27 日,北京航空航天大学博士生.微软亚洲研究院实习生--吴俣在第 21 期 PhD Talk 中的直播分享实录. 本次 Talk 的主题是基于动态词表的对话生成研究.首先,吴俣博士 ...

  4. 论文浅尝 | 基于知识库的神经网络问题生成方法

    论文笔记整理:谭亦鸣,东南大学博士生,研究方向为跨语言知识图谱问答. 来源:NLPCC2018 链接:http://tcci.ccf.org.cn/conference/2018/papers/EV7 ...

  5. 论文分享-《基于数据驱动多输出 ARMAX 建模的高炉十字测温中心温度》

    1.简介 最近在学习研究NARMAX,故也分享下自己看的一篇论文. 2018 年 3 月 的<基于数据驱动多输出 ARMAX 建模的高炉十字测温中心温度>.主要是采用NARMAX模型进行预 ...

  6. 【P4论文分享】基于P4的可编程数据平面研究及其应用

    前言 本文是本人学习的笔记,如有错误欢迎指正. 论文下载地址:基于P4的可编程数据平面研究及其应用 本文目录 前言 1 引 言 传统交换机的局限性 如何增强网络开放性? OpenFlow局限性 解决O ...

  7. 论文分享:基于深度强化学习的无人机三维导航

    论文题目: Double Critic Deep Reinforcement Learning for Mapless 3D Navigation of Unmanned Aerial Vehicle ...

  8. 论文分享:基于频繁序列模式挖掘方法的森林景观格局演化遥感研究

    今天给大家分享一篇在遥感影像时间序列中挖掘频繁出现的序列模式的论文,本文通过提取森林景观格局的演化过程,来评价森林的稳定性和健康程度.该论文的题目是<Extracting Frequent Se ...

  9. ECCV 2018最佳论文解读:基于解剖结构的面部表情生成

    在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果. 点击本文底部的「阅读原文」即刻加入社区 ...

  10. 硕士论文导读《基于探地雷达技术及卷积神经网络理论的公路路基病害评价》

    论文题目:基于探地雷达技术及卷积神经网络理论的 公路路基病害评价 作者及单位:长安大学 姜海强 摘要 本文介绍了探地雷达检测的原理和影响检测性能的因素.在此基础上,综述了各类道路材料及包括裂缝.脱空. ...

最新文章

  1. 盘点深度学习中的各种数据增强技巧
  2. 学生签到系统c代码_C语言实现简单学生学籍管理系统
  3. cacti不能实时刷新流量图_介绍一种编码帧内刷新算法
  4. Objective-c 程序结构
  5. cmd中安装app的的命令
  6. pythonopencv人脸相似度_图像相似度算法的个人见解(pythonopencv)-Go语言中文社区...
  7. String类中的常用方法
  8. rhel6下,mysql 5.6.14 主从复制(也称mysql AB复制)环境配置[基于binlog]
  9. 干货|设计师都收藏的9个实用灵感网站!
  10. k均值聚类+基于核的k均值聚类+C++实现
  11. Linux学习笔记4 - Linux常用命令
  12. Office文档修复介绍之:laola文件格式介绍
  13. IDEA 运行 Tomcat 中文乱码的各种问题
  14. 企业微信 之 网页鉴权并与公司后台关联
  15. 偷偷盘点一下各大公司的实习薪资
  16. 具名元组的使用方法总结
  17. Syntax Error :error node sass version xxx is incompatible with xxx
  18. 百度电子地图自定义marker图标
  19. android 优秀网站
  20. uniapp 联级选择器uni-data-picker

热门文章

  1. 【golang-GUI开发】struct tags系统(一)
  2. Reacr-Native Android 环境搭建 、运行项目(二)Window
  3. python的安装和运行
  4. AI编辑SVG格式的相关问题
  5. IP地址的定义和含义
  6. sql server 2008如何导入mdf,ldf文件
  7. C#结合VS开发WinForm学习笔记
  8. CRC源码生成工具,可生成Verilog和VHDL
  9. 学习Google Chrome源码
  10. Sitecore 6.4 升级Sitecore 8.2.7准备