• 论文

    • Question Generation for Question Answering
    • Question Answering and Question Generation as Dual Tasks
    • A Joint Model for Question Answering and Question Generation

论文


Question Generation for Question Answering

Nan Duan, Microsoft Research Asia, 2017
原文链接

这篇是从长文章中利用两种方式CNN和RNN来生成高质量的问题,并利用生成的这些问题来进一步提高QA的表现,这篇和下一篇是一个作者的文章。

数据集:SQuAD, MS MARCO, and WikiQA

结构
整个QG结构分为四个部分,Question Pattern Mining,Question Pattern Prediction,Question Topic Selection,Question Ranking

  • Question Pattern Mining
    将问句输入YahooAnswers获得一系列相关的问题,这些问题构成了一个question cluster。在这个cluster中,n gram出现的频率越高越有可能是topic word

  • Question Pattern Prediction
    给定一篇文章,利用一些关键短语,eg co-founded by -> who found # ?,预测相关的question pattern有哪些。训练数据格式为 <A,Qp,Qt> < A , Q p , Q t >
    ,预测时输入为 <S,Qp> < S , Q p >

    A是answer, Qp Q p
    是question pattern, Qt Q t
    是question type

    – Attention + CNN 将predict视为一个ranking的任务
    – Attention + Bi-GRU RNN 将predict视为一个生成任务

  • Question Topic Selection
    – 对于第一种attention + CNN,先利用freebase提取实体和stanford sparser提取名词词组作为question type的候选,然后计算这些候选qt与预测的question type对应的每个historical question topic的相似度,取相似度较高的topic。
    – 对于第二种attention + Bi-GRU RNN,对于S中所有单词计算S与 Qp Q p
    的attention概率来选取topic。这里softmax输出维度只用前一部分频率最高的question word,对于OOV(out of vocabulary),用attention probability最高的单词替换,类似一种copy机制。

  • Question Ranking
    question pattern prediction score + question topic selection score + QA matching score + word overlap between Q and S + question pattern frequency这五个分数的线性之和

评价标准:BLEU4
实验结果:seq2seq和两种模型的对比


Question Answering and Question Generation as Dual Tasks

Nan Duan, Microsoft Research Asia, 2017
原文链接

本文提出了一种新的训练框架,同时训练两个模型,将QG和QA视作一个互相促进的过程。

作者将这个称为dual,个人觉得和GAN的思想差不多

模型
P(q,a)=P(q|a)×P(a)=P(a|q)×P(q) P ( q , a ) = P ( q | a ) × P ( a ) = P ( a | q ) × P ( q )

第一个是QG过程,第二个是QA过程

数据集:MS Marco,SQUAD,WikiQA

结构
QG是一个seq2seq的生成模型,损失函数为 Lqg=P(q|a) L q g = − P ( q | a )

QA是一个双向GRU RNN,将Q和A拼接起来作为一个连续的输入,训练时对认为正确的answer打label为1,反之label为0,最小化错误label。
损失函数为

L=Lq+La+ldual L = L q + L a + l d u a l
ldual=[logP(a)+log(q|a)logP(q)log(a|q)]2 l d u a l = [ l o g P ( a ) + l o g ( q | a ) − l o g P ( q ) − l o g ( a | q ) ] 2

评价标准:MAP MRR P@1(QA);BLEU4(QG)

实验结果


例子


A Joint Model for Question Answering and Question Generation

Tong Wang, Microsoft Maluuba, 2017
原文链接

数据集:SQuAD corpus

本篇将QA和QG都视为生成的任务,联合学习通过交替改变QA和QG实现。输入是一篇长文章+conditional information,由条件信息决定是QA还是QG过程,会用一个二进制数表示是QA还是QG。

这篇比较独特的地方是可以生成一些abstract的answer,生成abstract answer其实就是通过copy机制,在生成中选择是copy还是predict。

一般来说QA是extractive的,即抽取式的,而QG是abstractive

encoder是一个双向LSTM模型,用的是字级别的embedding+词级别embedding的拼接,得到一个abstract的隐藏层向量 h1 h 1
。同时考虑extractive抽取式的信息,即同时出现在文章和conditional中的单词,用另一个双向LSTM来编码这些词得到一个抽取式的隐藏层向量 h2 h 2
。在QA过程中是对问题编码用 h1 h 1
,QG中是对答案编码用 h2 h 2

个人认为这里的考虑与之前是一致的,answer通过抽取式,question通过生成式

decoder用了pointer-softmax来控制copy还是predict。(详细见另一篇pointer-softmax的笔记)在训练过程中QA和QG的结果会作为另一个过程的

从实验结果上看,QA的表现有很大的提升,QG基本不变。

生成的例子:

论文阅读 QA与QG联合学习相关推荐

  1. 论文阅读_基于知识的提示学习KnowPrompt

    英文题目:KnowPrompt: Knowledge-aware Prompt-tuning with Synergistic Optimizationfor Relation Extraction ...

  2. 论文阅读【用监督对比学习建模域外检测(OOD Detection) 的 鉴别表示】

    论文题目:Modeling Discriminative Representations for Out-of-Domain Detection with Supervised Contrastive ...

  3. 论文阅读02:基于深度学习的图像细粒度分类算法

    阅读一篇上海师范大学的硕士论文 这个方法目前看不懂

  4. 硕士论文阅读——基于机器视觉和深度学习的工人安全帽检测与身份识别方法

    文章目录 零.摘要 一.绪论 1.背景与研究意义 2.国内外研究现状 (1)安全帽佩戴检测研究现状与不足 (2)身份识别研究现状与不足 (3)基于深度学习的目标检测 二.深度学习目标检测理论 1.卷积 ...

  5. 使用AIGC工具提升论文阅读效率

      大家好,我是herosunly.985院校硕士毕业,现担任算法研究员一职,热衷于机器学习算法研究与应用.曾获得阿里云天池比赛第一名,CCF比赛第二名,科大讯飞比赛第三名.拥有多项发明专利.对机器学 ...

  6. PPO算法经典论文阅读

    PPO算法经典论文阅读 PPO算法是强化学习中的经典算法,其全称为近端策略优化(Proximal Policy Optimization). 1.引言 ​ 首先在论文的引言部分给出了经典的强化学习算法 ...

  7. 论文阅读笔记(5):Oracle Based Active Set Algorithm for Scalable Elastic Net Subspace Clustering

    论文阅读笔记(5):Oracle Based Active Set Algorithm for Scalable Elastic Net Subspace Clustering,基于Oracle的可伸 ...

  8. Joint Learning of QA and QG阅读笔记

    Joint Learning of QA and QG Brief introduction 大背景:QA和QG是两个非常相关的任务,但是到目前为止没有进行非常好的结合(作者看来). 本文大框架:两个 ...

  9. AAAI 2020论文解读:商汤科技发布新视频语义分割和光流联合学习算法

    来源 | Every Frame Counts: Joint Learning of Video Segmentation and Optical Flow 编辑 | Carol 出品 | AI科技大 ...

最新文章

  1. java 读取excel_Java12POI操作Excel
  2. 「Sqlserver」数据分析师有理由爱Sqlserver之三-最值得使有低投入高产出的Sqlserver功能...
  3. Access-Ctrol-Allow-Headers:*兼容问题导致的跨域失败
  4. shiro学习(1):shiro简介
  5. 最简易上手的numpy学习笔记三
  6. MySQL模糊匹配查询LIKE,REGEXP,IN
  7. mysql大数据量使用limit分页,随着页码的增大,查询效率越低下。
  8. jsp 如何动态给图片赋值_在Excel表格中你知道如何动态引用图片吗?
  9. Python、Go、JavaScript、Rust 将长盛 5 年!
  10. python两组数的差异 pca_python – scikit KernelPCA不稳定的结果
  11. 网络语音视频技术浅议(附多个demo源码下载)
  12. 西安80北京54,2000和WGS84互转C#程序
  13. java现代编译原理pdf脚本之家_详解编译器编译原理
  14. 软件开发成本评估怎么做?软件开发成本评估从哪些方面进行?
  15. 重力对手表的走时精度有何影响?12:06:44
  16. sql注入——布尔盲注
  17. linux程序提示killed的原因
  18. 电子电路学习笔记(17)——蜂鸣器
  19. echarts 获取点击的y轴数值_四川Y轴前后钢板防护罩哪里卖
  20. DIV CSS 鼠标事件

热门文章

  1. 手机充电器的参数解释
  2. ios 虚拟机中文件下载路径
  3. Pr 入门教程了解音轨混合器
  4. nodejs复制文件夹操作
  5. 然并卵,腾讯QQ认证空间又再次关闭申请
  6. Git —— 版本控制
  7. 自定义http状态码
  8. android 布局收缩动画,自定义View-带过渡动画的折叠收缩布局
  9. 计算机中找不到手机里的内容,手机用数据线连上电脑,在电脑里找不到想要复制的文件,怎么办?...
  10. Laravel 任务调度