©作者|王晓珂

学校|中国人民大学信息学院

研究方向|自然语言处理和对话系统

来源|RUC AI Box

近年来开放域的闲聊对话研究如雨后春笋般涌现,甚至还做起了跨界,如最近炙手可热的会话推荐系统。而作为人工智能王冠上明珠中的一颗,自然语言处理中随时打算挑战图灵测试的对话系统,当然是不可能止步于机械地一问一答的形式,因此本文基于一对多生成这个角度,探索相关领域的多样性生成,希望能给一对多对话生成注入新的构思。下面主要介绍近来的 5 篇多样性生成的研究成果。

01

Target Conditioning for One-to-Many Generation

这篇论文是 Facebook 收录在 EMNLP 2020 的工作,主要是为了解决机器翻译模型中缺乏多样性的问题。本文认为当前的 beam search 方法生成的目标语句仍缺乏多样性,时常出现词语重复和语义重叠的问题。并且之前的模型都是在 1-to-1 的数据集上进行训练,缺少对鼓励多样性的目标函数的设计。

这篇工作借鉴了 discrete autoencoders 的思路,提出将一个 discrete target encoder 引入到翻译模型中,方便将每一个目标语句关联到对应的 variable 或者 domain。其中每一个 domain 对应一个 embedding,这样在测试阶段可以根据每个 domain embedding 来生成多样性的翻译。并且这种离散化的表示方式允许以无监督的方式来改变翻译的 domain 信息。

02

Diversify Question Generation with Continuous Content Selectors and Question Type Modeling

这篇论文是华为诺亚方舟收录在 EMNLP 2020 的工作。主要关注的是 QA 工作的逆任务,基于回复和上下文来生成问题,同样这也在一对多生成的范畴内。本文主要思想是通过关注 context 中的不同位置以及表达的不同含义来建模多样性。

基于 CVAE,通过采用 multimodal 的先验分布来构造更多样的 content selectors,从而能够在 context 定位更多样的关注点。在预测 question type 时,提出 diversity-promoting 算法,主要通过引入 decay 变量来限制相同类型问题分布的出现概率,从而鼓励预测出更丰富的 question type。

03

Focus-Constrained Attention Mechanism for CVAE-based Response Generation

这篇工作是小米 AILab 和香港理工大学的合作论文。文中指出了目前基于 CVAE 的方法仅仅是依赖 discourse-level latent variable 来进行多样性的建模,认为这太过粗粒度。因此提出使用 fine-grained word-level information。

具体来说就是,首先通过引入更加细粒度的 focus 信号,来衡量对话上文和回复的语义集中度。然后提出一个 focus-constrained 的注意力机制,以充分利用 focus 信号并辅助回复的生成。实验结果表明,通过利用细粒度的 focus 信号,文中的模型确实可以产生更多样化以及更可控的回复。

04

Controllable Text Generation with Focused Variation

本文指出了当前可控文本生成的不足,在给定 attributes 的情况下,模型往往不足以生成足够相关的文本,以及很容易生成无意义或者重复的文本。

作者从 CVAE 及其变种的角度分析,当前 CVAE 系列在处理这种可控属性的问题上都表现得不是很好。当然这个不足也是当前对话生成中普遍存在的问题。真正实现可控文本的生成,那离可控地进行多样化的文本生成也就不远了。

这篇工作从可控性和多样性两个角度来进行文本生成的工作,设计 context 和 style 两类属性编码器和解码区解构整个语义空间,以此来实现属性的可控性和多样化。

05

COD3S: Diverse Generation with Discrete Semantic Signatures

本文主要针对在 decoding 阶段的采样方法进行改进。经典的 beam search 方法易造成句法、词汇、语义上的重叠和重复。因此本篇工作提出显式地捕捉语义差异的信号,从而实现多样化的采样策略。

该模型主要是用 sentence-BERT (SBERT) 获得的上下文相关语义表示,通过使用 Locality-Sensitive Hashing (LSH) 来获得句子的离散语义代码。然后采用两阶段的解码策略,获得最相关的代码,作为前缀,使用 prefix-conditioned beam search 方法进行解码。

结束语:一对多对话生成以及多样性文本生成的研究任重而道远。给模型一个输入,然后返回多个引入知识、涵盖类型广但又不存在语义重叠的回复,目前来看还没有真正地实现。希望本文能给读者带来一些启发。如有不同见解,欢迎指正批评、不吝赐教。

????

现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

关于PaperWeekly

PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。

多样性文本生成任务的研究进展相关推荐

  1. 人大团队研究:面向文本生成,预训练模型进展梳理

    作者 | 刘媛媛 来源 | 数据实战派 文本生成是 NLP 中最重要且颇具挑战性的任务之一.近年来,预训练语言模型 (Pretrained Language Models ,下文简称 "PL ...

  2. 【NLP】人大团队研究:面向文本生成,预训练模型进展梳理

    文本生成是 NLP 中最重要且颇具挑战性的任务之一.近年来,预训练语言模型 (Pretrained Language Models ,下文简称 "PLM") 的范式,极大地推动了该 ...

  3. 万字长文综述:文本增强技术的研究进展及应用实践

    本文经机器之心(微信公众号:almosthuman2014)授权转载 禁止二次转载  作者:李渔 样本少.分布不均衡,如何让训练的模型性能更优越?文本增强技术算得上一个不错的办法.本文介绍了熵简科技联 ...

  4. 给你的数据加上杠杆:文本增强技术的研究进展及应用实践

    文章目录 1. 为什么要了解文本增强技术 2. 典型技术方案 2.1. 回译(Back translation) 2.2. 随机词替换 2.3. 非核心词替换 2.4. 基于上下文信息的文本增强 2. ...

  5. ACL2022 | 文本生成的相关前沿进展

    每天给你送来NLP技术干货! 来自:复旦DISC 引言 文本生成作为人工智能领域研究热点之一,其研究进展与成果也引发了众多关注.本篇主要介绍了三篇ACL2022的三篇文章.主要包含了增强预训练语言模型 ...

  6. 【CIPS 2016】(6-7章)知识图谱、文本分类与聚类(研究进展、现状趋势)

    CIPS 2016 笔记整理 <中文信息处理发展报告(2016)>是中国中文信息学会召集专家对本领域学科方 向和前沿技术的一次梳理,官方定位是深度科普,旨在向政府.企业.媒体等对中文 信息 ...

  7. 基于关键词的文本生成----思路和思考

    文本生成是最近研究的热点,他的生成源有很多,如:图片.文本.视频等.本文想针对一些特殊场合的需要关键词的文本生成工作,在这里把思路记录一下.这里使用的是传统方式,有机会会尝试深度学的方式. (1)依赖 ...

  8. 文本自动生成研究进展与趋势之数据到文本的生成

    数据到文本的生成 1 国际研究现状 数据到文本的生成技术指根据给定的数值数据生成相关文本,例如基于数值数据生成天气预报文本.体育新闻.财经报道.医疗报告等.数据到文本的生成技术具有极强的应用前景,目前 ...

  9. 【转载】文本自动生成研究进展与趋势

    CCF 中文信息技术专业委员会 万小军 冯岩松 孙薇薇 北京大学计算机科学技术研究所,北京 摘要 我们期待未来有一天计算机能够像人类一样会写作,能够撰写出高质量的自然语言文本.文 本自动生成就是实现这 ...

最新文章

  1. 将cocos2dx项目从Visual Studio 迁移到 xcode
  2. python官网怎么下载安装-Python怎么下载安装
  3. 数据结构:栈实现简易计算器
  4. 一个老鸟发的公司内部整理的 Android 学习路线图 Markdown 版本
  5. php采集分析,PHP采集程序原理分析篇
  6. python 元组捷豹_GitHub - jaguarzls/pyecharts: Python Echarts Plotting Library
  7. android progressbar icon,android中ProgressDialog与ProgressBar的使用详解
  8. 在Delphi中如何创建和使用udl文件
  9. 首发骁龙665 小米CC9e 4+128G版到手价1199元
  10. numpy—np.random.multivariate_normal
  11. 【SpringBoot_ANNOTATIONS】属性赋值 01 @Value赋值
  12. python卡方拟合性检验_卡方拟合优度检验
  13. 战神服务器IP修改,战神引擎芒果数据库查询和修改玩家IP+账号+密码教程
  14. 隐藏隧道通信:Socks 隧道
  15. spine 局部换装
  16. miui9免解锁root,Miui解锁
  17. mysql编写1到n的奇数和_编写程序。输入任意整数n,计算1到n的奇数和
  18. EmguCV学习(二)
  19. 【统计建模与R软件】第二章 R软件的使用 课本课后习题 答案 解析 代码
  20. 破除对于XP半开连接数限制的误解

热门文章

  1. 《挑战30天C++入门极限》C/C++中字符串常量的不相等性及字符串的Copy
  2. AOSP 源码整编单编
  3. C++学习(十七)(C语言部分)之 指针
  4. robotframework如何设计web页面的自动化---启动robotframework ride
  5. MapReduce关系代数运算
  6. HDU 5389 Zero Escape
  7. 案例分析:免费的维护服务
  8. Web服务初探:用Demo学Web服务系列(7)——XML的相关知识
  9. QueryBuildRange中的表达式
  10. 9于word没有注册类_XPage系列这次升级后终于是全自动化注册了!