《论文阅读》PLATO: Pre-trained Dialogue Generation Model with Discrete Latent Variable
《论文阅读》PLATO: Pre-trained Dialogue Generation Model with Discrete Latent Variable
- 简介
- 论文试图解决什么问题?
- 论文中提到的解决方案之关键是什么?
- 用于定量评估的数据集是什么?
- 论文中的实验及结果有没有很好地支持需要验证的科学假设?
- 这篇论文到底有什么贡献?
- 下一步呢?有什么工作可以继续深入?
数据集:多轮对话数据集
外加标签:无
模型:预训练模型(在对话语料上)
时间:2019年
本文带来Siqi Bao, Huang He, Fan Wang, Hua Wu and Haifeng Wang共同创作的文章
简介
预训练模型已被证明对广泛的自然语言处理任务有效。受此启发,我们提出了一种新颖的对话生成预训练框架来支持各种对话,包括闲聊、基于知识的对话和对话式问答。在这个框架中,我们采用灵活的注意力机制来充分利用双向上下文和语言生成的单向特性。我们还引入了离散潜在变量来解决响应生成中固有的一对多映射问题。响应生成和潜在行为识别这两个交互任务在共享网络中同时设计和执行。对三个公开可用的数据集的综合实验验证了所提出框架的有效性和优越性。
《论文阅读》PLATO: Pre-trained Dialogue Generation Model with Discrete Latent Variable相关推荐
- 论文阅读笔记《Regularizing Dialogue Generation by Imitating Implicit Scenarios》
模仿隐式情景规范对话生成 Abstract 人类对话是基于情景的,适当的回复通常与特定情景所带来的潜在背景知识有关.为了能够做出更有意义和更具体的回应,我们建议从情景视角改进生成对话系统,其中考虑对话 ...
- 《论文阅读》Multi-Task Learning of Generation and Classification for Emotion-Aware Dialogue Response Gener
<论文阅读>Multi-Task Learning of Generation and Classification for Emotion-Aware Dialogue Response ...
- AAAI2020 A pre-training based personalized dialogue generation model with persona-sparse data
文章目录 论文背景 论文想要解决的问题 论文贡献 模型 变量解释 框架 Encoding Attention 自动计算persona比重 language model 最终的目标函数 A pre-tr ...
- BERT论文阅读(二): CG-BERT:Conditional Text Generation with BERT for Generalized Few-shot Intent Detection
目录 The proposed method Input Representation The Encoder The Decoder fine-tuning discriminate a joint ...
- 论文阅读 Parallelly Adaptive Graph Convolutional Clustering Model(TNNLS2022)
论文标题 Parallelly Adaptive Graph Convolutional Clustering Model 论文作者.链接 作者: He, Xiaxia and Wang, Boyue ...
- 毫米波点云生成论文 阅读笔记 | 3D Point Cloud Generation with Millimeter-Wave Radar
毫米波点云生成论文 | 3D Point Cloud Generation with Millimeter-Wave Radar Kun Qian, Zhaoyuan He, Xinyu Zhang ...
- 【推荐系统->论文阅读】Towards the Next Generation of Recommender Systems(推荐系统综述,下一代推荐系统: 最新技术和可能扩展)
Towards the Next Generation of Recommender Systems: A Survey of the State-of-the-Art and Possible Ex ...
- [论文阅读笔记12]An Effective Transition-based Model for Discontinuous NER
一, 题目 <An Effective Transition-based Model for Discontinuous NER> 论文:An Effective Transition-b ...
- 论文阅读:A Neural Probabilistic Language Model 一种神经概率语言模型
A Neural Probabilistic Language Model 一种神经概率语言模型 目录 A Neural Probabilistic Language Model 一种神经概率语言模型 ...
最新文章
- mysql 存guid类型_从C#在MySQL中存储GUID
- suse linux 创建用户密码,suse linux上创建用户方式
- java set中取数据_Java中取数据库用的ResultSet问题
- init.d目录理解
- 《剑指 Offer I》刷题笔记 41 ~ 50 题
- 活动预告|一个重塑区块链行业生态的新物种即将诞生!
- maven不引入parent_Maven 如何将本地的项目发布到 Archiva 中
- 如何把64GB或以上的SD卡格式化为FAT32的格式
- keil5 mdk安装教程
- 2022年申请亳州市发明专利材料,专利说明书摘要写作技巧
- idea关联本地的svn项目
- CF机器码怎么解-LOL机器码怎么改?(最详细教程CX)
- 51单片机蜂鸣器加数码管
- [译] Oracle Database 21c 中的 SQL 集合运算符增强功能(EXCEPT、EXCEPT ALL、MINUS ALL、INTERSECT ALL)
- Java 动手写爬虫: 一、实现一个最简单爬虫
- echart半圆,特殊半圆
- vos3000外呼系统讯时O口网关加密注册 VOS 配置方法
- Taobao api, Jingdong api, 1688api, Pinduoduo api, Douyin api commodity interface source code
- MetaMask钱包登录Ganache-cli内的账户,出现无法获取链 IC,您的 RPC URL 地址是正确的么?问题
- 巴西龟饲养日志----黑壳虾繁殖
热门文章
- 顺序表的实现[原创]
- 精灵图(css sprites)
- XDC约束技巧--CDC
- 26个你需要学习的Firefox配置技巧,改进体验和加快浏览器响应速度
- Linux安装最新版Docker完整教程(建议收藏)
- 三相直流无刷电器驱动器(BLDC)
- HDU 5127.Dogs' Candies-STL(vector)神奇的题,set过不了 (2014ACM/ICPC亚洲区广州站-重现赛(感谢华工和北大))...
- C语言的集成测试工具,Tessy-嵌入式软件单元测试/ 集成测试工具-研发工具-恒润科技...
- iOS获取设备唯一标识的各种方法?IDFA、IDFV、UDID分别是什么含义?
- Spark Core Aggregator