来源:专知  

摘要

对话系统是一个流行的自然语言处理(NLP)任务,因为它在现实生活中应用前景广阔。这也是一个复杂的任务,因为涉及到许多需要研究的自然语言处理任务。因此,关于深度学习的对话系统研究的大量工作开展了。在这个综述中,我们主要关注基于深度学习的对话系统。我们全面回顾了对话系统的研究成果,并从模型类型和系统类型两个角度对其进行了分析。具体地,从模型类型的角度,讨论了对话系统中广泛应用的各种模型的原理、特点和应用。这将帮助研究人员了解这些模型,并了解它们如何应用于最先进的框架中,这在设计一个新的对话系统时非常有帮助。从系统类型的角度,讨论了任务导向对话系统和开放领域对话系统这两个研究方向,并对相关的热点问题进行了深入的探讨。此外,我们还对对话系统的评价方法和数据集进行了全面的综述,为未来的研究铺平了道路。最后,根据最近的研究成果,确定了一些可能的研究趋势。据我们所知,这个综述是目前对话系统和对话相关任务领域中最全面和最新的,广泛覆盖了流行的框架、主题和数据集。

https://www.zhuanzhi.ai/paper/a34ced4ac06f1af10dea73064600db50

引言

对话系统(或聊天机器人)正在世界上发挥更大的作用。人们可能仍然有一种刻板印象,即聊天机器人是那些给银行打电话时死板的代理。然而,由于人工智能的复兴,现代聊天机器人可以谈论丰富的话题,从你的生日派对到拜登的演讲,如果你愿意,它们甚至可以为你预订聚会地点或播放演讲视频。对话系统是目前自然语言处理领域的热点之一,在工业和日常生活中都有很高的要求。聊天机器人的市场规模预计将从2021年的26亿美元增长到2024年的94亿美元,复合年增长率(CAGR)为29.7%。预计到2021年底,80%的企业将配备聊天机器人自动化。

对话系统可以与人聊天,也可以作为对话的助手。根据其应用,对话系统通常分为两类:面向任务的对话系统和开放域对话系统。面向任务的对话系统解决了特定领域的特定问题,如电影票预订、餐厅餐桌预订等。传统的任务导向对话系统采用流水线结构,由四个功能模块组成: 自然语言理解、对话状态跟踪、策略学习和自然语言生成,这将在第三节详细讨论。许多最先进的作品设计端到端面向任务的对话系统,以实现比流水线方法更好的优化。开放域对话系统的目标是在没有任务和域限制的情况下与用户聊天,而不是专注于任务完成(Ritter et al., 2011),这通常是完全数据驱动的。开放域对话系统一般分为三类: 生成式系统、基于检索的系统和集成系统。生成系统运用序列到序列模型将用户消息和对话历史映射到一个可能不会出现在训练语料库中的响应序列。相比之下,基于检索的系统尝试从某个回复应集中选择已存在的回复。集成系统通过两种方式将生成法和基于检索的方法相结合: 将检索到的响应与生成的响应进行比较,从中选择最优的回复; 生成模型还可以用于提炼检索到的回复(Zhu et al., 2018; Song et al., 2016; Qiu et al., 2017; Serban et al., 2017b)。生成系统可以产生灵活的、对话的、与上下文相关的回复,但有时它们缺乏连贯性,倾向于做出枯燥的回应。基于检索的系统从人的回复集中选择回复,从而能够获得更好的表层语言的连贯性。然而,检索系统受限于响应集的有限性,有时检索到的回复与对话上下文的相关性较弱(Zhu et al., 2018)。

对于对话系统,现有的综述论文(Arora et al., 2013; Wang and Yuan, 2016; Mallios and Bourbakis, 2016; Chen et al., 2017a; Gao et al., 2018)要么过时,要么不全面。这些论文中的一些定义目前已经不再使用,很多新的著作和话题没有涉及到。此外,它们大多缺乏多角度的分析。因此,在本综述中,我们全面回顾了近年来基于深度学习方法的高质量研究,并从模型角度和系统角度提供了对最新研究的见解。此外,本综述根据最新的研究成果更新了定义,并广泛覆盖了对话系统中的各种热点问题。

传统的对话系统大多是基于有限状态(Arora et al., 2013)、基于统计学习和基于机器学习的系统。基于有限状态的系统易于实现,并且能够自然地响应,这使得它们在早期的行业产品中很受欢迎。但是,这些系统的对话流是预先确定的,这使对话系统的应用程序保持在特定的场景中。基于统计学习和基于机器学习的系统通常执行模板填充来管理某些任务。与基于有限状态的系统相比,这些系统更加灵活,因为对话流不是预先确定的。但是,由于模板固定,在模板填写方面F1分数不高,在应用场景和响应多样性方面也受到限制。大多数最先进的对话系统都是基于深度学习的系统。深度学习的快速增长提高了对话系统的性能(Chen et al., 2017a)。深度学习可以被看作是多层神经网络的表示学习。深度学习体系结构广泛应用于对话系统及其子任务。第2节讨论了各种流行的深度学习架构。

从对话系统出发,NLP也有很多与对话相关的任务,包括但不限于问答、阅读理解、对话解缠、视觉对话、视觉问答、对话推理、对话语义解析、对话关系提取、对话情感分析、仇恨言语检测,MISC检测等。在这个调查中,我们还谈到了一些处理这些对话相关任务的工作,因为对话系统的设计可以从这些相关领域的进展中受益。

我们为这篇长文章制作了一个图,以帮助读者熟悉整体结构(图1)。在这个综述中,第一部分简要介绍了对话系统和深度学习;第二节讨论了现代对话系统中流行的神经模型及其相关工作;第三部分介绍了任务导向对话系统的原理和相关工作,并讨论了当前的研究挑战和热点问题;第4节简要介绍了这三种系统,并重点介绍了开放域对话系统的研究热点;第5节回顾了对话系统的主要评价方法;第6节全面总结了对话系统常用的数据集;最后,第七部分对全文进行了总结,并提出了一些研究趋势。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

南洋理工75页最新「深度学习对话系统」大综述论文,最全面概述深度学习对话技术进展...相关推荐

  1. 「DLP-KDD 2021征文」及上届论文全集,包含深度学习推荐/广告系统、多目标、模型服务等

    「DLP-KDD 2021征文」及上届论文全集,包含深度学习推荐/广告系统.多目标.模型服务等 在DLP-KDD 2021征稿之际,为大家准备了DLP-KDD2020的全部文章和资源列表,内容涵盖了几 ...

  2. 基于特征的对抗迁移学习论文_学界 | 综述论文:四大类深度迁移学习

    选自arXiv 作者:Chuanqi Tan.Fuchun Sun.Tao Kong. Wenchang Zhang.Chao Yang.Chunfang Liu 机器之心编译 参与:乾树.刘晓坤 本 ...

  3. B站上线斯坦福最新「机器学习系统(MLSys)」全集,小伙伴有福了!

    点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达 来自:新智元 来源:外媒 编辑:keyu [导读]2020年秋季开始,斯坦福大学开始陆 ...

  4. 韩国最新「美女元宇宙」引爆Reddit!最强换脸神器美女自拍一键转漫画

    来源 | 新智元 编辑 | 好困 LRS [导读]「美女元宇宙」要来了?韩国最新AI将美女视频秒转网络漫画,除了辅助创作者外,或许也是实现虚拟化身的技术储备. 最近,韩国最大的漫画平台网站Naver ...

  5. tensorflow gpu利用率低_「动手学习Tensorflow」- Tensorflow综述I

    " 一文概览Tensorflow方方面面." 大家好,我是人工智能工程师Alpha浪. 今天,我们开始「动手学习Tensorflow - Tensorflow 综述」部分. 快速学 ...

  6. 综述的综述!5 篇2020 年「图像分割算法」最佳综述论文详解

    在过去的一年中,计算机视觉领域出现了许多优秀的工作,并推动了相关领域的技术发展与进步.极市平台对2020年出现的全部计算机视觉综述论文进行了分方向梳理.本篇文章为2020年图像分割方向的综述论文汇总, ...

  7. AAAI2022最新「关系数据因果推理」报告,181页PPT阐述因果推理在网络数据中研究进展...

    来源:专知 本文为资料,建议阅读5分钟本教程将介绍网络数据因果推理的最新研究成果,也称为干扰因果推理. 因果推理的任务--从数据中推断干预措施和反事实的效果--是大量科学和工业应用的核心.为了捕获真实 ...

  8. OpenAI发布最新「模拟机器人环境」,用「真实机器人」模型进行训练

    图:pixabay 本文转自雷克世界(ID:raicworld) 作者|MACIEK CHOCIEJ.PETER WELINDER等 「雷克世界」编译:嗯~阿童木呀 最近,我们发布了8个模拟机器人环境 ...

  9. 最新「Nature Index中国」出炉:北大领跑50所国内顶级研究机构

    机器之心报道 机器之心编辑部 由著名科学期刊<Nature>最新发布的增刊「2018 自然指数:中国」(The Nature Index 2018 supplement on China) ...

最新文章

  1. centos 网卡配置(入门级)
  2. dubbo源码解析-集群容错架构设计
  3. 程序包org.springframework.stereotype不存在,解决办法
  4. jpql hql_无需部署即可测试JPQL / HQL
  5. FreeRTOS系列第19篇---FreeRTOS信号量
  6. 中枪!这才是当代博士生真实日常大赏
  7. java htmlparser 使用教程_HTMLParser使用详解(1)
  8. 禅道xampp文件夹无法删除_无法删除文件解决方案
  9. 网络规划设计方案(模板)
  10. 数据包络分析--两阶段加性网络DEA--使用优化黄金分割比例算法(第二篇)
  11. Linux 摄像头驱动
  12. ArcGIS10.6基本操作——利用DEM给点赋予高程值
  13. 局域网内共享打印机的几种方式
  14. 人工智能如何用在智能家居行业?
  15. RN学习和开发笔记(一)
  16. 人月神话是神话嘛?嗯!
  17. C#组件系列——又一款Excel处理神器Spire.XLS(一)
  18. 十二时辰篇:这该死的 996
  19. 第二章、application.properties文件的配置
  20. 【模板】仙人掌的基本概念和判定

热门文章

  1. 因并发而生,因云计算而热
  2. 初识元学习-Meta learning
  3. 如何使用TensorFlow和VAE模型生成手写数字
  4. GAN眼中的图像翻译(附神奇歌单)
  5. 独家 | 用随机森林预测“美版拼多多”商品销量
  6. NLP | 医学AI又一突破,微软开源生物医学NLP基准:BLURB
  7. 知识图谱的关键技术及其智能应用(附PPT)
  8. TensorFlow超级指南 | 你能想到的TF教程和资源都在这里(附链接视频)
  9. 一文读懂卷积神经网络CNN(学习笔记)
  10. 猪心移植人体背后竟有个川妹子!36岁哈佛女学霸敲除猪致病基因,获赞「基因剪刀手」...