聊天机器人(Chatbot)是经由对话或文字进行交谈的计算机程序。其能够模拟人类对话,通过图灵测试。自1966年来人类从未停止过对聊天机器人的探索。现如今,苹果语音助手Siri,微软的小冰、小娜、Rinna、Tay、Zo、Ruk kkuh,亚马逊的Echo,百度的小度机器人,京东JIMI客服机器人,网易七鱼等Chatbot纷纷进驻到生活的各个领域,改变着我们的生活。

历史发展脉络

  • 1966 年,MIT 的计算机科学家 Joseph Weizenbaum 发表了 ELIZA,它可以根据人工设计的脚本与人类交流,是世界上第一个模仿人类谈话的机器人;
  • 1971年, 斯坦福大学的Kenneth Colby开发出Parry聊天机器人,它模仿偏执狂患者,这是第一个通过图灵测试的聊天机器人;
  • 1988 年,加州大学伯克利分校的 Robert Wilensky 等人开发了名为 UNIX Consultant 的聊天机器人系统;
  • 1990 年,美国人 Hugh Loebner 设立 Loebner Prize,奖励首个与人类回复无差别的计算机程序,即聊天机器人系统;
  • 1995 年,Richard Wallace 博士开发的ALICE 系统允许用户自定义自己的聊天机器人,被认为是20世纪最伟大的聊天机器人。ALICE在 2000、2001 和 2004 年三次斩获勒布纳人工智能奖(Loebner Prize),该奖项颁发给最像人类的系统;
  • 2001 年,SmarterChild 在短信和即时信息中广泛流行,聊天机器人第一次被应用在即时通信领域;
  • 2006 年,IBM Watson 能够用自然语言回答问题;
  • 2010 年,苹果语音助手 Siri 诞生;
  • 之后,全球各大公司开始推出 Chatbots 平台或开源架构。

必读论文推荐

1. Dialog State Tracking: A Neural Reading Comprehension Approach

作者:Shuyang Gao, Abhishek Sethi, Sanchit Agarwal, Tagyoung Chung, Dilek Hakkani-Tur

链接:https://www.aminer.cn/pub/5de0b9f3df1a9c0c41598a75/dialog-state-tracking-a-neural-reading-comprehension-approach

对话状态追踪用于在给定所有先前对话的情况下估计当前的对话状态。机器阅读理解则侧重于构建系统,以读取文本段落并回答基于段落理解的问题。本篇论文将对话状态追踪转化为一项机器阅读理解任务,以基于上下文回答当前的对话状态是什么这一问题。传统的状态跟踪方法通常将对话状态预测为本体中所有可能的槽值在封闭集合上的分布,而本文使用简单的基于注意力的神经网络来指向对话中的槽值。

2. Topical-Chat: Towards Knowledge-Grounded Open-Domain Conversations

作者:Karthik Gopalakrishnan, Behnam Hedayatnia, Qinlang Chen, Anna Gottardi, Sanjeev Kwatra, Anu Venkatesh, Raefer Gabriel, Dilek Hakkani-Tür

发表:Interspeech Conference

链接:https://www.aminer.cn/pub/5db92b0647c8f7664621a7e6/topical-chat-towards-knowledge-grounded-open-domain-conversations

建立可以与人类进行深层次、开放性对话的社交机器人,是人工智能领域的重大挑战之一。Amazon团队开发的Topical-Chat是一个基于知识的人-人之间开放领域对话数据集(Knowledge-Grounded Open-Domain Conversations)。其中的基础知识涵盖8个广泛的主题,并且对话伙伴没有明确定义的角色,有助于对开放域对话式AI的进一步研究。本文还在Topical-Chat上训练了几种最新的编码器-解码器对话模型,并使用自动和人工评估以进行基准测试。

3. MoEL: Mixture of Empathetic Listeners

作者:Zhaojiang Lin, Andrea Madotto, Jamin Shin, Peng Xu, Pascale Fung

链接:https://www.aminer.cn/pub/5db9294b47c8f766461f2f8d/moel-mixture-of-empathetic-listeners

以往对移情对话系统的研究主要关注在特定情绪下产生的反应。但是,产生共情不仅需要具备生成情绪反应的能力,更需要理解用户的情绪并适当地予以回复。本篇论文提出全新的基于端到端(End-to-End)在对话系统中建立移情模型的方法:移情听众的混合物(MoEL)。这一模型首先捕获用户的情绪并输出情绪分布。基于此,MoEL将结合优化后的侦听器的对某些情绪做出的反应,从而产生移情。

4. Ethical Challenges in Data-Driven Dialogue Systems

作者:Peter Henderson, Koustuv Sinha, Nicolas Angelard-Gontier, Nan Rosemary Ke, Genevieve Fried, Ryan Lowe, Joelle Pineau

发表: In the 2018 AAAI/ACM Conference on AI, Ethics, and Society

链接:https://www.aminer.cn/pub/5a4aef9e17c44a2190f7a8b1/ethical-challenges-in-data-driven-dialogue-systems

本篇论文重点介绍对话系统研究中可能出现的道德问题,包括:数据驱动系统中的隐性偏见、对抗性示例的出现、潜在的隐私侵犯源、安全问题,强化学习系统的特殊考虑以及可复制性问题等。

5. MultiWOZ - A Large-Scale Multi-Domain Wizard-of-Oz Dataset for Task-Oriented Dialogue Modelling

作者:Pawel Budzianowski, Tsung-Hsien Wen, Bo-Hsiang Tseng, Iñigo Casanueva, Stefan Ultes, Osman Ramadan, Milica Gasic

链接:https://www.aminer.cn/pub/5bdc315017c44a1f58a05b9f/multiwoz-a-large-scale-multi-domain-wizard-of-oz-dataset-for-task

尽管机器学习已成为对话研究界的主要场景,但真正的突破已被可用数据的规模所阻碍。为了解决这个基本障碍,本篇论文引入了 Multi-Domain Wizard-of-Oz 数据集(MultiWOZ),这是一个跨越多个领域和主题的完全标记的人与人的书面对话数据集。它的对话数量达到了10k,比所有先前注释的面向任务的语料库大至少一个数量级。除了是标有对话信念状态和对话行为的开源数据集之外,这项工作的贡献有两方面:首先,提供数据收集程序的详细描述以及数据结构和分析的摘要。数据收集渠道完全基于众包,无需聘请专业注释人员;其次,报告了一组信念跟踪,对话行为和回复生成的基准结果,显示了数据的可用性,并为未来的研究设定了基线。

6. A Survey of Available Corpora For Building Data-Driven Dialogue Systems: The Journal Version

作者:Iulian Vlad Serban, Ryan Lowe, Peter Henderson, Laurent Charlin, Joelle Pineau

发表:Dialogue & Discourse

链接:https://www.aminer.cn/pub/5b3d98bd17c44a510f800274/a-survey-of-available-corpora-for-building-data-driven-dialogue-systems-the

本篇论文告诉我们目前有哪些可用于对话生成系统的开源数据集,并且分析了它们各自的重要特性,以及该如何使用他们。此外讨论了它们除了对话系统外的其他用途,以及这些数据集对应的检测方法。

7. The Design and Implementation of XiaoIce, an Empathetic Social Chatbot

作者:Li Zhou, Jianfeng Gao, Di Li, Heung-Yeung Shum

发表:Computational Linguistics

链接:https://www.aminer.cn/pub/5c5ce50d17c44a400fc38d54/the-design-and-implementation-of-xiaoice-an-empathetic-social-chatbot

这是由微软研究员发表的关于智能语音助手小冰的论文。小冰是一个独特的人工智能伴侣,具有情感联系,满足人类对交流、感情和社会归属的需求。本篇论文在系统设计中考虑了智商和情商,将人机社交聊天作为马尔可夫决策过程(MDP)的决策,并优化了小冰的长期用户参与度和预期的每次会话对话。本篇文章详细介绍了系统架构和关键组件,包括对话管理器、核心聊天、技能和移情计算模块;并展示了小冰如何动态识别人类的感受和状态,理解用户意图,并在长时间的对话中响应用户需求。

8. A Network-based End-to-End Trainable Task-oriented Dialogue System

作者:Lina Maria Rojas-Barahona,Milica Gasic, Nikola Mrksic, Pei-Hao Su, Stefan Ultes, Tsung-Hsien Wen, Steve J. Young, David Vandyke

链接:https://www.aminer.cn/pub/59ae3c3a2bbe271c4c71fcd9/a-network-based-end-to-end-trainable-task-oriented-dialogue-system

让机器去和人类自然的交谈是具有挑战性的。最近的任务型对话系统需要创造几个部分并且通常这需要大量的人工干预,或者需要标注数据去解决各部分训练的问题。本篇论文提出了一种端到端的任务型对话系统(End-to-End trainable system),它采取了一种基于管道框架的新颖的收集对话数据的方法。这个方法确保轻松实现对话系统而不用过多的人工干预。

9. Neural Belief Tracker: Data-Driven Dialogue State Tracking

作者:Nikola Mrksic, Diarmuid Ó Séaghdha, Tsung-Hsien Wen, Blaise Thomson, Steve J. Young

链接:https://www.aminer.cn/pub/57a4e921ac44365e35c9913a/neural-belief-tracker-data-driven-dialogue-state-tracking

现代口语对话系统的核心组成部分之一是 belief tracker,它可以在对话的每一步估计用户的目标。然而,目前大多数方法难以扩展到更大、更复杂的对话领域。这是由于他们依赖:a)口语理解(Spoken Language Understanding,SLU)模型,需要大量注释的训练数据;或者 b)手工制作的词汇表,用于捕捉用户语言中的一些词语变种。本篇论文提出了一个新的 Neural Belief Tracking(NBT)框架,通过将模型建立在表征学习上以此克服了这些问题。NBT 模型对预训练的词向量进行推理,学习将它们组合成用户话语和对话上下文的分布式表示。

10. Towards an Automatic Turing Test: Learning to Evaluate Dialogue Responses

作者:Ryan Lowe, Michael Noseworthy, Iulian Vlad Serban, Nicolas Angelard-Gontier, Yoshua Bengio, Joelle Pineau

链接:https://www.aminer.cn/pub/59ae3c262bbe271c4c71ea58/towards-an-automatic-turing-test-learning-to-evaluate-dialogue-responses

本篇论文使用语境和真实反应来对模型生成的反应进行打分,并和人类打分的分值进行比较,从而达到一种自动进行图灵检测效果。训练出来的模型可以生成符合人类判断、能回答输入语句的对话。 在给定地面实况的情况下,以往的工作都是计算生成话语和地面实况的相似性(包括字面上、语义上),本篇论文从人的理解角度出发,对生成的反应进行度量。

11. Adversarial Learning for Neural Dialogue Generation

作者:Jiwei Li, Will Monroe, Tianlin Shi, Alan Ritter, Dan Jurafsky

链接:https://www.aminer.cn/pub/58d82fcbd649053542fd6082/adversarial-learning-for-neural-dialogue-generation

12. To Plan or not to Plan? Discourse Planning in Slot-Value Informed Sequence to Sequence Models for Language Generation

作者:Neha Nayak, Dilek Hakkani-Tür, Marilyn A. Walker, Larry P. Heck

发表:Interspeech Conference

链接:https://www.aminer.cn/pub/5a73cb6317c44a0b30358265/to-plan-or-not-to-plan-discourse-planning-in-slot-value-informed

13. Training End-to-End Dialogue Systems with the Ubuntu Dialogue Corpus

作者:Ryan Thomas Lowe, Nissan Pow, Iulian Vlad Serban, Laurent Charlin, Chia-Wei Liu, Joelle Pineau

发表:Dialogue & Discourse

链接:https://www.aminer.cn/pub/58d82fecd649053542fdc665/training-end-to-end-dialogue-systems-with-the-ubuntu-dialogue-corpus

14. A Copy-Augmented Sequence-to-Sequence Architecture Gives Good Performance on Task-Oriented Dialogue

作者:Mihail Eric, Christopher D. Manning

链接:https://www.aminer.cn/pub/58d82fd2d649053542fd76c7/a-copy-augmented-sequence-to-sequence-architecture-gives-good-performance-on-task

15. Learning Symmetric Collaborative Dialogue Agents with Dynamic Knowledge Graph Embeddings

作者:He He, Anusha Balakrishnan, Mihail Eric, Percy Liang

链接:https://www.aminer.cn/pub/599c7953601a182cd263067d/learning-symmetric-collaborative-dialogue-agents-with-dynamic-knowledge-graph-embeddings

16. Key-Value Retrieval Networks for Task-Oriented Dialogue

作者:Mihail Eric, Lakshmi Krishnan, Francois Charette, Christopher D. Manning

链接:https://www.aminer.cn/pub/5d9edbfa47c8f7664602e485/key-value-retrieval-networks-for-task-oriented-dialogue

17. Learning Robust Dialog Policies in Noisy Environments

作者:Maryam Fazel-Zarandi, Shang-Wen Li, Jin Cao, Jared Casale, Peter Henderson, David Whitney, Alborz Geramifard

链接:https://www.aminer.cn/pub/5a73cbc317c44a0b3035eb5a/learning-robust-dialog-policies-in-noisy-environments

18. Hybrid Code Networks: practical and efficient end-to-end dialog control with supervised and reinforcement learning

作者:Jason D. Williams, Kavosh Asadi, Geoffrey Zweig

链接:https://www.aminer.cn/pub/58d82fcbd649053542fd5e67/hybrid-code-networks-practical-and-efficient-end-to-end-dialog-control-with

19. The Dialog State Tracking Challenge Series: A Review

作者:Jason D. Williams, Antoine Raux, Matthew Henderson

发表:Dialogue & Discourse

链接:https://www.aminer.cn/pub/57a4e937ac44365e35c9cbfe/the-dialog-state-tracking-challenge-series-a-review

20. How NOT To Evaluate Your Dialogue System: An Empirical Study of Unsupervised Evaluation Metrics for Dialogue Response Generation

作者:Chia-Wei Liu, Ryan Lowe, Iulian Vlad Serban, Michael Noseworthy, Laurent Charlin, Joelle Pineau

链接:https://www.aminer.cn/pub/573696106e3b12023e5239eb/how-not-to-evaluate-your-dialogue-system-an-empirical-study-of-unsupervised

20篇聊天机器人领域必读论文速递!相关推荐

  1. 51篇最新CV领域综述论文速递!涵盖14个方向:目标检测/图像分割/医学影像/人脸识别等方向...

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 本文共汇总了从2020年4月至今的计算机视觉领域综述性论文,共54篇,涵盖图像分割. 图像识别.人脸识 ...

  2. 【CV】54篇最新CV领域综述论文速递!涵盖14个方向:目标检测/图像分割/医学影像/人脸识别等方向...

    文章来源于极市平台,作者CV开发者都爱看的 [导读]本文共汇总了从2020年4月至今的计算机视觉领域综述性论文,共54篇,涵盖图像分割. 图像识别.人脸识别/检测.医学影像.目标检测.3D方向(自动驾 ...

  3. 完成一篇机器人领域期刊论文所需要的一些工具

    完成一篇机器人领域期刊论文所需要的一些工具 书写工具 制图工具 PDF格式 PPT制图 VISIO制图 EPS 格式 Inkspace 仿真工具 MATLAB 路径点生成 实时仿真动画Gif生成 RO ...

  4. 深度学习CV领域必读论文

    深度学习CV领域必读论文 01 深度学习CV领域划时代论文具有里程碑意义 期刊日期: NIPS-2012,Alexnet 论文名称: <ImageNet Classification with ...

  5. CVPR 2022 3月7日论文速递(17 篇打包下载)涵盖 3D 目标检测、医学影像、图像去模糊、车道线检测等方向

    CVPR2022论文速递系列: CVPR 2022 3月3日论文速递(22 篇打包下载)涵盖网络架构设计.姿态估计.三维视觉.动作检测.语义分割等方向 CVPR 2022 3月4日论文速递(29 篇打 ...

  6. CVPR2019 | 15篇论文速递(涵盖目标检测、语义分割和姿态估计等方向)

    [导读]CVPR 2019 接收论文列表已经出来了,但只是一些索引号,所以并没有完整的论文合集.CVer 最近也在整理收集,今天一文涵盖15篇 CVPR 2019 论文速递,内容涵盖目标检测.语义分割 ...

  7. 【一周论文速递】自然语言处理最新论文!

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 自然语言处理论文速递 [1] Pretrained Transformers Im ...

  8. 【论文速递】9位院士Science88页长文:人工智能的进展、挑战与未来

    [论文速递]9位院士Science88页长文:人工智能的进展.挑战与未来 [论文原文]:Intelligent Computing: The Latest Advances, Challenges a ...

  9. 【论文速递】CVPR2022-Blind2Unblind:具有可见盲点的自监督图像去噪

    [论文速递]CVPR2022-Blind2Unblind:具有可见盲点的自监督图像去噪 [论文原文]Blind2Unblind: Self-Supervised Image Denoising wit ...

  10. 【论文速递】IJCV2022 - CRCNet:基于交叉参考和区域-全局条件网络的小样本分割

    [论文速递]IJCV2022 - CRCNet:基于交叉参考和区域-全局条件网络的小样本分割 [论文原文]:CRCNet: Few-shot Segmentation with Cross-Refer ...

最新文章

  1. 没有终结点在侦听可以接受消息的_IoT Hub入门(3)使用消息路由将原始设备数据记录存档...
  2. 一种 Android 应用内全局获取 Context 实例的装置
  3. Python合并字典的七种方式!
  4. 从零开始数据科学与机器学习算法-分类与决策树-06
  5. ALAssetsLibrary获取相册列表
  6. java 伴随矩阵_C#计算矩阵的逆矩阵方法实例分析
  7. [读书笔记]机器学习:实用案例解析(6)
  8. 2018.6.5今天跟着视频做了一个提交Todolist
  9. xhtml标签和html标签,XHTML常用标签
  10. 使用ocupload和POI一键上传Excel并解析导入数据库
  11. 【语音处理】基于matlab GUI数字音频分析与处理系统【含Matlab源码 1739期】
  12. Social Media附加价值开发的四大模式
  13. 用python实现pdf转word_Python实现PDF转Word
  14. c语言头文件malloc.h,#includemalloc.h,sys/types.h ,stdlib.h,string.h及C语言头文件
  15. 计算机术语 打桩,动力打桩公式
  16. Ubuntu系统搜狗拼音无法输出
  17. 【国产单片机】华大HC32L13系列使用printf进行调试(多种方法)
  18. ACM技术栈(知识栈)
  19. Unity (游戏引擎)
  20. 基于JSP的煤炭销售系统,源码下载

热门文章

  1. Hi3518EV200 SDK 分析
  2. hp cp1025 linux 驱动,惠普HP LaserJet CP1025 打印机驱动
  3. 人工智能十大算法_【读书】人工智能和大数据:新智能的诞生/人工智能科学与技术丛书...
  4. Cozmo机器人使用中文Scratch3编程案例(codelab)
  5. Mac 安装 CentOS镜像 及 VMware虚拟机
  6. 微信小程序引入iconfont实现添加自定义颜色图标
  7. c语言标准流程图,c语言设计流程图!设计流程图
  8. Matlab矩阵大全
  9. Git 客户端管理工具:Git Gui、TortoiseGit、GitHub Desktop
  10. 【docker系列】docker深入浅出之安装Nginx+PHP+MySQL