Neural Approaches to Conversational AI

学姐介绍的一篇综述阅读笔记

SIGIR 2018

主要贡献:

提出一个综合的调查关于最近几年的应用在QA,任务导向和闲聊对话机器人的神经网络方法

描述了现在和传统方法之间的联系,允许我们更好的理解研究为什么并且如何进化并且散发光在我们前行的道路上

提出先进的方法去训练对话数据,使用监督学习和强化学习的方法

概述在搜索对话和工业中使用的标志性对话系统,研究我们已经达到的成就和仍需面对的挑战

对话:

task completion: agent need to accomplish user tasks

social chat: agent need to converse appropriately with users - like a human as measured by the Turing test - and provide useful recommendations

bots : task-oriented & chitchat

dialogue as optimal decision making

连续的决策制定过程。它有一个自然的结构:一个高层次的选择使得客服去激活某一种特别的子任务,和 一个低层次的过程,又被选择的客服控制,选择最初的动作去完成子任务。

这样的层次决定制定过程能被马尔科夫决策过程(MDPs)描述,这里的选择被定义为primitive actions to higher-level actions。这是对传统的MDP的扩展,原来的MDP设置为一个客服在每一个时间步只能选择一个primitive action,新的MDPs可以选择一个“multi-step” action。

如果我们将每一个option看作一个action,那么top- & low- level 都能够自然的被强化学习框架捕捉。对话agent在MDP中导航,通过一系列离散的step to interact with its environment。在每一个时间步,agent会observe the current state, and chooses an action 根据policy。agent之后会收到reward,然后observe a new state,继续这个循环直到阶段终点。goal of dialogue learning 是去发现最佳策略去最大化expected rewards。

sounding board: a social chatbots designed to maximize user engagement , measured by the expected reward function of conversation-turns per session (CPS)。

混合方法去组合不同ML方法的力量,例如,我们可能会使用仿造品或者监督学习方法。

the transition of NLP to Neural Approaches

NLP应用不同于其他数据处理系统,在语言知识应用的多样性方面,包括音系学,词态学,语法,语义和论述。这些组合任务可以被看作是自然语言的模糊性在不同程度上,通过匹配一个自然语言句子到一系列人为定义的清楚的符号表达,例如POS(part of speech),context free grammar, first-order predicate calculus.

代替的,端到端的系统聚焦在小心的裁剪增长的神经网络复杂度

机器学习背景

supervised learning (SL)

mean squared error (MSE)

stochastic gradient descent (SGD)

在未知领域,agent要学会通过和环境互动进而自己去学习如何进行下一步动作,这就是强化学习(RL)。1:agent必须要充分利用已经知道的知识为了去获得奖励,但同时也必须要去探索未知的领域和知识为了在未来有更好的行动选择。2:delay reward and temporal credit assignment:agent 直到session的结束都不知道一个对话是否是成功的完成了任务,因此他必须确定在sequence中的哪个动作会对最后的奖励获得有作用,这个问题就是temporal credit assignment。3:partially observed states:神经网络学习通过编码所有的在现在轮和过去步获得的信息去表示状态

和过去的技术相比,神经网络方法提供一个更有效的解决方案通过利用深度神经网络的表示学习力量。

deep learning

multi-layer perceptron (MLP) inputs/outputs/hidden layers

deep neural networks (DDN)

information retrieval (IR)

设计一个深度学习分类器的主要努力是在优化神经网络结构for effective representation learning。

convolutional layers for local words dependencies & recurrent for global word sequences

deep semantic similarity model (DSSM)

reinforcement learning

agent-environment interaction is modeled as a discrete-time Markov decision process (MDP), described by a five-tuple M=<S,A,P,R,Y>

s:环境能够存在的可能无限大的状态集合;a:agent可能存在的可能无限大的状态集合;p(s'|s,a) 在动作 a 后环境的状态从 s 转移到 s' 转移概率;r(s,a) 在agent再状态 s 执行完动作 a 后 agent 立刻接受到的平均奖励;y 属于 0 到 1,左开右闭

transition : (s,a,r,s'), action-selection policy denoted by π (确定或者随机)

转载于:https://www.cnblogs.com/forPrometheus-jun/p/11093981.html

Neural Approaches to Conversational AI相关推荐

  1. 《论文阅读》Neural Approaches to Conversational AI(2)

    <论文阅读>Neural Approaches to Conversational AI(2) 前期内容讲解 机器学习背景 机器学习基础 强化学习 深度学习 Question Answer ...

  2. 《论文阅读》Neural Approaches to Conversational AI(1)

    <论文阅读>Neural Approaches to Conversational AI(1) 摘要 简介 对话难题 对话作为最佳决策过程 自然语言向神经方法的过渡 Question An ...

  3. Neural Approaches to Conversational AI Question Answering(问答,任务型对话,闲聊)

    摘要 本文概述了最近几年开发的对话式AI神经方法. 我们将对话系统分为三类:(1)问答代理,(2)面向任务的对话代理和(3)聊天机器人. 对于每个类别,我们将使用特定的系统和模型作为案例研究,对当前最 ...

  4. 【2021最新综述】Deep Neural Approaches to Relation Triplets Extraction:A Comprehensive Survey

    [2021最新综述]Deep Neural Approaches to Relation Triplets Extraction:A Comprehensive Survey 1 Introducti ...

  5. Azure Neural TTS能让AI语音自然逼真到什么程度?

    摘要:微软Azure Neural TTS让AI语音像真人一样富有感情,自然逼真. Neural TTS(神经网络文本转语音)是微软Azure认知服务的强大语音合成功能,自推出以来,已被广泛应用于从语 ...

  6. 重磅!【ICML | 2019】 人工智能(AI)会话系统介绍(含源码)

    来源:AINLPer微信公众号 编辑: ShuYini 校稿: ShuYini 时间: 2019-8-24 引言     本次为大家推荐的是第三十六届国际机器学习会议(ICML | 2019) 上一个 ...

  7. Improving Conversational Recommender System by Pretraining Billion-scale Knowledge Graph论文笔记

    原文章:Improving Conversational Recommender System by Pretraining Billion-scale Knowledge Graph (ICDE ' ...

  8. 【每周NLP论文推荐】 开发聊天机器人必读的重要论文

    欢迎来到<每周NLP论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 对于聊天机器人研究,可以追溯到上个世纪50 ...

  9. 还在为DST模型刷不动而感到苦恼吗?来试试无监督DST吧,DSI等你来战!

    本文介绍一篇西湖大学联合哈尔滨工业大学 SCIR 实验室和北京理工大学发表于 IJCAI 2020 的论文 Dialogue State Induction Using Neural Latent V ...

最新文章

  1. java的语法树,JAVA语言语法树.doc
  2. Jenkins持续集成环境之凭证管理
  3. 注意!!Java-File类
  4. 关于静态局部全局变量
  5. linux删除空行 基本操作
  6. Scala中使用两种方式对单词进行次数统计(wordCount)
  7. bitmap 转 drawable
  8. c是过程化语言吗数据库,A.数据库语言B.过程化语言C.宿主语言D.数据库管理系统...
  9. c语言1076素数,大学C语言考试题库(答案)-20210412093908.docx-原创力文档
  10. 数组索引必须为正整数或逻辑值_LeeCode457-环形数组循环
  11. 《Linux4.0设备驱动开发详解》笔记--第七章:Linux设备中的并发控制
  12. APP中一种在Java层实现的简单守护进程方式
  13. 定时任务cron表达式详解
  14. Linpack的安装与测试(Mpi+Goto+hpl)
  15. matlab如何打开flt文件,科学网—grb文件的读取 (更新) - 张凌的博文
  16. 微信小程序商城开发费用
  17. ActivityNet 2018介绍
  18. 打卡伦敦博物馆,在时空之旅中探索你未知的城市
  19. 点石成金:“硅业报国”不仅是理念
  20. XY6762/XY6765/XY8788 如何使用 DCT 工具配置 DWS 文件?

热门文章

  1. 【海思篇】【Hi3516DV300】六、音频输入篇
  2. 开启火狐浏览器 Firefox 原生「双击关闭标签页」功能
  3. 关于日本人的笑话合集(转载)
  4. 前端开发规范——Vue
  5. X取个好的英文名字(男性)
  6. 浙江宁波天童禅寺重阳节前夕慰问鄞州区东吴福利院
  7. 科学计算机后盖换电池,图吧小白教程 篇二十二:手把手教你给手机换电池(拆机)...
  8. js 实现在线考试切屏代码
  9. 趣图:程序员的斗志曲线图
  10. Python异常UnicodeEncodeError: 'gbk' codec can't encode character '\uXXX' in position