论文笔记整理:娄东方,浙江大学博士后,研究方向为事件抽取。


Vedula N, Lipka N, Maneriker P, et al. Open Intent Extraction from Natural Language Interactions[C]//Proceedings of The Web Conference 2020. 2020: 2009-2020.

来源:WWW2020

链接:

https://dl.acm.org/doi/abs/10.1145/3366423.3380268

近年来,NLU和语音识别方面的技术进步促进了聊天代理(Siri, Cortana, Alexa等)的繁荣。在人机交互过程中,代理机器人需要对用户语句进行解析和理解,尤其是确定用户所表达的意图。例如,从”Please make a 10:30 sharp appointment for a haircut”识别出意图” makinga haircut appointment”。考虑到交互过程中可能有新意图类型不断涌现,该场景下它实际是一个开放意图识别问题。

现有方法中,一般将交互文本中的意图识别视为多分类问题。它在封闭意图下表现较好,但不能识别新意图或训练过程中未见的意图;且现有数据中单个语句一般只包含一个意图,很难覆盖现实多意图情形。零样本学习通过学习新类别知识以构建相应分类器,但新类别必须明确定义并构建相应知识。其他一些方法只能判断是否包含新意图,但无法给出具体描述。

Motivation

1.开放意图识别关键在于构建一个统一的schema,它既能建模当前已知意图,也能刻画新的、未知的意图。本文提出的意图schema包括两部分:(1)Action, 明确意图、任务或动作的词语;(2)Object, 是指Action实施对象实体词。

例如,语句”Please make a 10:30 sharp appointment for a haircut”中,Action为“make”,Object为“appointment”。

2.直觉地,基于Action + Object的意图schema,可将开放意图识别形式化为序列标注问题。其中,标签集合包括Action, Object, None;且抽取的意图对必须同时包含Action和Object对象。

Model

Figure 1 开放意图抽取框架OPINE

如图1所示,本文提出的OPINE框架主要包括:对抗训练,Bi-LSTM语义编码,Multi-head attention机制,带约束的CRF,生成意图等。OPINE框架相对简洁,且在各阶段都进行了精细处理。具体如下,

(1)对抗训练

为提升整体模型的鲁棒性,该框架对输入embedding添加扰动,但不改变输出标签,进而使得模型对embedding的微小变动稳健。具体而言,

在训练过程中,给embedding添加最差情况下的干扰信号。并用一阶导数进行逼近,

最终损失函数为原始数据和对抗样本分别损失的加权平均。生成的对抗样本中,只保留与原始样本embedding高于某个阈值的数据。

(2) Bi-LSTM

利用Bi-LSTM捕捉上下文语义信息。

(3) Multi-head attention

应用transformer结构中的multi-head attention机制,学习长距离依赖关系。

(4) 带约束的CRF

CRF在序列标注任务中被广泛应用,因其具备标签序列依赖建模能力。意图schema对标签序列存在约束——必须同时包含Action和Object标签。本文提出两种方法将该约束融进来:a) 适应的beam search, 如果约束条件不满足,则取下一个最有可能的序列;b) 适应的Viterbi算法,将解码问题转化为整数线性优化问题,并将约束条件加进来。

(5) 生成意图

考虑到单个语句中可能存在多个意图,这需要我们对CRF层输出的标签进一步加工,从而得到Action-Object对。本文考虑两种方法:a) 基于距离的启发式拼装,将相距较近的Action-Object配对成一个完整意图;b) 基于MLP分类器,以候选Action-Object对的词向量和距离作为MLP的输入,分类判断是否构成意图对。

Experiment

本文作者构造一个意图抽取数据集(Stack Exchange data):总共75000个问题,其中25000个问题包含抽取的意图标注结果,另50000个问题基于Stanford CoreNLP依存分析工具解析得到verb-object关系。评估步骤:(1)、基于50000个问题的解析结果对BERT模型进行调整;(2)、基于25000个问题的标注数据进行精调、测试。评价指标包括:Action结果的P, R, F1; Object结果的P, R, F1;意图对Action-Object的P, R, F1;抽取意图向量表示(所有token的GloVe向量的平均)与标注意图向量表示的余弦相似度。

Figure 2 OPINE框架在Stack Exchange data上的表现

从图2可以看到,本文提出的OPINE相较于现有SRL、依存分析等更优,抽取意图的相似度提升超过0.1。

Figure 3 OPINE在domain adaption中的表现。“+td”表示测试domain在训练过程可见,“-td”表示测试domain在测试过程中不可见

图3显示OPNIE具备较强的可迁移性,新domain情形较现有domain的表现下降幅度都在5%以下。

Figure 4 OPINE在SNIPS和ATIS上的表现

本文提出的抽取式开放意图识别框架OPINE在图4中得到充分证明,基于这种思路可学到语言的底层信息,模型具备很强的迁移性。具体而言,OPINE + classifier指基于Stack Exchange data训练的模型获取编码,给定SNIPS和ATIS的意图类别数,OPINE + classifier基于层次聚类获得最终预测标签(完全的domain迁移),在两个数据集下取得了与封闭意图识别SOTA相当的结果。具体聚类效果图如图5所示。

Figure 5 OPINE + classifier在SNIPS数据上的聚类结果


OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 博客。

论文浅尝 - WWW2020 | 从自然语言交互中提取开放意图相关推荐

  1. 论文浅尝 - AAAI2020 | 利用自然语言推断生成人称一致的对话

    链接: https://arxiv.org/pdf/1911.05889.pdf 动机 虽然最近几年通过利用社交网络上大量人人交互数据训练开放域对话模型取得了很大的成功,但是这些数据驱动的对话系统仍然 ...

  2. 论文浅尝 - AAAI2020 | 基于知识图谱进行对话目标规划的开放域对话生成技术

    论文笔记整理:张傲,天津大学硕士. Knowledge Graph Grounded Goal Planning for Open-Domain Conversation Generation 来源: ...

  3. 论文浅尝 - WWW2020 | 通过对抗学习从用户—项目交互数据中挖掘隐含的实体偏好来用于知识图谱补全任务...

    笔记整理 | 陈湘楠,浙江大学在读硕士. 现有的知识图谱补全方法都在试图设计全新的学习算法,来使用已知的事实信息去推理知识图谱中的潜在语义.但随着知识图谱的广泛使用,知识图谱中的许多实体对应着应用程序 ...

  4. 论文浅尝 | WWW2020 - 知识图谱中的实体摘要:算法、评价和应用 (PPT)

    本文转载自公众号:专知. 知识图谱封装了实体和关系.知识图谱的简洁表示格式和图的特性使得许多新的Web应用程序得以创建,并增强了现有的应用性能.然而,在一个知识图谱中,描述一个实体的几十个或几百个事实 ...

  5. 论文浅尝 - ACL2020 | 用于回答知识库中的多跳复杂问题的查询图生成方法

    论文笔记整理:谭亦鸣,东南大学博士. 来源:ACL 2020 链接: https://www.aclweb.org/anthology/2020.acl-main.91.pdf 1.介绍 在以往的工作 ...

  6. 论文浅尝 | 学习开发知识图谱中的长期关系依赖 - ICML 2019 ​

    本文转载自公众号:南大Websoft. 论文:https://arxiv.org/abs/1905.04914 代码:https://github.com/nju-websoft/RSN 背景 知识图 ...

  7. 论文浅尝 | 从知识图谱流中学习时序规则

    论文笔记整理:汪寒,浙江大学硕士,研究方向为知识图谱.自然语言处理. 链接:http://ceur-ws.org/Vol-2350/paper15.pdf 动机 知识图谱是现在十分流行的数据管理方式, ...

  8. 论文浅尝 | 基于异质图交互模型进行篇章级事件抽取

    笔记整理:娄东方,浙江大学 & 恒生电子股份有限公司博士后,研究方向为事件抽取 来源:ACL2021 链接:https://arxiv.org/abs/2105.14924 GitHub项目地 ...

  9. 论文浅尝 - AAAI2020 | 多轮对话系统中的历史自适应知识融合机制

    论文笔记整理:潘锐,天津大学硕士. 链接:https://www.aaai.org/ojs/index.php/AAAI/article/view/6425 来    源:AAAI 2020 论文简介 ...

最新文章

  1. angular.js phonecat翻译
  2. [数据加密]GIS空间数据水印信息隐藏与加密技术方法[转]
  3. 入门Java开发,这三大知识体系你要知道
  4. 安卓JNI使用OpenCV
  5. Mac Hadoop的安装与配置
  6. Analyzer普通用户登录不了[从网络访问此计算机]
  7. xul 创建一个按钮
  8. 虚拟语气和推测(二)
  9. 关于mysql中Join语句的几个问题
  10. android 网络图片 不能显示,求帮忙啊
  11. PYTHON前端几个框架的比较
  12. python动态数据类型_[python学习手册-笔记]004.动态类型
  13. web下拉菜单代码html,简单的单级下拉菜单实现_html/css_WEB-ITnose
  14. 怎么注册tk域名_关于注册免费TK域名不成功的几个问题解决方案
  15. TI DSP处理器中CMD 文件的那些事儿
  16. 一维数组与二维数组的区别
  17. 名企笔试:2015小米暑期实习(风口的猪-中国牛市)(2017-04-09 算法爱好者)
  18. element-ui tree全部展开和全部折叠
  19. LayUI项目之我的会议(送审以及排座)
  20. 户外直播信号差,老出现卡顿现象怎么办?

热门文章

  1. 设置 NSZombieEnabled 定位 EXC_BAD_ACCESS 错误
  2. GARFIELD@10-07-2004
  3. QT —— 应用程序发布
  4. try...catch()
  5. mit数据集_DriveSeg:动态驾驶场景分割数据集
  6. 报错 ValueError: too many values to unpack (expected 2)
  7. 谷歌浏览器有哪些好看的主题_Kibou 简洁的Typecho主题
  8. .net get set 初始化_.NET项目升级:可为空引用
  9. bootstrap table 分页_Java入门007~springboot+freemarker+bootstrap快速实现分页功能
  10. React中的fragment和StrictMode