新年快乐呀~~
过完年之后又要开始学习啦,因为我还有一个课的作业是要写一个综述,所以最近会经常看与任务型对话相关的综述或文章啦~
今天分享的是针对任务型对话中SLU任务的一篇综述,提取感谢各位批评指正啦~

Review of Research on Task-Oriented Spoken Language Understanding(综述)

论文主要内容(包含创新点以及不足)

  • 任务型对话的基本流程(跟我了解到的分类有一点点不一样,为了保持一致我还是按照之前我的分类方法啦),本文主要是介绍SLU的,主要介绍了SLU下两个关键子任务,分别是意图识别和槽填充,意图识别是分类任务,槽填充类似命名实体识别。

  • 主要介绍了解决这两个子任务的方法以及发展过程

    • 从传统方法到深度神经网络方法
    • 从两个任务的独立模型到联合模型(因为考虑到意图识别和槽填充之间有相互依赖的关系)
  • 独立模型

    • 槽填充:传统方法有三种,主要是基于词典的方法(字符串匹配,但是没有完整的实体库,且耗时)、基于规则的方法(词汇、句法、语义规则,但是需要制定规则,成本高且不易改变)、统计方法(多重迭代损失函数调整参数,需要人工标注的数据和人工构造特征),但是效果不如DNN好;DNN方法主要有CNN、RNN及其变体
    • 意图识别:传统方法主要是SVM、NB、Adaboost等方法;DNN方法也是CNN、RNN等,也可用两者结合的方法,这里的输入有两种形式,一种是将语篇中所有词的平均向量作为输入,一种是将每个词的向量作为输入
  • 联合模型

    • 三角链-CRF联合模型,采用级联的方法,前者的结果可以作为先验知识,帮助产生后者的结果。这是传统机器学习的方法,虽然有助于联合识别,但是耗时费力,且需要语料库充足。

    • CNN-TriCRF联合模型,CNN用于提取文本特征,该特征向量由两个任务共享,TriCRF用于归一化将意图识别任务中全部文本,考虑全局信息结果更准确,可以找全局最优解。与传统方法相比,训练参数更多,模型更加复杂。

    • 门控循环单元联合模型,使用GRU和CNN联合解决两个任务,用GRU学习预测槽填充的标签,同时用最大池化捕获意图分类的全局特征。性能有提升但是也有很多问题,对意图识别,最大池化的方法会导致信息丢失,应该获取更高层次的语法和语义信息去实现意图识别。

    • BiLSTM-Attention联合模型,用注意力机制捕获隐藏层无法捕获的额外信息,h和c都是两个任务的输入,加入了Attention,可以注意到不同的输入序列对输出的影响。但是也有缺点,对意图识别,简单的取最大值会丢失信息熵;对槽填充,没有考虑到输出序列的全局归一化,易出现偏差。

    • 基于注意力的slot-gated联合模型,BiLSTM-Attention并没有说明两个任务的相互作用,因此加入了slot-gated。(这个设计好巧妙)

  • 未来改进

    • 目前对大规模语料效果还可以,对小规模不行,如何进行迁移学习
    • 深度神经网络模型需要学习更好的语法和语义信息,否则模型会很复杂
    • 用注意力机制效果会变好,但是因为要考虑到其他时序的信息,模型会更复杂,可以用强化学习训练文本特征,达到简化学习的目的。

学到的点

  • 对SLU和下面两个子任务(意图识别和槽填充)有了更深的了解

不懂的点

  • 综述里提到的一些方法的原理和模型结构还不是特别了解,需要继续看

论文阅读(五):Review of Research on Task-Oriented Spoken Language Understanding相关推荐

  1. 【论文阅读】BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

    文章目录 论文内容 摘要(Abstract) 1. 介绍(Introduction) 2. 相关工作(略) 3. BERT 3.1 预训练BERT(Pre-training BERT) 4. 个人总结 ...

  2. BERT(一)--论文翻译:BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

    转载请注明出处:https://blog.csdn.net/nocml/article/details/124860490 传送门: BERT(一)–论文翻译:BERT: Pre-training o ...

  3. 论文导读:TOWARDS END-TO-END SPOKEN LANGUAGE UNDERSTANDING

    这篇文章是来自大神Yoshua Benjio的,值得一读,研究对象是只基于语音spoken,而非文字的自然语言理解,链接在这. 0. Abstract 大概说了一下什么是NLU, 然后说他们的end- ...

  4. 生物信息学之抗癌药物反应论文阅读五:L1000+DTI

    论文地址:Drug–target interaction prediction with a deep-learning-based model 基于深度学习的药物-靶标相互作用预测 作者信息: Li ...

  5. 【论文阅读笔记】BART: Denoising Sequence-to-Sequence Pre-training for Natural Language Generation, Translati

    BART:去噪序列到序列的预训练自然语言生成.翻译和理解 动力 自监督方法在广泛的NLP任务中取得了显著的成功.最成功的方法是masked language model的变体去噪的自编码器.训练去噪的 ...

  6. 论文阅读(XiangBai——【CVPR2017】Detecting Oriented Text in Natural Images by Linking Segments)...

    XiangBai--[CVPR2017]Detecting Oriented Text in Natural Images by link Segments 目录 作者和相关链接 方法概括 方法细节 ...

  7. 论文阅读笔记:Jointly Discovering Visual Objects and Spoken Words from Raw Sensory Input

    文章目录 摘要 一.背景 二.模型 三.实验 论文地址:https://arxiv.org/abs/1804.01452 代码:https://github.com/LiqunChen0606/Joi ...

  8. 论文阅读(一):Hierarchical LSTM for Sign Language Translation

    Abstract SLT (Sign Language Translation) 手语翻译 CTC (Connectionist temporal classification) 连接主义时间分类 l ...

  9. 【论文阅读】正则表达式也可以被当成神经网络训练吗?[附项目代码与代码详细说明]

    论文标题: Cold-Start and Interpretability: Turning Regular Expressions into Trainable Recurrent Neural N ...

最新文章

  1. java中的关键字static(静态变量)和final定义常量
  2. Firebird日期时间操作
  3. 学生创客 开公司造3D打印机
  4. 江苏省事业单位计算机入面分数线,2020江苏事业单位统考周日笔试,考多少分进面?...
  5. 【简洁代码】1028 List Sorting (25 分)_26行代码AC
  6. python 计算过程图片_[Python图像处理]九.图像形态学相关运算
  7. VS2019调试查看变量_单片机编程软件一点通,IAR单片机编程软件工程调试方法
  8. react改变checkbox的文字类型_reactjs – React复选框事件和处理程序的Typescript类型?...
  9. [妙味Ajax]第一课:原理和封装
  10. linux查看硬件信息及驱动设备
  11. 思科、华为、华三交换机的线缆检测功能
  12. 计算机用户导入导出,使用csvde批量添加,导入,导出用户
  13. 能学习计算机考证的手机软件有那些?推荐
  14. switch语句练习题
  15. 关于jupyter notebook闪退问题【我真真的够了,大家以后不要乱捣鼓电脑了,绝了】
  16. 笔记本html外接显示器,笔记本怎么外接显示器 笔记本用外接显示器设置教程
  17. android miui连接开发者选项,(最详细)MIUI11系统的Usb调试模式在哪里开启的步骤
  18. 魅族便签,能否成为国内便签应用的No.1?
  19. Oracle数据库监听启动报错
  20. 人人都能看懂的「迭代器、生成器」入门指南!

热门文章

  1. 实习渗透工程师面试记录
  2. 使用Vue+Bootstrap开发在线音乐网站
  3. python编写的程序可以在任何平台中执行-在Windows平台上编写的Python程序无法在Unix平台运行。...
  4. 协鑫集成的这款组件,真的很适合农光互补!
  5. linux 快速建网站,如何快速建站,新手快速搭建网站教程
  6. Thanos 组件介绍以及使用心得
  7. zsh: no matches found: 错误解决 setopt no_nomatch
  8. 分享国内外好用的H5页面制作网站
  9. 有关php地英语文章,实用英语短句-PHP教程,其它文章
  10. 《异常检测——从经典算法到深度学习》5 Opprentice——异常检测经典算法最终篇