文章目录

  • 论文部分
    • Abstract
    • Introduction
    • Proposed Approach
  • 实验部分

论文部分

Abstract

根据slot和intent之间的关系,提出了一种slot gate来学习intent和slot向量之间的关系,通过全局优化来获得更好地语义信息。

Introduction

由于slot通常高度依赖于intent,因此本工作重点介绍如何通过引入slot gate来建模slot和intent向量之间的显式关系:

  • slot gated模型效果比基于注意力的模型具有更好的性能;
  • 对两个SLU数据集的实验表明了所提出的slot gate的推广和有效性;
  • gating表示有助于我们学习 slot-intent 之间的关系。

Proposed Approach

模型架构图。

可以看出,该模型主要是将单词序列输入一个双向的LSTM中

state_outputs, final_state = tf.nn.bidirectional_dynamic_rnn(cell_fw,cell_bw,inputs,sequence_length=sequence_length,dtype=tf.float32)

对于输出部分,将其通过两种方式进行拼接,分别作为slot和intent attention层的输入:

# final_state size : [batch_size, 4 * layer_size],作为intent_attention的输入
final_state = tf.concat([final_state[0][0], final_state[0][1],final_state[1][0], final_state[1][1]], 1)
# state_outputs size : [batch_size, sequence_length, 2 * layer_size],作为slot_attention的输入
state_outputs = tf.concat([state_outputs[0], state_outputs[1]], 2)

然后是attention的部分,这里使用了一层卷积来实现注意力机制.

hidden_features = tf.nn.conv2d(hidden_conv, k, [1, 1, 1, 1], "SAME")
hidden_features = tf.reshape(hidden_features, origin_shape)

接下来是slot-gated的概念

intent_gate = _linear(intent_output, attn_size, True)
intent_gate = tf.reshape(intent_gate, [-1, 1, intent_gate.get_shape()[1].value])

实验部分

  1. 代码下载:SlotGated-SLU

  2. 环境要求:
    python3.5 + tensorflow1.4

  3. 环境配置:

    • 安装虚拟环境
      安装虚拟环境
      pip install virtualenv
      在当前目录下,创建虚拟环境目录,并指定python解释器。
      virtualenv -p /usr/bin/python3.5 tensorflow-py3.5
      激活虚拟环境
      source tensorflow-py3.5/bin/activate
      激活之后可以看到:

参考博客:python虚拟环境–virtualenv

  • tensorflow下载安装:可以使用清华大学提供的镜像,选择相应的计算单元、操作系统、python版本、tensorflow版本进行下载安装,会自动生成安装命令。

  • (已弃用的方法)

清华大学tensorflow镜像
我使用的安装命令:
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple/ https://mirrors.tuna.tsinghua.edu.cn/tensorflow/linux/cpu/tensorflow-1.4.0-cp35-cp35m-linux_x86_64.whl
- 安装完毕之后就可以根据readme里的Usage来运行程序了。

  • 使用tensorflow1.14

注意1.4版本的一些函数与1.14版本不兼容,修改后再跑代码,具体如下:

# 源代码
from tensorflow.python.ops import rnn_cell_impl
y = rnn_cell_impl._linear(slot_inputs, attn_size, True)

替换为:

from tensorflow.contrib.rnn.python.ops.core_rnn_cell import _linear
y = _linear(slot_inputs, attn_size, True)

【论文阅读】Slot-Gated Modeling for Joint Slot Filling and Intent Prediction相关推荐

  1. Slot-Gated Modeling for Joint Slot Filling and Intent Prediction论文笔记

    文章目录 摘要 方法 Attention-Based RNN Model Slot Filling Intent Prediction Slot-Gated Mechanism Joint Optim ...

  2. 论文阅读笔记-Gated relational stacked denoising autoencoder with localized author embedding for

    论文题目:Gated relational stacked denoising autoencoder with localized author  embedding for global cita ...

  3. 论文阅读课3-GraphRel: Modeling Text as Relational Graphs for(实体关系联合抽取,重叠关系,关系之间的关系,自动提取特征)

    文章目录 abstract 1.Introduction 2.相关工作 3.回顾GCN 4.方法 4.1第一阶段 4.1.1 Bi-LSTM 4.1.2 Bi_GCN 4.1.3 实体关系抽取 4.2 ...

  4. 论文阅读:Probabilistic Modeling of Semantic Ambiguity for Scene Graph Generation(CVPR21)

    传统的判别模型(针对predicate种类)如c所示,对于同一对物体总是倾向于产生相同的predicate.但是视觉关系往往是语义模糊的 ,比如: (1)person-holding-umbrella ...

  5. 【论文阅读31】《OptCuts: Joint Optimization of Surface Cuts and Parameterization》

    目录 一些疑惑 0 引言 1 introduction 2 related work 2.1 parameterization with fixed connectivity 2.2 Separate ...

  6. 自动驾驶轨迹预测论文阅读(二)TPNet: Trajectory Proposal Network for Motion Prediction

    论文链接:https://openaccess.thecvf.com/content_CVPR_2020/papers/Fang_TPNet_Trajectory_Proposal_Network_f ...

  7. 论文阅读:3D multi-scale, multi-task, and multi-label deep learning for prediction of lymph node metasta

    3D多尺度.多任务.多标签深度学习预测T1肺腺癌CT图像淋巴结转移 Key word: 淋巴结转移预测肺结节征候三维卷积神经网络 Abstract: 术前淋巴结(LN)转移的诊断对于T1肺腺癌患者评估 ...

  8. [论文阅读]阿里DIN深度兴趣网络之总体解读

    [论文阅读]阿里DIN深度兴趣网络之总体解读 文章目录 [论文阅读]阿里DIN深度兴趣网络之总体解读 0x00 摘要 0x01 论文概要 1.1 概括 1.2 文章信息 1.3 核心观点 1.4 名词 ...

  9. [论文阅读] (07) RAID2020 Cyber Threat Intelligence Modeling Based on Heterogeneous GCN

    <娜璋带你读论文>系列主要是督促自己阅读优秀论文及听取学术讲座,并分享给大家,希望您喜欢.由于作者的英文水平和学术能力不高,需要不断提升,所以还请大家批评指正,非常欢迎大家给我留言评论,学 ...

最新文章

  1. 播客#47:劳伦斯·布拉德福德
  2. 华为鲲鹏高校行长沙启航,助力基础研究成果转化
  3. java最最长的错误,Java开发中遇到最多的异常是什么?最后一个最多最难!
  4. 与reCAPTCHA的Spring集成
  5. 一文带你彻底搞懂C++中一些常见指针(形如*p)的用法
  6. 大学计算机教学ppt数制,大学计算机基础 第3讲 数制及其相互转换 国家精品课程课件(可编辑)...
  7. python子类分配
  8. duilib WindowImplBase BUG修复 --- 按一次ESC键, 关闭多个窗口
  9. (三)微调VGG16以对服装进行分类
  10. 零基础带你学习MySQL—加密函数和系统函数(十六)
  11. java打印等腰三角形_为什么大家都说Java中只有值传递?
  12. SpringMVC中的父子容器关系
  13. C++实现经典同步问题(生产者消费者、读者写者、哲学家进餐、吸烟者问题)
  14. 数据可视化之使用Matplotlib绘制甘特图
  15. 用友YonSuite前后端一体化数智赋能,有化妆品的地方就有老中医
  16. 超级会员创作者收益说明
  17. AutoJs学习-录制手指动作
  18. WINZIP压缩文件怎么加密?
  19. 最适合汽车软件开发的生态系统是什么?
  20. 微信小程序获取页面元素高度_微信小程序之动态获取元素宽高

热门文章

  1. 接口与继承系列教材 (十)- Java 内部类详解
  2. 2022年一级建造师考试《市政公用工程》练习题及答案(多选题)
  3. 三维点云语义分割【综述】 ——Deep Learning for 3D Point Clouds: A Survey
  4. 苏世民:顶尖领导者的52条法则
  5. 倒在转“码”路上的文科生
  6. stm32cubemx hal学习记录:JY901S串口
  7. 终端 常用移动光标的快捷键
  8. 微信活码裂变系统 利器
  9. [不好分类]关于河北盛华化工有限公司附近爆炸原因猜测
  10. 硬件设计分享-⑨电感与磁珠