【论文阅读】Slot-Gated Modeling for Joint Slot Filling and Intent Prediction
文章目录
- 论文部分
- Abstract
- Introduction
- Proposed Approach
- 实验部分
论文部分
Abstract
根据slot和intent之间的关系,提出了一种slot gate来学习intent和slot向量之间的关系,通过全局优化来获得更好地语义信息。
Introduction
由于slot通常高度依赖于intent,因此本工作重点介绍如何通过引入slot gate来建模slot和intent向量之间的显式关系:
- slot gated模型效果比基于注意力的模型具有更好的性能;
- 对两个SLU数据集的实验表明了所提出的slot gate的推广和有效性;
- gating表示有助于我们学习 slot-intent 之间的关系。
Proposed Approach
模型架构图。
可以看出,该模型主要是将单词序列输入一个双向的LSTM中
state_outputs, final_state = tf.nn.bidirectional_dynamic_rnn(cell_fw,cell_bw,inputs,sequence_length=sequence_length,dtype=tf.float32)
对于输出部分,将其通过两种方式进行拼接,分别作为slot和intent attention层的输入:
# final_state size : [batch_size, 4 * layer_size],作为intent_attention的输入
final_state = tf.concat([final_state[0][0], final_state[0][1],final_state[1][0], final_state[1][1]], 1)
# state_outputs size : [batch_size, sequence_length, 2 * layer_size],作为slot_attention的输入
state_outputs = tf.concat([state_outputs[0], state_outputs[1]], 2)
然后是attention的部分,这里使用了一层卷积来实现注意力机制.
hidden_features = tf.nn.conv2d(hidden_conv, k, [1, 1, 1, 1], "SAME")
hidden_features = tf.reshape(hidden_features, origin_shape)
接下来是slot-gated的概念
intent_gate = _linear(intent_output, attn_size, True)
intent_gate = tf.reshape(intent_gate, [-1, 1, intent_gate.get_shape()[1].value])
实验部分
代码下载:SlotGated-SLU
环境要求:
python3.5 + tensorflow1.4环境配置:
- 安装虚拟环境:
安装虚拟环境
pip install virtualenv
在当前目录下,创建虚拟环境目录,并指定python解释器。
virtualenv -p /usr/bin/python3.5 tensorflow-py3.5
激活虚拟环境
source tensorflow-py3.5/bin/activate
激活之后可以看到:
- 安装虚拟环境:
参考博客:python虚拟环境–virtualenv
tensorflow下载安装:可以使用清华大学提供的镜像,选择相应的计算单元、操作系统、python版本、tensorflow版本进行下载安装,会自动生成安装命令。
(已弃用的方法)
清华大学tensorflow镜像
我使用的安装命令:
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple/ https://mirrors.tuna.tsinghua.edu.cn/tensorflow/linux/cpu/tensorflow-1.4.0-cp35-cp35m-linux_x86_64.whl
- 安装完毕之后就可以根据readme里的Usage来运行程序了。
- 使用tensorflow1.14
注意1.4版本的一些函数与1.14版本不兼容,修改后再跑代码,具体如下:
# 源代码
from tensorflow.python.ops import rnn_cell_impl
y = rnn_cell_impl._linear(slot_inputs, attn_size, True)
替换为:
from tensorflow.contrib.rnn.python.ops.core_rnn_cell import _linear
y = _linear(slot_inputs, attn_size, True)
【论文阅读】Slot-Gated Modeling for Joint Slot Filling and Intent Prediction相关推荐
- Slot-Gated Modeling for Joint Slot Filling and Intent Prediction论文笔记
文章目录 摘要 方法 Attention-Based RNN Model Slot Filling Intent Prediction Slot-Gated Mechanism Joint Optim ...
- 论文阅读笔记-Gated relational stacked denoising autoencoder with localized author embedding for
论文题目:Gated relational stacked denoising autoencoder with localized author embedding for global cita ...
- 论文阅读课3-GraphRel: Modeling Text as Relational Graphs for(实体关系联合抽取,重叠关系,关系之间的关系,自动提取特征)
文章目录 abstract 1.Introduction 2.相关工作 3.回顾GCN 4.方法 4.1第一阶段 4.1.1 Bi-LSTM 4.1.2 Bi_GCN 4.1.3 实体关系抽取 4.2 ...
- 论文阅读:Probabilistic Modeling of Semantic Ambiguity for Scene Graph Generation(CVPR21)
传统的判别模型(针对predicate种类)如c所示,对于同一对物体总是倾向于产生相同的predicate.但是视觉关系往往是语义模糊的 ,比如: (1)person-holding-umbrella ...
- 【论文阅读31】《OptCuts: Joint Optimization of Surface Cuts and Parameterization》
目录 一些疑惑 0 引言 1 introduction 2 related work 2.1 parameterization with fixed connectivity 2.2 Separate ...
- 自动驾驶轨迹预测论文阅读(二)TPNet: Trajectory Proposal Network for Motion Prediction
论文链接:https://openaccess.thecvf.com/content_CVPR_2020/papers/Fang_TPNet_Trajectory_Proposal_Network_f ...
- 论文阅读:3D multi-scale, multi-task, and multi-label deep learning for prediction of lymph node metasta
3D多尺度.多任务.多标签深度学习预测T1肺腺癌CT图像淋巴结转移 Key word: 淋巴结转移预测肺结节征候三维卷积神经网络 Abstract: 术前淋巴结(LN)转移的诊断对于T1肺腺癌患者评估 ...
- [论文阅读]阿里DIN深度兴趣网络之总体解读
[论文阅读]阿里DIN深度兴趣网络之总体解读 文章目录 [论文阅读]阿里DIN深度兴趣网络之总体解读 0x00 摘要 0x01 论文概要 1.1 概括 1.2 文章信息 1.3 核心观点 1.4 名词 ...
- [论文阅读] (07) RAID2020 Cyber Threat Intelligence Modeling Based on Heterogeneous GCN
<娜璋带你读论文>系列主要是督促自己阅读优秀论文及听取学术讲座,并分享给大家,希望您喜欢.由于作者的英文水平和学术能力不高,需要不断提升,所以还请大家批评指正,非常欢迎大家给我留言评论,学 ...
最新文章
- 播客#47:劳伦斯·布拉德福德
- 华为鲲鹏高校行长沙启航,助力基础研究成果转化
- java最最长的错误,Java开发中遇到最多的异常是什么?最后一个最多最难!
- 与reCAPTCHA的Spring集成
- 一文带你彻底搞懂C++中一些常见指针(形如*p)的用法
- 大学计算机教学ppt数制,大学计算机基础 第3讲 数制及其相互转换 国家精品课程课件(可编辑)...
- python子类分配
- duilib WindowImplBase BUG修复 --- 按一次ESC键, 关闭多个窗口
- (三)微调VGG16以对服装进行分类
- 零基础带你学习MySQL—加密函数和系统函数(十六)
- java打印等腰三角形_为什么大家都说Java中只有值传递?
- SpringMVC中的父子容器关系
- C++实现经典同步问题(生产者消费者、读者写者、哲学家进餐、吸烟者问题)
- 数据可视化之使用Matplotlib绘制甘特图
- 用友YonSuite前后端一体化数智赋能,有化妆品的地方就有老中医
- 超级会员创作者收益说明
- AutoJs学习-录制手指动作
- WINZIP压缩文件怎么加密?
- 最适合汽车软件开发的生态系统是什么?
- 微信小程序获取页面元素高度_微信小程序之动态获取元素宽高