引入

先前研究过的LSTM结构是一个线性链。然而,自然语言有将单词自然地组合成短语的句法特性。


图中非叶子结点也有输入,应该是Dependency parsing Tree

Dependency parsing 和 Constituency parsing

输入句子: “We saw the yellow dog”

Constituency parsing

Dependency parsing

标准LSTM


详见https://blog.csdn.net/ltochange/article/details/118942985

树形lstm

论文提出两个树形结构的lstm:

  1. the Child-Sum Tree-LSTM
  2. the N-ary Tree-LSTM

相比标准的lstm,树形lstm包含多个孩子结点的隐藏状态h和记忆单元c,以二叉树为例:

the Child-Sum Tree-LSTM


相比于标准LSTM,这里首先将多个孩子结点的隐层状态求和;在更新记忆单元时,使用多个遗忘门控制孩子结点信息的保留。

因为这里将孩子结点的隐层状态求和,而忽略了孩子结点之间的顺序,因此适合孩子结点无序的树结构 或者 分支因子高的树结构(相对于the N-ary Tree-LSTM结构来说的,该结构复杂度更高,不适合用于分支因子高的)

例如,可用于 Dependency Tree 依存句法树,称为 Dependency Tree-LSTM

the N-ary Tree-LSTM

对于每个孩子结点的隐层输出,都有各自对应的参数。除此以外,由公式10可知,该结构还会考虑不同孩子之间的关系。

该结构可用于Constituency Tree 选区树,因为Constituency Tree的孩子结点存在先后顺序, 称为 Constituency Tree-LSTMs

实验

两个任务

(1)句子情感分类:五分类和二分类

使用了短语级别的情感标签,如果训练集中存在的话,也会计算loss


m是所有带标签的结点的数量

(2)句子对的语义相关度评分

通过预测评分来得到预测评级

根据标签y构建实际概率分布:


1≤i≤K1\leq i \leq K1≤i≤K

使用KL散度(衡量两个分布之间差异),计算损失函数:

m是训练句子对

结果

情感分类

句子对相关度评分

Improved Semantic Representations From Tree-Structured Long Short-Term Memory Networks相关推荐

  1. Classifying Relations via Long Short Term Memory Networks along Shortest Dependency Paths

    Classifying Relations via Long Short Term Memory Networks along Shortest Dependency Paths 概述 论文提出了一种 ...

  2. Long Short Term Memory networks(LSTMs)

    背景:在我之前的一篇博客中说了一下对RNN的理解,RNN对于长句子表示的不是很好,超过六七层的网络之后就很难获得之前内容的信息了,目前的框架是基于梯度的,多层网络很容易出现梯度弥散的情况.但是对于NL ...

  3. 理解LSTMs (Long Short Term Memory Networks)

    Understanding LSTMs Model 本文主要参考了大神 Christopher Olah,关于LSTMs论述的博客(Ref[1]),同时加入了自己的理解,最终得以形成了这篇博文. 在读 ...

  4. 有哪些LSTM(Long Short Term Memory)和RNN(Recurrent)网络的教程?

    知乎用户,阿里巴巴数据应用部门长期招聘「算法,分- 500 人赞同 刚好毕设相关,论文写完顺手就答了 先给出一个最快的了解+上手的教程: 直接看theano官网的LSTM教程+代码:LSTM Netw ...

  5. 详细讲解RNN+LSTM+Tree_LSTM(Tree-Long Short Term Memory)基于树状长短期记忆网络

    14天阅读挑战赛 详细讲解RNN+LSTM+Tree_LSTM(Tree-Long Short Term Memory)基于树状长短期记忆网络 一.RNN 要讲解Tree_LSTM,这必须得从RNN开 ...

  6. 递归神经网络变形之 (Long Short Term Memory,LSTM)

    1.长短期记忆网络LSTM简介 在RNN 计算中,讲到对于传统RNN水平方向进行长时刻序列依赖时可能会出现梯度消失或者梯度爆炸的问题.LSTM 特别适合解决这种需要长时间依赖的问题. LSTM(Lon ...

  7. Stanford NLP 第六课: Long Short Term Memory

    RNN存在着梯度消失的问题, 难以学习长期的依赖关系.如何解决RNN的梯度消失问题? Long  Short Term Memory (LSTM) 就是解决这个问题的. 上图是LSTM的一个整体结构. ...

  8. 简单聊聊Long Short Term Memory Network (LSTM)和 Gated Recurrent Unit (GRU)两种强大的RNN变体

    上一篇关于RNN的文章最后,我们提到过由于梯度消失和梯度爆炸问题,使得RNN很难处理长距离的依赖.本文我们介绍两种改进后的RNN:LSTM(Long Short Term Memory Network ...

  9. LSTM(long short term memory)长短期记忆网络

    bags of word(WOE) 它的基本思想是假定对于一个文本,忽略其词序和语法.句法,仅仅将其看做是一些词汇的集合,而文本中的每个词汇都是独立的 循环神经网络(recurrent neural ...

最新文章

  1. 我常用的delphi 第三方控件
  2. Data Binding Library数据绑定框架
  3. java抽象和接口的理解_Java接口实现与抽象类的区别理解 | 彬菌
  4. Php 魔术函数性能,php常用的魔术函数详细解析
  5. php jpg转换为pdf文件,php使用ImageMagick将PDF文件转换为JPG文件的方法_PHP
  6. 详述 IntelliJ IDEA 插件的安装及使用方法
  7. js rem 单位适配(手机、平板、PC)?
  8. Java StreamTokenizer quoteChar()方法与示例
  9. python分形几何_Python教程之绘制Mandelbrot集合
  10. 怎么样用计算机才能让电量增多,高手分享:教你如何让电脑延长2倍使用率
  11. 万份销量,五星好评!这门Python神作刷爆朋友圈!
  12. AWS codecommit 的学习记录
  13. Android ViewPager实现3D画廊效果
  14. Material Design-Surface平面第二篇
  15. 看我如何快速拿下整个C段主机权限
  16. 推荐系统实践(八)UCG 利用ltf-idf方法
  17. python编程:从入门到实践(持续更新)
  18. 宣布全面开源,微众银行正下一盘区块链商业的大棋
  19. python while true循环卡住不动_python – While循环导致整个程序在Tkinter中崩溃
  20. 问题诊断:为什么点击淘宝评价详情无法显示内容?

热门文章

  1. 定时器 setTimeout setInterval
  2. skywalking前端_skywalking实现分布式系统链路追踪
  3. 最大值_期末C语言特辑 计算一维数组中最大值
  4. python widget_python 图形界面
  5. android获取wifi别名,android-连接WIFI时获取SSID
  6. 信息化工程监理规范_房建工程监理资料管理存在的问题及应对措施
  7. java 输入输出流知识_Java知识点总结(JavaIO-字节流)
  8. Python多线程编程---(1)threading 模块 Thread 类
  9. kali远程登录window_手把手教你配置VS Code远程开发工具,工作效率提升N倍
  10. 数学建模亚太赛优秀论文_泰迪杯数据分析职业技术大赛总结暨亚太地区大学生数学建模经验分享会...