点击上方“小白学视觉”,选择加"星标"或“置顶

重磅干货,第一时间送达

1 什么是LSTM

LSTM全名是Long Short-Term Memory,长短时记忆网络,可以用来处理时序数据,在自然语言处理和语音识别等领域应用广泛。和原始的循环神经网络RNN相比,LSTM解决了RNN的梯度消失问题,可以处理长序列数据,成为当前最流行的RNN变体。

2 LSTM应用举例

假设我们的模型的输入是依次输入一句话的每个单词,我们需要对单词做分类,比如有两句话:(1)arrive Beijing on November 2nd,这里的Beijing是目的地;(2)leave Beijing on November 2nd,这里的Beijing是出发地。如果用普通的神经网络,输入是'Beijing',那么输出一定就是确定的,但事实上我们希望在'Beijing'前面是'arrive'时,'Beijing'被识别为目的地,在'Beijing'前面时'leave'时,'Beijing'被识别为出发地。这里LSTM就会派上用场,因为LSTM可以记住历史信息,在读到'Beijing'时,LSTM还知道在前面是'arrive'还是'leave',根据历史信息来做出不同的判断,即使输入是相同的,输出也会不同。

3 LSTM结构剖析

普通的神经元是一个输入,一个输出,如图所示:

对于神经元h1来讲,输入就是x1,输出就是y1,LSTM做的就是把普通的神经元,替换成LSTM的单元。

从图中可以看到LSTM有四个输入,分别是input(模型输入),forget gate(遗忘门),input gate(输入门),以及output gate(输出门)。因此相比普通的神经网络,LSTM的参数量是它们的4倍。这3个门信号都是处于0~1之间的实数,1代表完全打开,0代表关闭。遗忘门:决定了前一时刻中memory中的是否会被记住,当遗忘门打开时,前一刻的记忆会被保留,当遗忘门关闭时,前一刻的记忆就会被清空。输入门:决定当前的输入有多少被保留下来,因为在序列输入中,并不是每个时刻的输入的信息都是同等重要的,当输入完全没有用时,输入门关闭,也就是此时刻的输入信息被丢弃了。输出门:决定当前memroy的信息有多少会被立即输出,输出门打开时,会被全部输出,当输出门关闭时,当前memory中的信息不会被输出。

4 LSTM公式推导

有了上面的知识,再来推导LSTM的公式就很简单了,图中代表遗忘门,代表输入门,代表输出门。C是memroy cell,存储记忆信息。代表上一时刻的记忆信息,代表当前时刻的记忆信息,h是LSTM单元的输出,是前一刻的输出。

遗忘门计算:

这里的是把两个向量拼接起来的意思,用sigmoid函数主要原因是得到有个0~1之间的数,作为遗忘门的控制信号。

输入门计算:

当前输入:

当前时刻的记忆信息的更新:

从这个公式可以看出,前一刻的记忆信息通过遗忘门,当前时刻的输入通过输入门,加起来更新当前的记忆信息

输入门计算:

LSTM的输出,是由输出门和当前记忆信息共同决定的:

这样我们就明白了LSTM的前向计算过程。有了LSTM前向传播算法,推导反向传播算法就很容易了, 通过梯度下降法迭代更新我们所有的参数,关键点在于计算所有参数基于损失函数的偏导数,这里就不细讲了。

小结

LSTM虽然结构复杂,但是只要理顺了里面的各个部分和之间的关系,是不难掌握的。在实际使用中,可以借助算法库如Keras,PyTorch等来搞定,但是仍然需要理解LSTM的模型结构。

参考文献

  1. https://www.youtube.com/watch?v=rTqmWlnwz_0&index=35&list=PLJV_el3uVTsPy9oCRY30oBPNLCo89yu49

  2. https://zybuluo.com/hanbingtao/note/581764

  3. http://www.cnblogs.com/pinard/p/6519110.html

  4. http://blog.echen.me/2017/05/30/exploring-lstms/

下载1:OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复:扩展模块中文教程即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2:Python视觉实战项目52讲

在「小白学视觉」公众号后台回复:Python视觉实战项目即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。

下载3:OpenCV实战项目20讲

在「小白学视觉」公众号后台回复:OpenCV实战项目20讲即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。

交流群

欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~

一步步教你理解LSTM相关推荐

  1. 机器学习:一步步教你理解反向传播方法

    机器学习:一步步教你理解反向传播方法 时间 2016-09-13 00:35:59  Yong Yuan's blog 原文  http://yongyuan.name/blog/back-propa ...

  2. python lock_python lock一步步教你理解Python装饰器

    请仔细看我们的decorator实例.我们定义了一个接受单个参数some_func的名为outer的函数.在outer内部我们定义了一个名为inner的嵌套函数.inner函数打印一个字符串然后调用s ...

  3. 从One-hot, Word embedding到Transformer,一步步教你理解Bert

    zenRRan前言: 没进交流群的小伙伴注意啦!扫描下面群二维码和我的个人二维码即可! 群二维码 我的二维码 作者 | 张贵发 转载自AINLP 文章目录 NLP Word Embedding RNN ...

  4. 从RNN一步步通俗易懂T理解LSTM

    https://blog.csdn.net/v_JULY_v/article/details/89894058?depth_1-utm_source=distribute.pc_relevant.no ...

  5. 一步步教你轻松学朴素贝叶斯模型算法理论篇1

    一步步教你轻松学朴素贝叶斯模型理论篇1 (白宁超2018年9月3日17:51:32) 导读:朴素贝叶斯模型是机器学习常用的模型算法之一,其在文本分类方面简单易行,且取得不错的分类效果.所以很受欢迎,对 ...

  6. [翻译]一步步教你配置SQL SERVER合并复制(五)配置Publisher(上)

    上一篇:一步步教你配置 SQL SERVER合并复制(四)设置Distributor的安全 (译者注:本篇内容较多也是合并复制最重要的一个环节之一,因此配置Publisher将分成两个章节来翻译)   ...

  7. 一步步教你轻松学K-means聚类算法

    一步步教你轻松学K-means聚类算法 (白宁超   2018年9月13日09:10:33) 导读:k-均值算法(英文:k-means clustering),属于比较常用的算法之一,文本首先介绍聚类 ...

  8. 一步步教你轻松学关联规则Apriori算法

    一步步教你轻松学关联规则Apriori算法 (白宁超 2018年10月22日09:51:05) 摘要:先验算法(Apriori Algorithm)是关联规则学习的经典算法之一,常常应用在商业等诸多领 ...

  9. 一步步教你轻松学KNN模型算法

    一步步教你轻松学KNN模型算法 ( 白宁超 2018年7月24日08:52:16 ) 导读:机器学习算法中KNN属于比较简单的典型算法,既可以做聚类又可以做分类使用.本文通过一个模拟的实际案例进行讲解 ...

最新文章

  1. Windows 10 全新开始屏幕曝光
  2. 32位oracle和64位的区别,区分你的oracle是64位还是32位
  3. Mysql基本用法-01
  4. 210 - Concurrency Simulator
  5. 四大跨平台的APP分析
  6. Go 切片使用绕坑指南
  7. 非参数统计单样本非参数检验之Kolmogorov-Smirnov检验
  8. 【关于USB转485串口的一点认识/疑问】
  9. java.lang.NoSuchMethodError: org.jaxen.dom4j.DocumentNavigator.getInstance()【可能的解决办法】
  10. Java 后台验证码汉字拼音校验
  11. oracle蓝屏解决方法,win10系统蓝屏怎么办 蓝屏代码0x000007e的3种解决方法
  12. PHP 梯形图,初学者必掌握plc梯形图解释
  13. 深入理解Eureka自我保护机制
  14. html base64在线解码,HTML5原生支持Base64编码解码
  15. ARM LDR汇编指令
  16. Lenovo T460 Fn功能键切换
  17. CPU-流水线的数据相关问题
  18. 第一次有人把 5G 讲的这么简单明了
  19. 电商项目超详细测试点整理(一)
  20. android aoa 串口,51单片机安卓AOA协议和Android设备USB通讯实例

热门文章

  1. 分类、检测、分割任务均有SOTA表现,ACNet有多强?
  2. 15分钟带你入门sklearn与机器学习——分类算法篇
  3. 程序员如何避免“滴滴式裁员”悲剧?
  4. 公开课报名 | 基于自定义模板的OCR结果的结构化处理技术
  5. TensorFlow1.8.0正式发布,Bug修复和改进内容都在这里了
  6. 面霸:Redis 为什么这么快?
  7. 百度最近开源了分布式配置中心,名叫BRCC
  8. start.aliyun.com 正式上线!极速构建 Spring Cloud 应用
  9. 徒手撸一个简单的IOC
  10. Spring AOP 增强框架 Nepxion Matrix 详解