最近实验中需要用到LSTM,记录下我对LSTM的理解。

什么是LSTM?

首先介绍一下标准的RNN,它拥有记忆能力,适合处理序列型的数据,比如语音识别,但它有有以下缺点:

  • 只能记住非常短的序列
  • 难以训练,收敛困难
RNN的结构

LSTM全名“长短期记忆神经网络”,正好解决了RNN的缺点。LSTM会选择性忘记不重要的信息,因此它能记住更长的序列,且它更容易训练

LSTM的结构

LSTM的关键是单元(门)的状态,即贯穿图顶部的水平线。门由sigmoid层、tanh层和乘法运算组成

LSTM原理

LSTM的第一步决定要从单元状态丢弃什么信息,这个决定由“遗忘门”做出,输出值介于0和1,0表示完全忘记,1表示完全记住

遗忘门

第二步决定要在单元状态中存储什么新信息。它有两部分:首先,“输入门”的sigmoid决定更新哪些值,接下来,tanh创建新的候选向量,在下一个步骤中,把两者结合起来对状态更新

输入门

这一步对状态进行更新

最后需要计算输出什么

LSTM的应用

  • one to many:输入不是序列,输出是序列,比如看图写诗
  • many to one:输入是序列,输出不是序列,比如视频分类、步态识别
  • many to many:输入是序列,输出也是序列,比如语音识别、机器翻译

references

Understanding LSTM Networks​colah.github.io「公开课干货分享」LSTM长短期记忆神经网络的学习与实现​www.bilibili.com

lstm不收敛_LSTM学习笔记相关推荐

  1. 深度学习笔记——循环神经网络RNN/LSTM

    原文来自知乎专栏NLP进阶之路,作者韦伟. 以下文章是摘录了原文部分内容的学习笔记,侵删. 循环神经网络(Rerrent Neural Network) RNN是神经网络的一种,RNN对具有序列特性的 ...

  2. tensorflow学习笔记(八):LSTM手写体(MNIST)识别

    文章目录 一.LSTM简介 二.主要函数 三.LSTM手写体(MNIST)识别 1.MNIST数据集简介 2.网络描述 3.项目实战 一.LSTM简介 LSTM是一种特殊的RNN,很好的解决了RNN中 ...

  3. 长短期记忆网络(LSTM)学习笔记

    文章目录 0 前言 1 LSTM与RNN的异同 2 LSTM结构细节 2.1 细胞状态 2.2 遗忘门 2.3 输入门 2.4 输出门 3 总结 4 LSTM的变体 4.1 Adding " ...

  4. 深度学习与智能故障诊断学习笔记(三)——RNN与LSTM推导详解

    1.RNN 1.1网络结构 标准神经网络的输入输出在不同例子中可能有不同的长度,在学习中并不共享从不同位置上学到的特征.因为标准神经网络的训练集是稳定的,即所有的特征域表达的内容是同一性质的,一旦交换 ...

  5. 一文弄懂元学习 (Meta Learing)(附代码实战)《繁凡的深度学习笔记》第 15 章 元学习详解 (上)万字中文综述

    <繁凡的深度学习笔记>第 15 章 元学习详解 (上)万字中文综述(DL笔记整理系列) 3043331995@qq.com https://fanfansann.blog.csdn.net ...

  6. 深度学习笔记:优化方法总结(BGD,SGD,Momentum,AdaGrad,RMSProp,Adam)

    深度学习笔记(一):logistic分类  深度学习笔记(二):简单神经网络,后向传播算法及实现  深度学习笔记(三):激活函数和损失函数  深度学习笔记:优化方法总结  深度学习笔记(四):循环神经 ...

  7. 下载量过百万的吴恩达机器学习和深度学习笔记更新了!(附PDF下载)

    今天,我把吴恩达机器学习和深度学习课程笔记都更新了,并提供下载,这两本笔记非常适合机器学习和深度学习入门.(作者:黄海广) 0.导语 我和同学将吴恩达老师机器学习和深度学习课程笔记做成了打印版,放在g ...

  8. Tensorflow深度学习学习笔记

    Tensorflow学习笔记 一.Tensorflow基础及深度学习原理 1.Tensorflow中网络搭建的三种方法 1.keras.models.Sequential() 2.keras.mode ...

  9. 概率图模型学习笔记:HMM、MEMM、CRF

    作者:Scofield 链接:https://www.zhihu.com/question/35866596/answer/236886066 来源:知乎 著作权归作者所有.商业转载请联系作者获得授权 ...

  10. CV学习笔记 | CV综述 [2020.10.01]

    文章目录 0. 概述(整理完后随时修改) 1. 人工神经网络 1.1. 人工神经网络发展历程 1.2. 一些神经元节点的工作原理 1.2.1. 基本神经元 1.2.2. 卷积神经元(Convoluti ...

最新文章

  1. Spring Boot 2.x基础教程:默认数据源Hikari的配置详解
  2. 这年头,老赖没得混了!大数据式追债,你见过吗?
  3. C++使用linked list(链表)实现circular queue(循环队列)(附完整源码)
  4. 通过添加HTTP Header实现上下文数据在WCF的自动传递
  5. JasperReport学习笔记2-创建简单的报表例子
  6. kafka 削峰_从面试角度一文学完 Kafka
  7. leetcode 363. Max Sum of Rectangle No Larger Than K | 363. 矩形区域不超过 K 的最大数值和(前缀和,图文详解)
  8. POJ 2513 Colored Sticks
  9. 在Windows 7中设置Java开发环境
  10. BZOJ 2733: [HNOI2012]永无乡
  11. C/C++训练项目一:2048
  12. 全心加入web前端开发,向上吧!
  13. 关于Web网页设计规范简述
  14. linux打印机设置密码,linux桌面打印机配置指南 | 高蛋白网
  15. 安卓手机root推荐,导出安卓分区镜像
  16. STM32:使用外部中断控制对射式红外传感器并计次
  17. 网络硬件三剑客的集线器(Hub)、交换机(Switch)与路由器(Router)
  18. 家用无线路由器购买入门指南
  19. [Effective C++ --014]在资源管理类中小心copying行为
  20. 仙剑奇侠传四服务器维护,《仙剑奇侠传四》无法登录怎么办_无法登录解决办法_3DM手游...

热门文章

  1. 【文献阅读】Cost-Sensitive Portfolio Selection via Deep Reinforcement Learning
  2. 团组情景意识概念模型
  3. logo一键制作器源码
  4. jQuery详细教程,基础内容罗列
  5. 如何在html中在线预览pdf文件
  6. 世界十大名言是什么?
  7. 应届生年薪 40w 在杭州可以过上什么样的生活?
  8. 这 IDEA超全个性化设置,实用,属实装逼!
  9. 中西方对时间的差异_中西方时间观差异的跨文化分析
  10. spring boot+thymeleaf+bootstrap 简单实现后台管理系统界面