个人认为下面这篇博文非常适合初学或者学的很浅的朋友。 
转自http://www.jianshu.com/p/9dc9f41f0b29

经常接触LSTM,GRU,RNN这些模型,对于LSTM的印象只是知道它用来解决梯度消失梯度爆炸问题,对于长距离的句子的学习效果不好的问题,而且大概知道里面是加了一些参数,加了门单元来选择忘记和记住一些信息。但是具体公式没有推过,所以理解的不够深。

但是上面这篇长博文,作者真心花了很多心血来创作,写的详细,易懂,对于学习lstm有很大的帮助。

读完后我觉得要理解几个门的作用,文中作者提到的三个例子恰到好处。个人认为这三个例子是弄明白lstm的关键。

忘记门: 
作用对象:细胞状态 
作用:将细胞状态中的信息选择性的遗忘 
让我们回到语言模型的例子中来基于已经看到的预测下一个词。在这个问题中,细胞状态可能包含当前主语的类别,因此正确的代词可以被选择出来。当我们看到新的主语,我们希望忘记旧的主语。 
例如,他今天有事,所以我。。。当处理到‘’我‘’的时候选择性的忘记前面的’他’,或者说减小这个词对后面词的作用。

输入层门: 
作用对象:细胞状态 
作用:将新的信息选择性的记录到细胞状态中 
在我们语言模型的例子中,我们希望增加新的主语的类别到细胞状态中,来替代旧的需要忘记的主语。 
例如:他今天有事,所以我。。。。当处理到‘’我‘’这个词的时候,就会把主语我更新到细胞中去。

输出层门: 
作用对象:隐层ht 
在语言模型的例子中,因为他就看到了一个 代词,可能需要输出与一个 动词 相关的信息。例如,可能输出是否代词是单数还是负数,这样如果是动词的话,我们也知道动词需要进行的词形变化。 
例如:上面的例子,当处理到‘’我‘’这个词的时候,可以预测下一个词,是动词的可能性较大,而且是第一人称。 
会把前面的信息保存到隐层中去。

Gated Recurrent Unit (GRU)就是lstm的一个变态,这是由 Cho, et al. (2014) 提出。它将忘记门和输入门合成了一个单一的 更新门。同样还混合了细胞状态和隐藏状态,和其他一些改动。最终的模型比标准的 LSTM 模型要简单,也是非常流行的变体。

以上的观点纯属个人通过学习这篇博文后的一些理解,有错误的地方请大家见谅。

推荐给初学LSTM或者懂个大概却不完全懂的人相关推荐

  1. 【每周CV论文推荐】初学基于GAN的三维图像生成有哪些经典论文需要阅读

    欢迎来到<每周CV论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 当前二维图像生成领域的发展已经非常成熟,但是 ...

  2. 【每周CV论文推荐】初学视觉注意力机制有哪些值得阅读的论文?

    欢迎来到<每周CV论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 注意力机制是当下计算机视觉和自然语言处理中非 ...

  3. 【每周CV论文推荐】 初学深度学习单张图像三维人脸重建需要读的文章

    欢迎来到<每周CV论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 基于图像的人脸三维重建在人脸分析与娱乐领域里 ...

  4. 【每周CV论文推荐】 初学深度学习人脸属性分析必读的文章

    欢迎来到<每周CV论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 人脸属性分析在社交娱乐,人机交互等领域有重要 ...

  5. 【每周CV论文推荐】 初学活体检测与伪造人脸检测必读的文章

    欢迎来到<每周CV论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 活体检测在安防与金融等使用人脸识别技术的领域 ...

  6. 【每周CV论文推荐】 初学GAN必须要读的文章

    欢迎来到<每周CV论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. GAN作为当前最有前途,也最烧钱的方向之一, ...

  7. 【每周CV论文推荐】 初学深度学习图像分割必须要读的文章

    欢迎来到<每周CV论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 图像分割作为计算机视觉的基础任务之一,应用非 ...

  8. 【每周CV论文推荐】 初学目标检测必须要读的文章

    欢迎来到<每周CV论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 目标检测作为计算机视觉的基础任务之一,应用非 ...

  9. 【每周CV论文推荐】初学模型量化值得阅读的文章

    欢迎来到<每周CV论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 模型量化是非常重要的模型压缩方法,在工业界应 ...

  10. 看懂这篇文章,你就懂了信息安全的密码学

    看懂这篇文章-你就懂了信息安全的密码学 一.前言 ​ 一个信息系统缺少不了信息安全模块,今天就带着大家全面了解并学习一下信息安全中的密码学知识,本文将会通过案例展示让你了解抽象的密码学知识,阅读本文你 ...

最新文章

  1. c语言实现图形界面实现四则运算,C语言实现四则运算的生成器
  2. 使用chrome下载m3u8视频
  3. mysql是逻辑库吗_mycat是一种比较简单的中间件产品,可以帮助mysql进行分库,同时统一在一个逻辑库。硬件环境:系统:centos 7.6数据库版本:5.7.19mycat:...
  4. 安装脚本退出,并显示错误:命令“ x86_64-linux-gnu-gcc”失败,退出状态为1
  5. 【下载!】实时计算正当时!助你轻松get Apache Flink 动向!
  6. 农村信用社招聘考试计算机,农村信用社招聘考试题:计算机(一)
  7. POJChallengeRound2 Guideposts 【单位根反演】【快速幂】
  8. Jwplayer5.10视频拍照(截图)
  9. js中的preventDefault与stopPropagation详解(转)
  10. dockerfile 创建Jenkins镜像
  11. 基于RV1126平台imx291分析 --- 回顾之前的注册
  12. Python教学视频(七)分支结构
  13. 卡西欧电子词典EV-SP3900(英汉日版)
  14. 软件测试背景对渗透测试有用吗,软件测试与渗透测试那个工作有前途
  15. 小南再谈Vue(QA)
  16. 互联网公司平均薪资Top8 , 阿里勇夺第一。
  17. SpringBoot整合Graylog做日志收集
  18. 读取D3D后备缓冲区的数据
  19. 传输层协议——UDP和TCP
  20. MATLAB的图像灰度线性变换

热门文章

  1. Android 通过Base64上传图片到服务器
  2. 大众点评运维架构详大揭秘!
  3. Itext 中的文本信息绝对定位
  4. OEL修改字符集失败 -bash: /root: is a directory
  5. C#扩展名关联【转】
  6. pandas如何保存在excel里面_别找了,这是 Pandas 最详细教程了
  7. 牛客网SQL练习题(Mysql-8)
  8. charles 请求出现乱码_基于iOS的Charles抓包实践
  9. js sdk demo java_微信JS-SDK DEMO页面和示例代码
  10. 8g内存一般占用多少_手机6G和8G运存有什么不同,8G运存真比6G流畅?这也要考虑处理器...