推荐给初学LSTM或者懂个大概却不完全懂的人
个人认为下面这篇博文非常适合初学或者学的很浅的朋友。
转自http://www.jianshu.com/p/9dc9f41f0b29
经常接触LSTM,GRU,RNN这些模型,对于LSTM的印象只是知道它用来解决梯度消失梯度爆炸问题,对于长距离的句子的学习效果不好的问题,而且大概知道里面是加了一些参数,加了门单元来选择忘记和记住一些信息。但是具体公式没有推过,所以理解的不够深。
但是上面这篇长博文,作者真心花了很多心血来创作,写的详细,易懂,对于学习lstm有很大的帮助。
读完后我觉得要理解几个门的作用,文中作者提到的三个例子恰到好处。个人认为这三个例子是弄明白lstm的关键。
忘记门:
作用对象:细胞状态
作用:将细胞状态中的信息选择性的遗忘
让我们回到语言模型的例子中来基于已经看到的预测下一个词。在这个问题中,细胞状态可能包含当前主语的类别,因此正确的代词可以被选择出来。当我们看到新的主语,我们希望忘记旧的主语。
例如,他今天有事,所以我。。。当处理到‘’我‘’的时候选择性的忘记前面的’他’,或者说减小这个词对后面词的作用。
输入层门:
作用对象:细胞状态
作用:将新的信息选择性的记录到细胞状态中
在我们语言模型的例子中,我们希望增加新的主语的类别到细胞状态中,来替代旧的需要忘记的主语。
例如:他今天有事,所以我。。。。当处理到‘’我‘’这个词的时候,就会把主语我更新到细胞中去。
输出层门:
作用对象:隐层ht
在语言模型的例子中,因为他就看到了一个 代词,可能需要输出与一个 动词 相关的信息。例如,可能输出是否代词是单数还是负数,这样如果是动词的话,我们也知道动词需要进行的词形变化。
例如:上面的例子,当处理到‘’我‘’这个词的时候,可以预测下一个词,是动词的可能性较大,而且是第一人称。
会把前面的信息保存到隐层中去。
Gated Recurrent Unit (GRU)就是lstm的一个变态,这是由 Cho, et al. (2014) 提出。它将忘记门和输入门合成了一个单一的 更新门。同样还混合了细胞状态和隐藏状态,和其他一些改动。最终的模型比标准的 LSTM 模型要简单,也是非常流行的变体。
以上的观点纯属个人通过学习这篇博文后的一些理解,有错误的地方请大家见谅。
推荐给初学LSTM或者懂个大概却不完全懂的人相关推荐
- 【每周CV论文推荐】初学基于GAN的三维图像生成有哪些经典论文需要阅读
欢迎来到<每周CV论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 当前二维图像生成领域的发展已经非常成熟,但是 ...
- 【每周CV论文推荐】初学视觉注意力机制有哪些值得阅读的论文?
欢迎来到<每周CV论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 注意力机制是当下计算机视觉和自然语言处理中非 ...
- 【每周CV论文推荐】 初学深度学习单张图像三维人脸重建需要读的文章
欢迎来到<每周CV论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 基于图像的人脸三维重建在人脸分析与娱乐领域里 ...
- 【每周CV论文推荐】 初学深度学习人脸属性分析必读的文章
欢迎来到<每周CV论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 人脸属性分析在社交娱乐,人机交互等领域有重要 ...
- 【每周CV论文推荐】 初学活体检测与伪造人脸检测必读的文章
欢迎来到<每周CV论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 活体检测在安防与金融等使用人脸识别技术的领域 ...
- 【每周CV论文推荐】 初学GAN必须要读的文章
欢迎来到<每周CV论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. GAN作为当前最有前途,也最烧钱的方向之一, ...
- 【每周CV论文推荐】 初学深度学习图像分割必须要读的文章
欢迎来到<每周CV论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 图像分割作为计算机视觉的基础任务之一,应用非 ...
- 【每周CV论文推荐】 初学目标检测必须要读的文章
欢迎来到<每周CV论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 目标检测作为计算机视觉的基础任务之一,应用非 ...
- 【每周CV论文推荐】初学模型量化值得阅读的文章
欢迎来到<每周CV论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 模型量化是非常重要的模型压缩方法,在工业界应 ...
- 看懂这篇文章,你就懂了信息安全的密码学
看懂这篇文章-你就懂了信息安全的密码学 一.前言 一个信息系统缺少不了信息安全模块,今天就带着大家全面了解并学习一下信息安全中的密码学知识,本文将会通过案例展示让你了解抽象的密码学知识,阅读本文你 ...
最新文章
- c语言实现图形界面实现四则运算,C语言实现四则运算的生成器
- 使用chrome下载m3u8视频
- mysql是逻辑库吗_mycat是一种比较简单的中间件产品,可以帮助mysql进行分库,同时统一在一个逻辑库。硬件环境:系统:centos 7.6数据库版本:5.7.19mycat:...
- 安装脚本退出,并显示错误:命令“ x86_64-linux-gnu-gcc”失败,退出状态为1
- 【下载!】实时计算正当时!助你轻松get Apache Flink 动向!
- 农村信用社招聘考试计算机,农村信用社招聘考试题:计算机(一)
- POJChallengeRound2 Guideposts 【单位根反演】【快速幂】
- Jwplayer5.10视频拍照(截图)
- js中的preventDefault与stopPropagation详解(转)
- dockerfile 创建Jenkins镜像
- 基于RV1126平台imx291分析 --- 回顾之前的注册
- Python教学视频(七)分支结构
- 卡西欧电子词典EV-SP3900(英汉日版)
- 软件测试背景对渗透测试有用吗,软件测试与渗透测试那个工作有前途
- 小南再谈Vue(QA)
- 互联网公司平均薪资Top8 , 阿里勇夺第一。
- SpringBoot整合Graylog做日志收集
- 读取D3D后备缓冲区的数据
- 传输层协议——UDP和TCP
- MATLAB的图像灰度线性变换
热门文章
- Android 通过Base64上传图片到服务器
- 大众点评运维架构详大揭秘!
- Itext 中的文本信息绝对定位
- OEL修改字符集失败 -bash: /root: is a directory
- C#扩展名关联【转】
- pandas如何保存在excel里面_别找了,这是 Pandas 最详细教程了
- 牛客网SQL练习题(Mysql-8)
- charles 请求出现乱码_基于iOS的Charles抓包实践
- js sdk demo java_微信JS-SDK DEMO页面和示例代码
- 8g内存一般占用多少_手机6G和8G运存有什么不同,8G运存真比6G流畅?这也要考虑处理器...