干货 | 循环神经网络LSTM的数学过程
击上方“小白学视觉”,选择加"星标"或“置顶”
重磅干货,第一时间送达本文转自 | OpenCV学堂
引言
长短时记忆(long short term memory,LSTM)是一种有效的链式循环神经网络(recurrent neural network,R2 NN1),被广泛用于语言模型、机器翻译、语音识别等领域。[1]本文具体就LSTM的具体实现做出推导。
LSTM模型描述
01
因为传统的RNN在间隔不断增大的同时,会丧失学习到连接如此远的信息的能力。这个问题简称长期依赖问题,为了解决这个问题,LSTM通过刻意的设计来避免长期依赖问题。以下就是LSTM的结构图:
展开以后变成:
它与RNN的简单模型不一样的地方在于:
它是由记忆细胞、遗忘门、输入门、输出门组成。记忆细胞负责存储历史信息, 通过一个状态参数来记录和更新历史信息;三个门结构则通过Sigmoid函数决定信息的取舍, 从而作用于记忆细胞。[2]
遗忘门用来选择性忘记多余或次要的记忆
输入门决定我们需要更新什么值
输出门决定细胞状态的哪个部分输出出去
模型抽象和数学符号的说明
02
为了方便数学原理的推导,这里我们用下面的简略图代替:
前向传播算法
03
前向传播总体上就是对三个门进行计算,然后通过这三个门决定当前细胞的隐藏状态,更新当前记忆和过去的记忆,最终再计算出输出值传入下一次前向网络中:因为三个门的情况不仅取决于输入向量Xt,还取决于ht-1
反向传播算法
04
下载1:OpenCV-Contrib扩展模块中文版教程
在「小白学视觉」公众号后台回复:扩展模块中文教程,即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。
下载2:Python视觉实战项目52讲
在「小白学视觉」公众号后台回复:Python视觉实战项目,即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。
下载3:OpenCV实战项目20讲
在「小白学视觉」公众号后台回复:OpenCV实战项目20讲,即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。
交流群
欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~
干货 | 循环神经网络LSTM的数学过程相关推荐
- 循环神经网络LSTM RNN回归:sin曲线预测
摘要:本篇文章将分享循环神经网络LSTM RNN如何实现回归预测. 本文分享自华为云社区<[Python人工智能] 十四.循环神经网络LSTM RNN回归案例之sin曲线预测 丨[百变AI秀]& ...
- 深度学习中的循环神经网络LSTM详解
(一).什么是循环神经网络LSTM? LSTM指的是长短期记忆网络(Long Short Term Memory),它是循环神经网络中最知名和成功的扩展.由于循环神经网络有梯度消失和梯度爆炸的问题,学 ...
- Python实现PSO粒子群优化循环神经网络LSTM分类模型项目实战
说明:这是一个机器学习实战项目(附带数据+代码+文档+视频讲解),如需数据+代码+文档+视频讲解可以直接到文章最后获取. 1.项目背景 PSO是粒子群优化算法(Particle Swarm Optim ...
- 循环神经网络LSTM实现电影情感分类
循环神经网络LSTM实现电影情感分类 一.数据集: 为了对word embedding这种常用的文本向量化的方法进行巩固,这里我们会完成一个文本情感分类的案例 现在我们有一个经典的数据集IMDB数据集 ...
- 基于RNN循环神经网络lstm的藏头诗制作
基于RNN循环神经网络lstm的藏头诗制作 简单介绍 在一次偶然中接触到藏头诗,觉得十分有意思.但是好像都是利用古代本就有的诗句重新组合而成.比如输入清风袭来,结果如下图所示. 之后想到不如利用深度学 ...
- Pytorch:循环神经网络-LSTM
Pytorch: 循环神经网络:LSTM进行新闻分类 Copyright: Jingmin Wei, Pattern Recognition and Intelligent System, Schoo ...
- 循环神经网络-LSTM进阶
基础的LSTM模型,单隐层,隐层单神经元,而实际中一般需要更为复杂的网络结构, 下面借用手写数字的经典案例构造比较复杂的LSTM模型,并用代码实现. 单隐层,隐层多神经元 # -*- coding:u ...
- (神经网络深度学习)--循环神经网络LSTM
一.什么是LSTM: 如果你经过上面的文章看懂了RNN的内部原理,那么LSTM对你来说就很简单了,首先大概介绍一下LSTM,是四个单词的缩写,Long short-term memory,翻译过来就是 ...
- 循环神经网络LSTM论文解读
版权声明:本文为CSDN博主「了不起的赵队」的原创文章,遵循CC 4.0 by-sa版权协议,转载请附上原文出处链接及本声明. 原文链接:https://blog.csdn.net/zhaojc199 ...
最新文章
- 如何使用 CODING 实践 DevOps 全流程
- Ember.js 入门指南——定义模型
- VTK:可视化算法之CutWithScalars
- npm 引用子项目模块_Java / Web项目中的NPM模块Browser-Sync
- 树莓派python编程读取电压_《树莓派Python编程指南》——3.2 在结构体中存储值-阿里云开发者社区...
- python gps与高德地图poi_Python——使用高德API获取指定城指定类别POI并实现XLSX文件合并...
- 《FPGA全程进阶---实战演练》第十一章 VGA五彩缤纷
- Atitit uke plnsy安全隐私保护法案 目录 第一章 一般规定	2 第1节 主题与目标	2 第二章 常见安全原则	3 第1节 隔离 保密 shell	3 第2节 隐藏 保密 不出头	3
- oc渲染器实时预览用的是编辑器细分,不是渲染器细分。
- ubuntu20.10设置桌面共享的三种方式
- 大学计算机Excel考试内容,大学计算机考试—Excel(操作题供参考,不附练习文件)...
- 华为ensp OSPF单区域配置
- ad中按钮开关的符号_SAST Weekly | Word中的公式语法
- grafana mysql 变量_grafana之Variables变量的使用
- nginx 配置为play!的前端http服务器
- 苹果手机怎么用计算机隐藏应用,iphone怎么隐藏应用功能 iphone隐藏应用功能方法【详解】...
- Java后端利用腾讯云短信服务发短信
- Shell语言-16-Shell脚本调试 -n -v -x -c
- vissim跟驰模型_vissim简介
- jquery数字动画插件jquery.animateNumber.js
热门文章
- 开源!mathAI手写拍照自动能解高数题,还不快试试?
- 一文看尽目标检测:从YOLO v1到v3的进化之路
- “GAN之父”:当初为了深度学习买GPU,现在后悔没多挖点比特币
- 盘点深度学习一年来在文本、语音和视觉等方向的进展,看强化学习如何无往而不利
- 疯狂上涨的 Python,开发者应从 2.x 还是 3.x 着手?
- 图解 i++ 和 ++i 的区别,看完不懂你顺着网线来揍我!
- Hbase 和 MySQL 的区别是什么?一文深度对比!
- 读 MySQL 源码再看 INSERT 加锁流程
- Spring Boot 中实现跨域的 5 种方式,你一定要知道!
- 常用 Linux 发行版操作系统大盘点!