一:梯度消失
在深层网络中,一方面由于求导法则,计算越前面层次或者时刻的梯度,会出现很多的乘法运算,很容易导致梯度消失和梯度爆炸,另一方面还受到激活函数的影响,Sigmoid函数和tanh函数会出现梯度为0 的区域,前面也说了,BP网络中,使用skip connection可以解决梯度消失,典型的就是ResNet。在RNN中LSTM, GRU就是解决思路。

其实我感觉他们的思路有异曲同工之妙,都是将先前的层次/序列的输出通过某种方式可以输入到某一层次需要用到的时候。求导的过程中,偏导数不至于为0,或者说降低了为0的概率,解决该问题。

二:梯度爆炸
那出现了梯度爆炸怎么玩呢?出现梯度爆炸的时候,参数值可能变得异常巨大,可能是NaN,这时候甚至都能计算溢出,这个时候我们需要进行干预了,用到技巧就叫做 Grident Clipping。

过程如下:设置一个梯度的阈值,一旦发现计算后的梯度大于该阈值,立马进行干预,也不难,就是多个判断的过程。

1) 先设置一个梯度的阈值,也就是最大值,不能大于这个值
2) 反向传播中比较阈值和梯度的大小
3) 如果地图大于这个阈值,立马对地图进行缩放处理,让他不能大于这个阈值。
伪代码如下截图:

深度学习 《梯度消失和梯度爆炸》相关推荐

  1. 深度学习之自编码器(4)变分自编码器

    深度学习之自编码器(4)变分自编码器 1. VAE原理  基本的自编码器本质上是学习输入 x\boldsymbol xx和隐藏变量 z\boldsymbol zz之间映射关系,它是一个 判别模型(Di ...

  2. 深度学习之自编码器(5)VAE图片生成实战

    深度学习之自编码器(5)VAE图片生成实战 1. VAE模型 2. Reparameterization技巧 3. 网络训练 4. 图片生成 VAE图片生成实战完整代码  本节我们基于VAE模型实战F ...

  3. 深度学习之自编码器AutoEncoder

    深度学习之自编码器AutoEncoder 原文:http://blog.csdn.net/marsjhao/article/details/73480859 一.什么是自编码器(Autoencoder ...

  4. 深度学习之自编码器(3)自编码器变种

    深度学习之自编码器(3)自编码器变种 1. Denoising Auto-Encoder 2. Dropout Auto-Encoder 3. Adversarial Auto-Encoder  一般 ...

  5. 深度学习之自编码器(2)Fashion MNIST图片重建实战

    深度学习之自编码器(2)Fashion MNIST图片重建实战 1. Fashion MNIST数据集 2. 编码器 3. 解码器 4. 自编码器 5. 网络训练 6. 图片重建 完整代码  自编码器 ...

  6. 深度学习之自编码器(1)自编码器原理

    深度学习之自编码器(1)自编码器原理 自编码器原理  前面我们介绍了在给出样本及其标签的情况下,神经网络如何学习的算法,这类算法需要学习的是在给定样本 x\boldsymbol xx下的条件概率 P( ...

  7. 【深度学习】 自编码器(AutoEncoder)

    目录 RDAE稳健深度自编码 自编码器(Auto-Encoder) DAE 深度自编码器 RDAE稳健深度自编码 自编码器(Auto-Encoder) AE算法的原理 Auto-Encoder,中文称 ...

  8. 深入理解深度学习——Transformer:编码器(Encoder)部分

    分类目录:<深入理解深度学习>总目录 相关文章: ·注意力机制(AttentionMechanism):基础知识 ·注意力机制(AttentionMechanism):注意力汇聚与Nada ...

  9. 深度学习之自编码器实现——实现图像去噪

    大家好,我是带我去滑雪! 自编码器是一种无监督学习的神经网络,是一种数据压缩算法,主要用于数据降维和特征提取.它的基本思想是将输入数据经过一个编码器映射到隐藏层,再通过一个解码器映射到输出层,使得输出 ...

  10. 深度学习:自编码器、深度信念网络和深度玻尔兹曼机

    最近自己会把自己个人博客中的文章陆陆续续的复制到CSDN上来,欢迎大家关注我的 个人博客,以及我的github. 本文主要讲解有关自编码器.深度信念网络和深度玻尔兹曼机的相关知识. 一.自编码器 1. ...

最新文章

  1. python计算无穷级数求和常用公式_无穷级数-从入门到火葬
  2. Css2.0+Css3.0+jQuery手册 chm
  3. UidGenerator
  4. android sdk 更新用的HOSTS
  5. 剑桥管理学老哥的研究生申请和人生道路规划观念
  6. android交互功能,Android 用户界面交互---拖放(OnDragListener)
  7. ndows10同时打印多份文档,Windows10如何同时重命名多个文件
  8. python读取xlsx_Python读取xlsx文件的实现方法
  9. 【聚类】- 聚类实现的数据结构抽象
  10. mybatis-generator插件使用 批量插入、更新
  11. 软件测试计划包括哪些内容,测试计划如何编写。分享测试计划模板
  12. Github Star 7.2K,来自百度飞桨超级好用的OCR数据合成与半自动标注工具,强烈推荐!
  13. PHP中使用imagick生成PSD文件缩略图
  14. 基于asp.net725原创(古代)文学交流网站系统
  15. 大数据的兴起,数据科学家的崛起
  16. 使用python批量下载ensembl数据库指定类型的文件
  17. YOLO v4 糅合方法记录
  18. Elastic:运用 Elastic Maps 实时跟踪,可视化资产分布及地理围栏告警(二)
  19. 2021澳洲大学计算机专业排名,澳洲纽卡斯尔大学UoN计算机科学Computer Science专业排名第201-250位(2021年THE世界大学商科排名)...
  20. 数学建模方法总结(matlab)

热门文章

  1. UILabel 的属性设置
  2. android post、get请求数据
  3. C下的全局变量和指针 - C/C++ / C语言
  4. 读书笔记:《一生的计划》
  5. 【ASP.NET】基础补习之验证控件
  6. 微服务教程--什么是 Nacos
  7. Docker安装Redis(docker-compose.yml)
  8. IDEA 设置自动导入包,以及手动导入包
  9. Spring Boot 面试问题
  10. 使用adduser命令在Debian Linux中创建用户