为什么深度学习需要归一化

一个标准的归一化步骤就是减均值除方差,如下图,就是把数据集中分布的位置从其它地方,移到中心,注意这个数据是可以输入也可以是网络中间的某一层输出
那么我们为什么希望数据集中分布在中央,像正态分布一样呢,我认为,大多数激活函数都是在中央位置曲线更平滑,斜率变动不会过大过小,能解决梯度消失和梯度爆炸问题。

selu和Batch Normalization

BN是批归一化,简单说他就是对数据减均值除方差,这个数据是可以输入也可以是网络中间的某一层输出,这样数据分布更好,得到的结果更好
selu激活函数就是自归一化,selu激活函数通过设置两个特殊的参数α和λ,经过该激活函数后使得样本分布自动归一化到0均值和单位方差

由selu和Batch Normalization谈深度学习的归一化问题相关推荐

  1. 浅谈深度学习:如何计算模型以及中间变量的显存占用大小

    原文链接:https://oldpan.me/archives/how-to-calculate-gpu-memory 前言 亲,显存炸了,你的显卡快冒烟了! torch.FatalError: cu ...

  2. 深度学习-各种归一化(Batch Norm、Layer Norm、Group Norm、InstanceNorm、Spatially-Adaptive Norm)

    深度学习之归一化:BN.LN.GN.IN.SPADE 0.总述 0.1.为什么要归一化处理 0.2.大体上看BN.LN.IN.GN 1.批量归一化(Batch Normalization,BN) 1. ...

  3. 汤晓鸥谈深度学习三大核心要素:算法设计、高性能的计算能力以及大数据

    汤晓鸥谈深度学习三大核心要素:算法设计.高性能的计算能力以及大数据 2017-05-21 15:02:28    深度学习    0 0 0 昨日(5月20日),香港中文大学汤晓鸥教授莅临 2017C ...

  4. 浅谈深度学习:LSTM对股票的收益进行预测(Sequential 序贯模型,Keras实现)

    浅谈深度学习:LSTM对股票的收益进行预测(Sequential 序贯模型,Keras实现) 总包含文章: 一个完整的机器学习模型的流程 浅谈深度学习:了解RNN和构建并预测 浅谈深度学习:基于对LS ...

  5. 浅谈深度学习:了解RNN和构建并预测

    浅谈深度学习:了解RNN和构建并预测 总包含文章: 一个完整的机器学习模型的流程 浅谈深度学习:了解RNN和构建并预测 浅谈深度学习:基于对LSTM项目LSTM Neural Network for ...

  6. 浅谈深度学习:基于对LSTM项目`LSTM Neural Network for Time Series Prediction`的理解与回顾

    浅谈深度学习:基于对LSTM项目LSTM Neural Network for Time Series Prediction的理解与回顾#### 总包含文章: 一个完整的机器学习模型的流程 浅谈深度学 ...

  7. 嵌入式AI —— 6. 为糖葫芦加糖,浅谈深度学习中的数据增广

    没有读过本系列前几期文章的朋友,需要先回顾下已发表的文章: 开篇大吉 集成AI模块到系统中 模型的部署 CMSIS-NN介绍 从穿糖葫芦到织深度神经网络 又和大家见面了,上次本程序猿介绍了CMSIS- ...

  8. 周志华:浅谈深度学习

    我们都知道直接掀起人工智能热潮的最重要的技术之一,就是深度学习技术.今天,其实深度学习已经有各种各样的应用,到处都是它,不管图像也好,视频也好,声音自然语言处理等等.那么我们问一个问题,什么是深度学习 ...

  9. 浅谈深度学习的基础——神经网络算法(科普)

    浅谈深度学习的基础--神经网络算法(科普) 神经网络算法是一门重要的机器学习技术.它是目前最为火热的研究方向--深度学习的基础.学习神经网络不仅可以让你掌握一门强大的机器学习方法,同时也可以更好地帮助 ...

最新文章

  1. properties文件不能输入中文
  2. 一张图片学Python
  3. Bifrost微前端框架及其在美团闪购中的实践
  4. wxpython富文本_去除富文本编辑器中的标签
  5. 【支付宝服务窗】JEECG支付宝服务窗平台指南
  6. Windows Phone 7 Developer Tools amp; Training Kit 正式版发布!
  7. 【报告分享】2020年B站内容营销报告.pdf(附下载链接)
  8. c# DESEncrypt 加密、解密算法
  9. 用计算机sp画笑脸,Microsoft Office Visio绘画圆形笑脸的相关操作步骤
  10. MATLA 2009B 中安装Sedumi
  11. Eslint的严格模式
  12. 化工过程机械类毕业论文文献有哪些?
  13. 摩斯密码解密py脚本
  14. destoon7.0第三方短信插件下载 destoon7.0整合云信通短信平台教程
  15. 软件测试的主要阶段有哪些?
  16. Matlab基于元胞自动机实现NaSch模型
  17. 【转载】成本中心费用分配与分摊的区别
  18. vtk.js怎么直接读取dicom文件
  19. 通过GRUB引导安装Red Flag系统
  20. js 判断一个数是正数、负数、零或其他 正数转变成负数 负数转变成正数

热门文章

  1. 检测到 #include 错误。请更新 includePath。已为此翻译单元(E:\abc.ino)禁用波形曲线。C/C++(1696) 无法打开 源 文件 “stadio.h“
  2. PCL点云处理之点云质心的三种计算方法(七十六)
  3. SAP中国商业同略会发布HANA创业合作计划
  4. Fluke 438-II 电机效率和电气性能综合测试仪
  5. STM32之EXTI
  6. 验证码识别 java 深度学习_使用深度学习识别验证码注解
  7. 基于AT89C52单片机的数字电压表设计
  8. QT学习:字体对话框
  9. 微型计算机接口技术4732,自考微型计算机及接口技术课程考试说明
  10. Android应用开发之FrameLayout(帧布局)