Batch Norm

source from: Deep Learning Specialization

效果

  • normalize inputs to speed up learning
  • mean/variance computed on just that mini-batch similar to dropout, it adds some noise to each hidden layer’s activations. Thus, this has a slight regularization effect

过程

块正则化过程:

Before:z(1)、z(2)、...、z(m)μ=1m∑iz(i)σ2=1m∑i(z(i)−μ)2After:z(i)norm=z(i)−μσ2+ϵ−−−−−√(ϵ是为了保证数值稳定性)z^(i)=αz(i)norm+β

Before:z^{(1)}、z^{(2)}、...、z^{(m)}\\ \mu={1\over m}\sum_iz^{(i)}\\ \sigma^2={1\over m}\sum_i{(z^{(i)}-\mu)}^2\\ After:z_{norm}^{(i)}={{z^{(i)}-\mu}\over {\sqrt{\sigma^2+\epsilon}}}\\ (\epsilon是为了保证数值稳定性)\\ \hat z^{(i)}=\alpha z_{norm}^{(i)}+\beta
α \alpha和 β \beta作为学习参数

由此原先

z[l]=w[l]a[l−1]+b[l]

z^{[l]}=w^{[l]}a^{[l-1]}+b^{[l]}
中的 b[l] b^{[l]}没有了任何作用

测试中的Batch Norm

由于测试中只能使用一个样本,因此Batch Norm中的mean/variance不再有实际意义。
测试中使用的mean/variance是训练中多个mini-batch的指数加权平均。

Batch Norm相关推荐

  1. dropout,batch norm 区别 顺序

    20210614 https://www.cnblogs.com/hutao722/p/9946047.html 深度学习基础系列(九)| Dropout VS Batch Normalization ...

  2. 吴恩达深度学习(53)-Batch Norm 为什么奏效?

    https://www.toutiao.com/a6640433472697532942/ 2019-01-04 07:35:33 Batch Norm 为什么奏效?(Why does Batch N ...

  3. Batch Norm、Layer Norm、Instance Norm、Group Norm、Switchable Norm总结

    转自https://blog.csdn.net/qq_41997920/article/details/89945972 目录 1.综述 1. BN 2. LN 3. IN 4. GN 5. SN 2 ...

  4. 2.3.2 Batch Norm介绍

    正则化网络的激活函数 Batch归一化会使你的参数搜索变得很容易,使神经网络对超参数选择变得更加稳定.超参数范围会更庞大,工作效率也会更好.也会让你训练出更为深层次的神经网络.下面我们具体介绍一下Ba ...

  5. 40_pytorch Batch Norm

    1.37.Batch Normalization,批规范化 1.37.1.Batch Norm介绍 1.37.2.Intuitive explanation 1.37.3.Intuitive expl ...

  6. 02.改善深层神经网络:超参数调试、正则化以及优化 W3. 超参数调试、Batch Norm和程序框架(作业:TensorFlow教程+数字手势预测)

    文章目录 1. 探索TensorFlow库 1.1 线性函数 1.2 计算 sigmoid 1.3 计算损失函数 1.4 One_Hot 编码 1.5 用0,1初始化 2. 用TensorFlow建立 ...

  7. 02.改善深层神经网络:超参数调试、正则化以及优化 W3. 超参数调试、Batch Norm和程序框架

    文章目录 1. 调试处理 2. 为超参数选择合适的范围 3. 超参数调试的实践 4. 归一化网络的激活函数 5. 将 Batch Norm 拟合进神经网络 6. Batch Norm 为什么奏效 7. ...

  8. 机器学习、深度学习实战细节(batch norm、relu、dropout 等的相对顺序)

    cost function,一般得到的是一个 scalar-value,标量值: 执行 SGD 时,是最终的 cost function 获得的 scalar-value,关于模型的参数得到的: 1. ...

  9. 详解常用的Batch Norm、Group Norm,Layer norm、Instance Norm

    本文主要分析cv中常用的batch norm, group norm方法,由于目标检测中不常见,因此只是简单介绍并理解Layer norm和Instance Norm的概念.首先cv中用的最多的肯定是 ...

最新文章

  1. blob二进制显示在html,使用Blob获取图片并二进制显示实例页面
  2. H5-Dooring可视化搭建平台的新技能
  3. MS Reporting Services 报表开发
  4. Dataset之OttoGroup:OttoGroup数据集的简介、下载、案例应用之详细攻略
  5. java徐仕锋_传智播客云计算开发 Hadopp视频教程 传智播客之javaEE + Hadoop...
  6. Redmi K50 Pro核心配置曝光:搭载天玑9000旗舰4nm芯片
  7. 计算机的英语对话,英语口语对话:谈论电脑
  8. iOS 使用CocoaPods
  9. mysql-5.6.24-win32解决没有my.ini并且修改编码
  10. java语言简介总结
  11. WPS启动不再默认展示“稻壳”页面 - 去除稻壳的方法
  12. 泰坦尼克数据集kaggle Titanic下载
  13. C#将大量数据批量写入Excel中
  14. 如何创建sis文件——概叙
  15. 基于springboot的在线小说阅读平台设计与实现-计算机毕业设计源码+LW文档
  16. Repeater的 Items属性、Items里面的控件有几个?
  17. 上层应用程序是如何访问到底层驱动程序的呢?
  18. [na]office 2010 2013卸载工具
  19. 原画师需要用到什么工具?绘画工具大全!
  20. 微电网数字孪生 | 智能时代,部署源网荷储一体化管控平台

热门文章

  1. Asterisk常用命令
  2. 【RESTful】REST 与 RESTful 理解与实践
  3. C#版OPOS打印(基于北洋OPOS SDK二次开发包,支持EPSON和北洋、佳博、商祺等支持标准ESC/POS指令的POS打印机)
  4. MySql数据库记录相差14小时排错,使用Java访问Mysql数据库时出现时区异常的解决方案
  5. 计算机日常故障DIY维修有哪些,计算机维护 DIY 完全手册
  6. Linq 介绍(二)
  7. Centos7创建DNS服务器(超级简单,一看就会)
  8. 如何提升网站的浏览率
  9. 存储术语中的LUN概念
  10. python动态柱状图_动态排名柱状图的两种做法