Group Norm(GN)、Batch Norm(BN)和Layer Norm(LN)都是常用的归一化方法,可以在深度学习中提升模型的训练效果。

区别与联系:

BN是针对一个batch的数据进行归一化,LN是对每个样本的所有特征进行归一化,GN则是将channel分成若干组,对每组的数据进行归一化。
BN和LN适用于小批量的数据,因为它们在进行归一化时会用到小批量数据的均值和方差,但是GN对于较小的batch size也能表现良好,因为它在每个组内计算均值和方差。
BN和GN的归一化是在每个通道上进行的,而LN是在每个样本上进行的。

优缺点:

BN能够加速收敛,但是在测试时需要保存训练集的均值和方差,因此会增加额外的内存和计算负担。
GN相比BN更加鲁棒,对于小batch size的情况下表现更好,而且不需要额外的计算负担。
LN在RNN和序列模型中表现较好,但是在图像领域的任务中表现较差。

适用场景:

BN适用于较大的batch size,例如大于等于32的情况。
GN适用于小batch size和训练数据不规则的情况。
LN适用于RNN和序列模型。

Group Norm,Batch Norm,Layer Norm相关推荐

  1. 神经网络 深度学习 专业术语解释(Step, Batch Size, Iteration,Epoch)

    1. 名词解释 Step: 训练模型的步数 Batch Size(批尺寸): 计算梯度所需的样本数量,太小会导致效率低下,无法收敛.太大会导致内存撑不住,Batch Size增大到一定程度后,其下降方 ...

  2. 详解常用的Batch Norm、Group Norm,Layer norm、Instance Norm

    本文主要分析cv中常用的batch norm, group norm方法,由于目标检测中不常见,因此只是简单介绍并理解Layer norm和Instance Norm的概念.首先cv中用的最多的肯定是 ...

  3. Batch Norm、Layer Norm、Instance Norm、Group Norm、Switchable Norm总结

    转自https://blog.csdn.net/qq_41997920/article/details/89945972 目录 1.综述 1. BN 2. LN 3. IN 4. GN 5. SN 2 ...

  4. 一文弄懂Batch Norm / Layer Norm / Instance Norm / Group Norm 归一化方法

    文章目录 前因 总览 Batch Normalization Layer Normalization Instance Normalization Group Normalization 总结 参考 ...

  5. dropout,batch norm 区别 顺序

    20210614 https://www.cnblogs.com/hutao722/p/9946047.html 深度学习基础系列(九)| Dropout VS Batch Normalization ...

  6. 深度学习-各种归一化(Batch Norm、Layer Norm、Group Norm、InstanceNorm、Spatially-Adaptive Norm)

    深度学习之归一化:BN.LN.GN.IN.SPADE 0.总述 0.1.为什么要归一化处理 0.2.大体上看BN.LN.IN.GN 1.批量归一化(Batch Normalization,BN) 1. ...

  7. Batch Norm 与 Layer Norm

    这里写自定义目录标题 1 为何要对输入数据做 Normalization 2 Batch Normalization 3 Layer Normalization 4 实际应用 参考 1 为何要对输入数 ...

  8. 7种Normalization总结(batch normalization,layer normalization,Weight Normalization,Cosine Normalization)

    文章目录 七种normalization 1. Normalization 动机 原理 优点 缺点 2. Batch Normalization 动机 原理 优点 缺点 3. Layer Normal ...

  9. BERT用的LayerNorm可能不是你认为的那个Layer Norm?

    ©作者 | 王坤泽 单位 | 悉尼大学 研究方向 | NLP 有关 Batch norm 和 Layer norm 的比较可以算上是算法领域的八股文了,为什么 BERT 不用 batch norm 而 ...

最新文章

  1. python登录代码思路_用python登录Dr.com思路以及代码分享
  2. J2ME下的游戏精灵的碰撞检测(转)
  3. React开发(200):三种截取字符串的方法
  4. 约瑟夫斯问题-java版数组解法和链表解法
  5. And(CF-1013B)
  6. 08.存储Cinder→5.场景学习→08.Backup Volume→2.实操
  7. MapReduce 的架构
  8. java常见抛出异常
  9. BeanUtils如何优雅的拷贝List
  10. Win10安装程序修复计算机,directx修复工具win10最新版
  11. Programer四境界-摘自《代码大全》
  12. WPS-设置列的下拉菜单
  13. python识别文字并且提示_Python识别文字,实现看图说话|CSDN博文精选
  14. 见缝插针的人_“见缝插针”的创意人生
  15. Android隐藏虚拟按键
  16. 父爱动画代码python_情人节锦囊:简单的python表白程序(动画效果)
  17. Python的前奏:excel常用功能简介,数据透视表,切片器
  18. JEESZ 模块开发文档
  19. 移动开发技术第四次大作业
  20. linux服务器安装gmt,linux GMT简易安装

热门文章

  1. R Markdown 如何使用外部css
  2. DirectDraw学习:第一课
  3. python发送esc_使用win32prin将一行文本发送到Python中的ESC/POS打印机
  4. 计算机wps系统的造字程序在哪里,Windows10系统自带造字程序在哪
  5. 咸阳哪里学计算机,咸阳计算机进修学院
  6. 动态规划:求两个字符串的最长公共子序列
  7. 大学计算机基础实践教程实验一讨论与思考,大学计算机基础实验报告手册(非艺术类).doc...
  8. 【生活常识】如何能安逸的活着?
  9. oracle 存储过程误删,Oracle中怎么恢复被删掉的存储过程
  10. 如何高效的使用搜索引擎