大家好,欢迎来到专栏《AutoML》,在这个专栏中我们会讲述AutoML技术在深度学习中的应用。这一期讲述在归一化机制中的应用。

作者&编辑 | 言有三

数据经过归一化和标准化后可以加快梯度下降的求解速度,这是Batch Normalization等技术非常流行的原因,它使得可以使用更大的学习率更稳定地进行梯度传播,甚至增加网络的泛化能力。

1 Switchable Normalization

现在我们在每一个网络层中都使用同样的归一化,这是最优的配置吗?显然不是,因为实际应用中不同的问题就有它最合适的归一化操作。比如RNN等时序模型,有时候同一个batch内部的训练实例长度不一(不同长度的句子),则不同的时态下需要保存不同的统计量,无法正确使用BN层,只能使用Layer Normalization。对于图像生成以及风格迁移类应用,使用Instance Normalization更加合适。对于Batch比较小的情况下,Group Normalization是一个替换的方案。

Switchable Normalization[1]的研究便是关注如何让不同的网络层学习到最适合该层的归一化机制,方法就是在包含各类归一化方法的池中进行选择,然后用精度进行比较择优。

上图是对于各类任务中,学习到的最适合该方法的BN,IN,LN,GN的比例。

可以看到,对于分类,检测任务主干模型,BN更常用,对于LSTM任务,LN一家独大,对于Image Style Transfer任务,IN一家独大。

这便是Switchable Normalization(SN),具体的搜索过程大家可以阅读原文细节以及开源的代码。

2 SN与minibatch

众所周知,minibatch size的变化对BN是有影响的,minibatch过小,均值和方差统计量的估计噪声就过大,影响模型的泛化性能。IN,LN和GN计算统计量时虽然与minibatch无关,却也失去了BN带来的正则化能力,因此更容易产生明显的过拟合。SN在任务中自适应地学习出最佳配置,从而使得模型对minibatch更加不敏感。

具体来说,minibatch越小,BN越不稳定,权重系数越小,IN和LN的权重系数则越大;minibatch越大,BN的权重系数就越大,反之IN和LN的权重系数越小。

上图为不同minibatch下的权重系数的比例,括号中分别表示GPU数目,每个GPU的样本数。可以看出,随着minibatch的不断减小,BN的权重越来越低。

3 SN的改进

针对SN中使用softmax进行重要性学习存在的冗余计算问题,Sparse Switchable Normalization方法将softmax转换成了稀疏的形式,对每一个归一化层只选择一个归一化操作。

由于归一化方法的不同在于用于计算归一化的集合,所以往后的发展可能集中在如何选择用于归一化的集合,以及针对具体任务学习均值和方差,感兴趣的可以继续跟进。

[1] Luo P, Ren J, Peng Z, et al. Differentiable learning-to-normalize via switchable normalization[J]. arXiv preprint arXiv:1806.10779, 2018.

[2] Shao W, Meng T, Li J, et al. Ssn: Learning sparse switchable normalization via sparsestmax[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2019: 443-451.

[3] github链接

https://github.com/switchablenorms/Switchable-Normalization

https://github.com/switchablenorms/Sparse_SwitchNorm

总结

本次我们介绍了一种对各类归一化方法进行自动学习的机制,它相比固定的配置归一化方法更加灵活,也能取得更优的结果。

下期预告:AutoML在优化方法中的应用。

有三AI秋季划

有三AI秋季划已经正式启动报名,模型优化,人脸算法,图像质量共24个项目,助力提升深度学习计算机视觉算法和工程项目能力。

转载文章请后台联系

侵权必究

往期文章

【AutoML】归一化(Normalization)方法如何进行自动学习和配置相关推荐

  1. rms归一化_【AutoML】归一化(Normalization)方法如何进行自动学习和配置

    大家好,欢迎来到专栏<AutoML>,在这个专栏中我们会讲述AutoML技术在深度学习中的应用.这一期讲述在归一化机制中的应用. 作者&编辑 | 言有三 数据经过归一化和标准化后可 ...

  2. 【AutoML】优化方法可以进行自动搜索学习吗?

    大家好,欢迎来到专栏<AutoML>,在这个专栏中我们会讲述AutoML技术在深度学习中的应用,这一期讲述在优化方法选择中的应用. 作者&编辑 | 言有三 要成功训练一个深度学习模 ...

  3. 「AutoML」激活函数如何进行自动学习和配置

    2019-10-26 12:48:04 大家好,欢迎来到专栏<AutoML>,在这个专栏中我们会讲述AutoML技术在深度学习中的应用.这一期讲述在激活函数设计中的应用. 作者&编 ...

  4. 【AutoML】激活函数如何进行自动学习和配置

    大家好,欢迎来到专栏<AutoML>,在这个专栏中我们会讲述AutoML技术在深度学习中的应用.这一期讲述在激活函数设计中的应用. 作者&编辑 | 言有三 激活机制是一个网络非线性 ...

  5. 【AutoML】进化算法如何用于自动模型搜索(NAS)

    大家好,欢迎来到专栏<AutoML>,在这个专栏中我们会讲述AutoML技术在深度学习中的应用,这一期讲述进化算法用于模型搜索的基本概念和流程. 作者&编辑 | 言有三 一直以来, ...

  6. 谷歌大脑最新研究:用AutoML的方式自动学习Dropout模式,再也不用手动设计

    鱼羊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 深度神经网络往往存在过拟合的问题,需要Dropout.权重衰减这样的正则化方法的加持. 而最近的研究表明,如果对Dropout"剪 ...

  7. 【赠书】快速入门自动机器学习!自动机器学习(AutoML):方法、系统与挑战 图书赠送!...

    周末了,这次给大家赠送3本机器学习好书,<自动机器学习(AutoML):方法.系统与挑战>,请看细节. 这是一本什么书 这是一本全面介绍自动机器学习的好书,主要包含自动机器学习的方法.实际 ...

  8. 文末送书 | 自动机器学习(AutoML):方法、系统与挑战

    OPENNING 最新上架 近十年来,不管是机器学习相关的应用还是研究,都迎来了爆发式增长.尤其是深度学习,使得很多应用领域都取得了关键性突破,如计算机视觉.语音处理和游戏. 然而,多数机器学习方法的 ...

  9. DIFFERENTIABLE LEARNING-TO-NORMALIZE VIA SWITCHABLE NORMALIZATION(SN 可微分学习的自适配归一化)

    DIFFERENTIABLE LEARNING-TO-NORMALIZE VIA SWITCHABLE NORMALIZATION(SN 可微分学习的自适配归一化) 可交换的归一化方法 这是根据不同作 ...

最新文章

  1. Docker App应用
  2. 如何调用华为云api_postman调用华为云接口添加资源
  3. NLP新秀:BERT的优雅解读
  4. One Day-XML:XSL
  5. 如何查看linux命令源代码(转自网络)
  6. 苹果启动“突围”计划 建立自营金融服务
  7. 【产品经理日常】关于内容类产品逻辑再思考
  8. Win11系统Windows更新疑难解答出现问题怎么办?
  9. 代码下移快捷键_收藏细看!最全面的通达信快捷键一览
  10. java id3v2 乱码,Mp3标签乱码问题分析与解决方案
  11. 9. Fizz Buzz 问题
  12. javascript --关灯游戏
  13. Qt下载(多种下载通道+所有版本)(付在线教程)
  14. IP 地址以 0 开头会降维成八进制
  15. C++ Primer Plus 第九章答案 内存模型和名称空间
  16. Debian 官方发文庆祝 28 岁生日
  17. 项目管理学习——《构建之法》读书笔记
  18. 纪录大华的智能回调需要用到的事件列表
  19. c语言printf打印浮点型,printf以%d输出浮点数
  20. 苹果x漫画脸_苹果最新iPhone SE:秒杀安卓的小屏旗舰

热门文章

  1. 类与接口(四)方法重载解析
  2. 动态规划--连续子序列的最大和
  3. Java设计模式-适配器模式Adapter
  4. 一天搞定CSS: 清除浮动(float)--13
  5. php如何获取ftp文件信息,FTP 得到文件树[php]
  6. 多线程基础与JUC进阶笔记
  7. Hadoop的学习前奏(一)——在Linux上安装与配置Hadoop
  8. Gentoo 安装日记 07 (stage3:复制解压stage包,并切换根目录)
  9. iOS - 数据持久化之 FMDB 的使用
  10. MySQL基础之控制台常用命令