编译 | 阿司匹林

AI科技大本营按:近日,FAIR 团队的吴育昕和何恺明提出了组归一化(Group Normalization,简称 GN)的方法。其中,GN 将信号通道分成一个个组别,并在每个组别内计算归一化的均值和方差,以进行归一化处理。此外,GN 的计算与批量大小无关,而且在批次大小大幅变化时,精度依然稳定。实验结果证明,GN 在多个任务中的表现均优于基于 BN 的同类算法,这表明 GN 能够在一系列任务中有效地替代 BN。

以下内容来自 Group Normalization 论文,AI科技大本营翻译:

批归一化(Batch Normalization,简称 BN )是深度学习发展中的一项里程碑技术,它让各种网络都能够进行训练。然而,沿着批次维度的归一化也带来了新问题:当统计不准确导致批次的大小越来越小时,BN 的错误会急剧增加。在训练更大的网络,以及执行将特征迁移至包括探测、分割、视频在内的计算机视觉任务时,BN 的使用就受到了限制,因为它们受限于内存消耗而只能使用小批次。

在该论文中,我们提出了一种简单的组归一化的方法。GN 将信号通道分成一个个组别,并在每个组别内计算归一化的均值和方差,以进行归一化处理。GN 的计算与批量大小无关,而且在批次大小大幅变化时,精度依然稳定。例如在 ImageNet 上训练的 ResNet-50 ,当批次大小为 2 时,GN 的误差比 BN 低 10.6 %;当使用典型的批次大小时,GN 与 BN 的表现相当,并且优于其他归一化变体。此外,GN 可以自然地从预训练迁移到微调阶段。在 COCO 的目标检测和 Kinetics 的视频分类任务中,GN 的表现均优于基于 BN 的同类算法,这表明 GN 能够在一系列任务中有效地替代 BN。重要的是,只需几行代码,就可以在现代库中实现 GN。

图1:ImageNet 分类误差与批次大小的关系。这是在 ImageNet 训练集中使用 8 块 GPU 训练的 ResNet-50 模型,并在验证集上进行了评估。

组归一化

视觉表征的通道并不是完全独立的。SIFT、HOG 和 GIST 的经典特征是符合分组特征的,其中每组信道由某种直方图(histogram)构成。这些特征通常通过在每个直方图或每个方向上执行分组归一化来处理。诸如 VLAD 和 Fisher Vectors (FV)  等高级特征也是分组特征,其中每一组可以被认为是关于集群计算的子向量。

类似地,我们不需要将深层神经网络特征视为非结构化向量。例如,对于网络的第一个卷基层 conv1 ,我们可以预期,滤波器(filter)及其水平翻转在自然图像上呈现类似的滤波器响应分布是合理的。如果 conv1 碰巧近似地学习到这对滤波器,或者通过将水平翻转设计到架构中,则这些滤波器的相应通道可以一起归一化。

神经网络中的更高层级更加抽象,它们的行为也不那么直观。然而,除了方向之外,还有许多因素可以导致分组,例如频率、形状、照明、纹理等,它们的系数可以是相互依赖的。事实上,神经科学中一个广为接受的计算模型就是对细胞反应进行归一化,“具有各种感受野(receptive-field)中心(覆盖视野)和各种时空频率调谐”,这不仅可以发生在初级视觉皮层,而且可以发生在“整个视觉系统”中。受此启发,我们提出了一种新的深度神经网络的泛组归一化(generic group-wise normalization)方法。

图2:归一化方法。每个子图显示一个特征图张量,其中 N 为批处理轴,C 为通道轴,( H; w )为空间轴。通过计算这些蓝色像素的和,它们被相同的平均值和方差归一化。

组归一化公式:

只需要几行代买,GN 就可以在 iPyTorch 和 TensorFlow 实现。

实验

1. 对 ImageNet 数据集进行图像分类

图4:批次大小为 32 幅图像/GPU 时的误差曲线。上图展示了 ImageNet 训练误差(左)和验证误差(右)与训练周期的关系。模型为 ResNet-50。

图5:对批次大小的敏感度:ResNet-50 对 BN (左)和 GN(右)的验证误差,分别使用 32、16、8、4 和 2 幅图像/GPU 进行训练。

表1:ImageNet 验证集中 ResNet-50 的误差(%)的比较,使用大小为 32 幅图像/GPU 的批次进行训练。误差曲线如图4所示。

表2:对批次大小的敏感度。该表展示了 ResNet-50 在 ImageNet 中的验证误差(%)。最后一行显示了 BN 和 GN 之间的差异。误差曲线如图 5 所示。

图6:VGG-16  中 conv5_3(5_3 为下标)输出(在归一化和 ReLU 之前)的特征分布的演变。右侧的表显示了 ImageNet 的验证误差(%)。模型使用 32 幅图像/ GPU 进行训练。

表3:组划分。该表展示了 ResNet-50 在 ImageNet 中的验证误差(%),该模型使用 32 幅图像/GPU 进行训练。(上):给定数量的组。(xia):每组给定数量的通道。每张表的最后一行显示了最佳结果之间的差异。

2. 对 COCO 数据集进行目标检测和分割

表4:使用 Mask R-CNN(ResNet-50 C4)在 COCO 中的检测和分割结果。BN* 表示 BN 被冻结。

表5:使用 Mask R-CNN( ResNet-50 FPN 和 4conv1fc 边界框)在 COCO 中的检测和分割结果。 BN* 表示 BN 被冻结。

3. 对 Kinetics 数据集进行视频分类

图7:Kinetics数据集中,输入长度为 32 帧的误差曲线。上图显示了 ResNet-50 I3D 对 BN(左)和 GN(右)的验证误差。

表6: 对 Kinetics 的视频分类结果:ResNe-50 I3D 基线的 top-1/top-5 精度( % )。

讨论以及未来的工作

我们证明了 GN 可以作为一个有效的归一化层,而不需要利用批量维度。我们已经评估了 GN 在各种应用中的表现。然而,我们也注意到,BN 的影响力如此之大,以至于许多最先进的系统及其超参数都是为它设计的,这写对于基于 GN 的模型来说可能不是最佳的。因此,针对 GN 重新设计系统或者寻找新的超参数,可能会得到更好的结果。

此外,我们已经证明 GN 与 LN 和 IN 是相关联的,这两种归一化方法在训练 RNN/LSTM 等递归模型或者 GAN 等生成模型方面特别成功。这也提示我们今后应在这些领域进行 GN 的研究。未来,我们还将测试 GN 在强化学习任务中学习表征方面的表现。

论文链接:https://arxiv.org/abs/1803.08494

精彩推荐

2018年3月30-31日,第二届中国区块链技术暨应用大会将于北京喜来登长城饭店盛大开场,50+区块链技术领导人物,100+区块链投资商业大咖,100+技术&财经媒体,1000+区块链技术爱好者,强强联合,共同探讨最in区块链技术,豪华干货礼包享不停。八折门票火热抢购中!2018,未来已来,带你玩转区块链。

AI科技大本营用户群(计算机视觉、机器学习、深度学习、NLP、Python、AI硬件、AI+金融、AI+PM方向)正在招募中,后台回复:读者群,联系营长,添加营长请备注姓名,研究方向。

☟☟☟点击 | 阅读原文 | 查看大会详情

何恺明、吴育昕最新成果:用组归一化替代批归一化相关推荐

  1. 全面解读Group Normbalization-(吴育昕-何凯明)

    前言 Face book AI research(FAIR)吴育昕-凯明联合推出重磅新作Group Normbalization(GN),提出使用Group Normalization 替代深度学习里 ...

  2. 吴恩达最新成果 CheXNet详解:肺炎诊断准确率超专业医师

    离开百度之后,吴恩达在学术界异常活跃,除了推出最新的深度学习在线课程之外,他还带领着一支来自斯坦福的团队不断推进深度学习在医疗领域的应用. 近日,吴恩达团队在 arXiv 上发表了他们的最新成果--用 ...

  3. 何恺明的GN之后,权重标准化新方法能超越GN、BN吗? | 技术头条

    点击上方↑↑↑蓝字关注我们~ 「2019 Python开发者日」,购票请扫码咨询 ↑↑↑ 作者 | Siyuan Qiao.Huiyu Wang.Chenxi Liu.Wei Shen.Alan Yu ...

  4. 何恺明最新一作论文:无监督胜有监督,迁移学习无压力,刷新7项检测分割任务...

    鱼羊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 何恺明的一作论文,又刷新了7项分割检测任务. 这一次,涉及的是无监督表征学习.这一方法广泛应用在NLP领域,但尚未在计算机视觉中引起注意. ...

  5. 何恺明团队新作:图像分割精细度空前,边缘自带抗锯齿,算力仅需Mask R-CNN的2.6%...

    鱼羊 乾明 发自 凹非寺  量子位 报道 | 公众号 QbitAI 又是何恺明超越何恺明. 其团队最新论文一出,图像分割又往前一大步: 消耗的资源变得更少,算力仅需Mask R-CNN的2.6%. 不 ...

  6. 传奇大神何恺明被曝回归学界,网友:要成全MIT引用最高的人了

    AI大牛何恺明有了最新动向,而且是回归学术界. MIT CSAIL实验室发布公告,3月13日下周一,何恺明将到MIT做学术演讲. 此事引起AI圈广泛关注.在相关知乎问题下,MIT博士@Charles指 ...

  7. 何恺明“终结”ImageNet预训练时代:从0开始训练神经网络,效果比肩COCO冠军

    夏乙 安妮 发自 凹非寺 量子位 出品 | 公众号 QbitAI 何恺明,RBG,Piotr Dollár. 三位从Mask R-CNN就开始合作的大神搭档,刚刚再次联手,一文"终结&quo ...

  8. 吴恩达团队最新成果:用深度学习来改善临终关怀服务

    翻译 | AI科技大本营(ID:rgznai100) 参与 | 尚岩奇,刘畅 AI可以是杀戮的武器,也可以是救世的良方. 上周,在日内瓦举行的联合国特定常规武器公约会议上,伯克利大学教授Stuart ...

  9. Paper:2020年3月30日何恺明团队最新算法RegNet—来自Facebook AI研究院《Designing Network Design Spaces》的翻译与解读

    Paper:2020年3月30日何恺明团队最新算法RegNet-来自Facebook AI研究院<Designing Network Design Spaces>的翻译与解读 导读: 卧槽 ...

最新文章

  1. Java局部变量final
  2. golang表单及验证支持
  3. php根据数组某一字段排序,php如何根据数组中某一字段来实现排序
  4. 春节必看的五个Asp.net源码!
  5. java实现redis客户端_windows下java swt实现操作redis的客户端工具
  6. Pycharm中出现ImportError:DLL load failed:找不到指定模块的解决方法(终极方法,不成功来找我~)
  7. UnityShader19:渲染纹理(上)之截屏功能实现
  8. 查看一个数是不是2的n次方
  9. 数据结构课程设计题目
  10. 解决小米手机无法安装证书问题
  11. 西北工业大学计算机转专业,2021年西北工业大学大一新生转专业及入学考试相关规定...
  12. 台式计算机调亮度,台式电脑怎么调节亮度(台式电脑亮度在哪里调节)
  13. DL2 - Improving Deep Neural Networks- Hyperparameter tuning, Regularization and Optimization
  14. Matlab曲线拟合(2)(自用笔记)
  15. java(File、IO流)
  16. fs.readFileSync 引入路径错误
  17. ultraedit许可证id 7位数字_优雅的数据库ID设计
  18. 用协议软件分析ping大包丢包故障
  19. 教你惠普重装系统win10教程
  20. 2020年中国炼油行业市场现状及发展趋势分析,行业高质量发展进入快车道「图」

热门文章

  1. OpenCV画图函数
  2. 20. matlab 中的gtext 函数
  3. 文件中数组的最大值及其对应的最小下标
  4. C++ 学习笔记之——文件操作和文件流
  5. windows远程桌面如果超出最大连接数, 使用命令行mstsc /console登录即可
  6. python RSA 加密与签名
  7. IOS_多线程_ASI_AFN_UIWebView
  8. 1、IO输入输出流 简介
  9. 在文本框中提示用户输入内容格式的方法
  10. 【怎样写代码】复杂对象的组装与创建 -- 建造者模式(三):建造者模式