Paper : Identity Mappings in Deep Residual Networks
Code : official

摘要

PreActResNet其实只是将Conv-BN-ReLU的顺序换了一下,使得存在一条通路从第一个ResNet Block到最后一个ResNet Block,中间不经过非线性变换ReLU,提高模型的准确率。

网络结构

左侧的网络结构是ResNet中提出的网络结构,是继承自VggNet的经典的Conv-BN-ReLU的结构,由于激活函数是在Conv层之前,因此也被称为PostActResNet。而右侧的网络结构是该论文中提出的新型的网络结构,在之前的一篇blog中分析identity shortcut connection的作用时曾经有过如下假设

… 则在有效的反向传播的过程中,ReLU可以看作是一个恒等映射 …

而PreActResNet的网络结构,也就是激活函数放在Conv层之前的结构,不需要通过近似即可满足该条假设,进一步增强了网络结构中shortcut的恒等性。两种结构的错误率变化如下

可以看出,对于深度较深的网络结构,PreActResNet在收敛速度和准确率上都有较好的表现。事实上,我们有更多种排列方式可以选择

下面是针对各种shortcut连接方式的实验数据

论文里提到,shortcut连接中的操作(缩放、门控、1*1 的卷积层,dropout)都会阻碍信息的传递,以致于对优化造成困难。虽然1*1的卷积捷径连接引入了更多的参数,本应该比恒等捷径连接具有更加强大的表达能力。但是它的效果并不好,这表明了这些模型退化问题的原因是优化问题,而不是表达能力的问题。

核心观点

  1. 通过改变激活层的位置,使网络模型的shortcut connection的恒等性进一步加强,可以改善残差神经网络的表现。一条由恒等函数组成的干净的shortcut connection是对于ResNet来说是至关重要的。

PreActResNet相关推荐

  1. 基于深度学习的图像识别模型发展

    一.简介 AlexNet:(2012)主要贡献扩展 LeNet 的深度,并应用一些 ReLU.Dropout 等技巧.AlexNet 有 5 个卷积层和 3 个最大池化层,它可分为上下两个完全相同的分 ...

  2. VanillaNet:深度学习极简主义的力量

    摘要 基础模型的核心是"更多不同"的理念,计算机视觉和自然语言处理方面的出色表现就是例证.然而,Transformer模型的优化和固有复杂性的挑战要求范式向简单性转变.在本文中,我 ...

  3. 一些常见的CNN模型

    最近闲着无聊在家敲了一些基本的CNN模型,这里对网上资料做一个简要的整理总结,供自己学习使用. 一.VGG ​ VGG模型是2014年ILSVRC竞赛的第二名,第一名是GoogLeNet.但是VGG模 ...

  4. pytorch分类cifar-10(多模型对比)

    2020/3/10更新一点:增加了CVPR2020的华为诺亚方舟实验室的一款轻量型网络 GhostNet: More Features from Cheap Operations 之前沿着这样的路线: ...

  5. Neural Network Intelligence (NNI) | PyTorch-CiFar10 项目示例+常用pytorch版本模型全家福

    一.环境 NNI version: 2.1 Python version: 3.8.3 Pytorch version: 1.6.0 二.代码 1.main.py '''Train CIFAR10 w ...

最新文章

  1. vue数据源转json问题
  2. DevOps笔记-10:金融行业分支策略的建议
  3. 数据库菜鸟不可不看 简单SQL语句小结
  4. [C#.NET 拾遗补漏]07:迭代器和列举器
  5. Python缩进的几个原则
  6. fceux模拟器linux,超强FC模拟器fceux-2.2.3最新版
  7. 二、规则组织数学模型的建立
  8. Shiro授权流程图
  9. Visual Studio2017 配置OpenGL
  10. 1433抓鸡的原理详解以及防范
  11. Vmware中Server配置静态IP地址
  12. redis c++接口
  13. Go语言学习 二十一 内嵌
  14. Android冒险之旅-13-ListView的使用与优化
  15. Hello, Fedora.
  16. oracle 通信通道异常,(oracle)ORA-03113: 通信通道的文件结尾错误处理
  17. 2014年实习生招聘之武汉光庭信息技术有限公司实习生招聘部分笔试题(Java)—2014/04/14
  18. linux多字节错误,在Linux中解压缩时遇到多字节字符的问题
  19. ubuntu训练深度学习模型电脑重启解决方法
  20. 在anaconda中git找不到命令,可能是设置的git环境变量路径包含中文

热门文章

  1. 微信小程序代码怎么用工具打开看
  2. java火柴游戏_Java课程设计—拿火柴小游戏
  3. HCIA脱产班 学习笔记3
  4. 基于Springboot的智慧校园管理系统(PC端和APP端双端应用)
  5. Axure的动态面板
  6. PART 2.2 风控建模前数据预处理清洗
  7. 什么是Hive——大数据仓库Hive基础
  8. 做软件项目验收测评,首选专业第三方软件检测机构
  9. 全新商城社区系统整站源码
  10. 高中计算机课程事例,高中信息技术课堂教学案例与分析.doc