2015年的paper,微软何凯明等。

解决的问题:

  1. 梯度消失/爆炸问题;

    1. 之前的解决方案:This problem, however, has been largely addressed by normalized initial- ization [23, 9, 37, 13] and intermediate normalization layers [16], which enable networks with tens of layers to start con- verging for stochastic gradient descent (SGD) with back- propagation [22].

  2. The degradation (of training accuracy) :可能深层的网络训练结果反而没有浅层好,并且这个问题并非由过拟合导致。结果,之前最深的网络基本在30层以内。

解决的思路:

  1. residual learning reformulation :拟合残差,来解决梯度消失/爆炸问题。

    1. 假设输出是H(x),某层可以拟合残差F(x) = H(x) - x。理论上等价。但是,H(x)中要经过多层非线性转换,可能有梯度问题。而用残差你和,就没有这个问题了。

  1. 认为高深度网络不应该比低深度网络差,通过shortcut来做恒等映射,使得至少让高深度网络表现不差于低深度网络。这样,以后可以在计算能力可以的情况下,可以增加任意多层。

附加的问题和结果:

  1. 最大训练到152层(ImageNet)和1000层(CIFAR-10)。

  2. 计算量并没有大很多。参数也是。

  3. 实验表现很好,包括ImageNet(达到3.57%的top 5错误率,拿了第一名),COCO(提升28%左右)。

其他:

文章里主要和VGG plain网络进行对比。

参考翻译的一篇文章:

https://blog.csdn.net/wspba/article/details/57074389

#论文 《Deep Residual Learning for Image Recognition》相关推荐

  1. 经典DL论文研读(part4)--ImageNet Classification with Deep Convolutional Neural Networks

    学习笔记,仅供参考,有错必纠 文章目录 ImageNet Classification with Deep Convolutional Neural Networks 摘要 Introduction ...

  2. 《每日论文》ImageNet Classification with Deep Convolutional Neural Networks

    这篇论文是剖析 CNN 领域的经典之作,也是入门 CNN 的必读论文.作者训练了一个面向数量为 1.2 百万的高分辨率的图像数据集 ImageNet, 图像的种类为 1000 种的深度卷积神经网络. ...

  3. AlexNet论文翻译(中英文对照版)-ImageNet Classification with Deep Convolutional Neural Networks

    图像分类经典论文翻译汇总:[翻译汇总] 翻译pdf文件下载:[下载地址] 此版为中英文对照版,纯中文版请稳步:[AlexNet纯中文版] ImageNet Classification with De ...

  4. ImageNet Classification with Deep Convolutional Neural Networks论文翻译——中文版

    文章作者:Tyan 博客:noahsnail.com  |  CSDN  |  简书 翻译论文汇总:https://github.com/SnailTyan/deep-learning-papers- ...

  5. 论文《ImageNet Classification with Deep Convolutional Neural Networks》阅读及AlexNet的Tensorflow2复现

    论文<ImageNet Classification with Deep Convolutional Neural Networks>阅读及AlexNet的Tensorflow2复现 论文 ...

  6. ImageNet Classification with Deep Convolutional Neural Networks论文翻译——中英文对照

    文章作者:Tyan 博客:noahsnail.com  |  CSDN  |  简书 翻译论文汇总:https://github.com/SnailTyan/deep-learning-papers- ...

  7. 论文研读 —— 6. ImageNet Classification with Deep Convolutional Neural Networks (1/3)

    文章目录 Authors and Publishment Authors Bibtex Abstract 1. Introduction 2. The Dataset Authors and Publ ...

  8. 《ImageNet Classification with Deep Convolutional Neural Networks》翻译

    1 引言 2 数据集 3 架构 3.1 ReLU 非线性 3.2 训练多个GPU 3.3 局部响应归一化 3.4 重叠池化 3.5 整体架构 4 减少过拟合 4.1 数据增强 4.2 Dropout ...

  9. 论文研读 —— 6. ImageNet Classification with Deep Convolutional Neural Networks (2/3)

    文章目录 3. The Architecture 3.1. ReLU Nonlinearity 3.2. Training on Multiple GPUs 3.3. Local Response N ...

  10. 论文研读 —— 6. ImageNet Classification with Deep Convolutional Neural Networks (3/3)

    文章目录 6. Results 6.1. Qualitative Evaluations 7. Discussion References 6. Results Our results on ILSV ...

最新文章

  1. Android 实现一个验证码倒计时(Handler postDelayed 实现验证码倒计时)
  2. 50个Android开发人员必备UI效果源码[转载]
  3. 使用FlowDroid生成Android应用程序的函数调用图
  4. JavaScript基础之Array对象和Boolean对象
  5. FPGA_EP2C8T144_SCH(PDF)
  6. 【小程序源码】修复图片音频全新升级带特效神器小游戏微信小程序源码下载-多种游戏支持
  7. 率辉考研oj——1323: 算法2-1:集合union
  8. Maven下载安装及修改setting内容
  9. Windows下进行域名映射并配置Nginx反向代理
  10. 高通量测序领域常用名词解释
  11. 加菲猫经典语录(二十二条,中英文对照)
  12. 安费诺面试经验(已面试,等通知)
  13. Batch Normalization 批归一化是什么? 有什么用?
  14. Windows上安装MySQL数据库(完整版)
  15. UML组件视图、部署图、包图简要说明
  16. python登录微信客户端_命令行下的微信客户端
  17. 纳税服务系统【系统、子系统首页】
  18. 盘点中国最牛的五个程序员,有一个年薪上亿,有一个身家上千亿
  19. JavaScript严格模式约束规则
  20. cs231n笔记:lecture2,lecture3

热门文章

  1. php用存储过程插入数据,如何使用php-webservice使用android中的存储过程将数据插入sql数据库[duplicate]...
  2. php 模板使用,TMDPHP 模板引擎使用教程
  3. ubuntu12.04 更新内核
  4. 百度地图海量点清除(始终保留最新的点)
  5. oracle经常开关好吗,oracle启动和关闭
  6. mysql主从位点保存时间_MySQL主从备份
  7. multiple root tags怎么解决_手机ROOT后交管12123打不开怎么解决;EdXposed使用QX模块微X教程...
  8. python定义字典列表_[Python基础]五、列表、元组和字典
  9. java 判断 年份,java怎么判断指定年份是否是闰年
  10. 诚毅学院全国计算机考试,集美大学2017年9月全国计算机等级考试报名时间