#论文 《Deep Residual Learning for Image Recognition》
2015年的paper,微软何凯明等。
解决的问题:
梯度消失/爆炸问题;
之前的解决方案:This problem, however, has been largely addressed by normalized initial- ization [23, 9, 37, 13] and intermediate normalization layers [16], which enable networks with tens of layers to start con- verging for stochastic gradient descent (SGD) with back- propagation [22].
The degradation (of training accuracy) :可能深层的网络训练结果反而没有浅层好,并且这个问题并非由过拟合导致。结果,之前最深的网络基本在30层以内。
解决的思路:
residual learning reformulation :拟合残差,来解决梯度消失/爆炸问题。
假设输出是H(x),某层可以拟合残差F(x) = H(x) - x。理论上等价。但是,H(x)中要经过多层非线性转换,可能有梯度问题。而用残差你和,就没有这个问题了。
认为高深度网络不应该比低深度网络差,通过shortcut来做恒等映射,使得至少让高深度网络表现不差于低深度网络。这样,以后可以在计算能力可以的情况下,可以增加任意多层。
附加的问题和结果:
最大训练到152层(ImageNet)和1000层(CIFAR-10)。
计算量并没有大很多。参数也是。
实验表现很好,包括ImageNet(达到3.57%的top 5错误率,拿了第一名),COCO(提升28%左右)。
其他:
文章里主要和VGG plain网络进行对比。
参考翻译的一篇文章:
https://blog.csdn.net/wspba/article/details/57074389
#论文 《Deep Residual Learning for Image Recognition》相关推荐
- 经典DL论文研读(part4)--ImageNet Classification with Deep Convolutional Neural Networks
学习笔记,仅供参考,有错必纠 文章目录 ImageNet Classification with Deep Convolutional Neural Networks 摘要 Introduction ...
- 《每日论文》ImageNet Classification with Deep Convolutional Neural Networks
这篇论文是剖析 CNN 领域的经典之作,也是入门 CNN 的必读论文.作者训练了一个面向数量为 1.2 百万的高分辨率的图像数据集 ImageNet, 图像的种类为 1000 种的深度卷积神经网络. ...
- AlexNet论文翻译(中英文对照版)-ImageNet Classification with Deep Convolutional Neural Networks
图像分类经典论文翻译汇总:[翻译汇总] 翻译pdf文件下载:[下载地址] 此版为中英文对照版,纯中文版请稳步:[AlexNet纯中文版] ImageNet Classification with De ...
- ImageNet Classification with Deep Convolutional Neural Networks论文翻译——中文版
文章作者:Tyan 博客:noahsnail.com | CSDN | 简书 翻译论文汇总:https://github.com/SnailTyan/deep-learning-papers- ...
- 论文《ImageNet Classification with Deep Convolutional Neural Networks》阅读及AlexNet的Tensorflow2复现
论文<ImageNet Classification with Deep Convolutional Neural Networks>阅读及AlexNet的Tensorflow2复现 论文 ...
- ImageNet Classification with Deep Convolutional Neural Networks论文翻译——中英文对照
文章作者:Tyan 博客:noahsnail.com | CSDN | 简书 翻译论文汇总:https://github.com/SnailTyan/deep-learning-papers- ...
- 论文研读 —— 6. ImageNet Classification with Deep Convolutional Neural Networks (1/3)
文章目录 Authors and Publishment Authors Bibtex Abstract 1. Introduction 2. The Dataset Authors and Publ ...
- 《ImageNet Classification with Deep Convolutional Neural Networks》翻译
1 引言 2 数据集 3 架构 3.1 ReLU 非线性 3.2 训练多个GPU 3.3 局部响应归一化 3.4 重叠池化 3.5 整体架构 4 减少过拟合 4.1 数据增强 4.2 Dropout ...
- 论文研读 —— 6. ImageNet Classification with Deep Convolutional Neural Networks (2/3)
文章目录 3. The Architecture 3.1. ReLU Nonlinearity 3.2. Training on Multiple GPUs 3.3. Local Response N ...
- 论文研读 —— 6. ImageNet Classification with Deep Convolutional Neural Networks (3/3)
文章目录 6. Results 6.1. Qualitative Evaluations 7. Discussion References 6. Results Our results on ILSV ...
最新文章
- Android 实现一个验证码倒计时(Handler postDelayed 实现验证码倒计时)
- 50个Android开发人员必备UI效果源码[转载]
- 使用FlowDroid生成Android应用程序的函数调用图
- JavaScript基础之Array对象和Boolean对象
- FPGA_EP2C8T144_SCH(PDF)
- 【小程序源码】修复图片音频全新升级带特效神器小游戏微信小程序源码下载-多种游戏支持
- 率辉考研oj——1323: 算法2-1:集合union
- Maven下载安装及修改setting内容
- Windows下进行域名映射并配置Nginx反向代理
- 高通量测序领域常用名词解释
- 加菲猫经典语录(二十二条,中英文对照)
- 安费诺面试经验(已面试,等通知)
- Batch Normalization 批归一化是什么? 有什么用?
- Windows上安装MySQL数据库(完整版)
- UML组件视图、部署图、包图简要说明
- python登录微信客户端_命令行下的微信客户端
- 纳税服务系统【系统、子系统首页】
- 盘点中国最牛的五个程序员,有一个年薪上亿,有一个身家上千亿
- JavaScript严格模式约束规则
- cs231n笔记:lecture2,lecture3
热门文章
- php用存储过程插入数据,如何使用php-webservice使用android中的存储过程将数据插入sql数据库[duplicate]...
- php 模板使用,TMDPHP 模板引擎使用教程
- ubuntu12.04 更新内核
- 百度地图海量点清除(始终保留最新的点)
- oracle经常开关好吗,oracle启动和关闭
- mysql主从位点保存时间_MySQL主从备份
- multiple root tags怎么解决_手机ROOT后交管12123打不开怎么解决;EdXposed使用QX模块微X教程...
- python定义字典列表_[Python基础]五、列表、元组和字典
- java 判断 年份,java怎么判断指定年份是否是闰年
- 诚毅学院全国计算机考试,集美大学2017年9月全国计算机等级考试报名时间