Resnet 网络结构的理解以及论文
Resnet是ImageNet竞赛中分类问题比较好的网络,它有多种结构形式,有Resnet-34,Resnet-50, Resnet-101, Resnet-152.
github上的caffe网络结构的prototxt地址:https://github.com/antingshen/resnet-protofiles
先说一下残差表示:VLAD是一种通过关于字典的残差向量进行编码的表示形式。
残差学习:H(x) 作为几个堆叠层(不必是整个网络)要拟合的基础映射,x表示这些层中第一层的输入。假设多个非线性层可以渐近地近似复杂函数,它等价于假设它们可以渐近地近似残差函数,即H(x)−x(假设输入输出是相同维度)。因此,我们明确让这些层近似参数函数 F(x):=H(x)−x,而不是期望堆叠层近似H(x)。因此原始函数变为F(x)+x。
快捷恒等映射:我们每隔几个堆叠层采用残差学习。构建块如图2所示。在本文中我们考虑构建块正式定义为:
y=F(x,Wi)+x (1)
x和y是考虑的层的输入和输出向量。函数F(x,Wi)表示要学习的残差映射。图2中的例子有两层,F=W2σ(W1x)中σ表示ReLU,为了简化写法忽略偏置项。F+x操作通过快捷连接和各个元素相加来执行。在相加之后我们采纳了第二种非线性(即σ(y))。
公式(1)中的快捷连接既没有引入外部参数又没有增加计算复杂度。这不仅在实践中有吸引力,而且在简单网络和残差网络的比较中也很重要。我们可以公平地比较同时具有相同数量的参数,相同深度,宽度和计算成本的简单/残差网络(除了不可忽略的元素加法之外)。
方程(1)中x和F的维度必须是相等的。如果不是这种情况(例如,当更改输入/输出通道时),我们可以通过快捷连接执行线性投影Ws来匹配维度:
y=F(x,Wi)+Wsx.
我们也可以使用方程(1)中的方阵Ws。但是我们将通过实验表明,恒等映射足以解决退化问题,并且是合算的,因此Ws仅在匹配维度时使用。
残差函数F的形式是可变的。本文中的实验包括有两层或三层的函数F,同时可能有更多的层。但如果F只有一层,方程(1)类似于线性层:y=W1x+x,我们没有看到优势。
Resnet是每隔二层或三层进行的相加求下一步的输入,这是与VGG网络不同的,VGG主要是直接进行卷积,送入到下一层,同时每一层的核大小都是固定的,Resnet里面也采用了。Resnet网络结构的设计遵循两种设计规则:(1)对于相同的输出特征图尺寸,层具有相同数量的滤波器;(2)如果特征图大小减半,则滤波器的数量加倍,以便保持每一层的时间复杂度。
使用快捷连接要保证输入和输出具有相同的维度。当我们在进行两种维度的跨越进行连接的时候,有两种方式可以进行,第一种额外的进行填充零输入,增加维度;第二种方式:用1x1卷积核,步长为2。
这里有对Resnet论文Deep Residual Learning for Image Recognition的翻译,大家可以看看。
原文:https://arxiv.org/pdf/1512.03385.pdf
翻译:https://blog.csdn.net/Quincuntial/article/details/77263562?locationNum=6
还有可以看看的:https://blog.csdn.net/u011534057/article/details/51819968
Resnet 网络结构的理解以及论文相关推荐
- ResNet网络结构详解,网络搭建,迁移学习
前言: 参考内容来自up:6.1 ResNet网络结构,BN以及迁移学习详解_哔哩哔哩_bilibili up的代码和ppt:https://github.com/WZMIAOMIAO/deep-le ...
- pytorch图像分类篇:6. ResNet网络结构详解与迁移学习简介
前言 最近在b站发现了一个非常好的 计算机视觉 + pytorch 的教程,相见恨晚,能让初学者少走很多弯路. 因此决定按着up给的教程路线:图像分类→目标检测→-一步步学习用pytorch实现深度学 ...
- ResNet网络结构,BN以及迁移学习详解
看b站up主霹雳吧啦Wz视频,以及一些文章参考,所做笔计 链接: 6.1 ResNet网络结构,BN以及迁移学习详解_哔哩哔哩_bilibili 深度学习之残差神经网络(ResNet) - 知乎 (z ...
- ResNet网络结构的搭建(一)
目录 1.基本结构:BasicBlock和BottleNeck 2.构建ResNet网络 3.完整代码 代码部分参考b站视频 1.基本结构:BasicBlock和BottleNeck ResNet中最 ...
- 机器阅读理解MRC论文整理
机器阅读理解MRC论文整理 最近发现一篇机器阅读理解整理的博客机器阅读理解整理整理于2020年 论文代码查找网站: https://dblp.uni-trier.de/db/conf/acl/acl2 ...
- WWW2021: AutoSTG面向时空图预测的神经网络结构搜索(附论文链接)
近年来,随着智能城市建设的大力推进,学术界和工业界开始出现大量关于城市时空数据分析与挖掘的研究工作.面向城市中不同时空预测任务(如交通流量预测.区域客流量预测等),京东智能城市时空AI团队也已提出一系 ...
- cnn卷积过程,通道数,《6.1 ResNet网络结构,BN以及迁移学习详解》
6.1 ResNet网络结构,BN以及迁移学习详解_哔哩哔哩_bilibili CNN科普讲解:李宏毅讲解卷积神经网络(带字幕)_哔哩哔哩_bilibili 1.图像中的RGBpython rgb 图 ...
- resnet50网络结构_学习笔记(一):分析resnet源码理解resnet网络结构
最近在跑实验的过程中一直在使用resnet50和resnet34,为了弄清楚网络的结构和原理的实现,打开resnet的源码进行了学习. 残差网络学习的原理 针对神经网络过深而导致的学习准确率饱和甚至是 ...
- resnet结构_ResNet 残差网络论文阅读及示例代码
论文阅读 其实论文的思想在今天看来是不难的,不过在当时 ResNet 提出的时候可是横扫了各大分类任务,这个网络解决了随着网络的加深,分类的准确率不升反降的问题.通过一个名叫"残差" ...
- 【视频理解】论文串讲
视频理解论文串讲 2020-视频理解综述-A Comprehensive Study of Deep Video Action Recognition 2014-CVPR-Large-scale Vi ...
最新文章
- Xamarin.Forms教程Android SDK工具下载安装
- es6-promise源码重点分析难点解析
- 左连接 和右链接的区别,内连接和外连接的区别
- 《黑天鹅》读书笔记(part1)--我们把自己知道的东西太当回事了
- php图片左右滚动代码怎么写,css图片滚动代码怎么写?轮播图横向滚动展示
- 学习笔记之12个月提升计划
- 面试官让我讲讲Java中的锁,我笑了
- socket websocket
- Nodejs ORM框架Sequelize
- 如何使用gcc编译器
- 基于Linux的系统的文件/文件夹的权限
- VS2017官方下载链接
- 【UG NX MCD 机电一体化概念设计】UG NX MCD+PLCSIM Advanced联合仿真实例(二 )仿真序列
- PCD文件格式的转换
- 《计算机网络原理》IP部分
- 免费在线http代理
- 18项政策奖励助力武汉加快区域金融中心建设,申报奖励以及申报流程汇总
- [调研] 人脸/车牌脱敏 调研
- 计算机论文致谢词范文500字,论文致谢词范文
- Solr Replication
热门文章
- MCSA Windows Server 2016 Complete Study Guide, 2nd Edition 免积分下载
- jQuery 版本升级迁移
- php 爬虫 执行js,使用PyV8在Python爬虫中执行js代码
- SFM图像三维重建(二)
- 软件测试的重要性与必要性,软件测试的目的和意义
- c语言编程软件支持win8,C语言编程软件vc6.0(支持win7 / win8 / 10)官方免费版6.0
- 【hexo】fluid中文乱码问题解决
- 将本地数据库中的数据上传到云服务器数据库
- C++ 读写TXT文件
- ICode python 3级训练场判断能量状态第19关