Very Deep Convolutional Networks for Large-Scale Image Recognition

ICLR 2015 (oral)

http://www.robots.ox.ac.uk/~vgg/research/very_deep/

本文针对 AlexNet 的改进主要集中在 网络的深度, depth。通过固定其他网络的结构和参数,来增加网络的深度(通过使用3*3的 小卷积滤波器来增加网络深度),得到很好的效果。

2 ConvNet Configurations
主要参考 AlexNet 网络,便于后续的对比。
2.1 Architecture
训练的输入是固定图像尺寸 224*224 的 RGB图像,唯一的预处理是每个像素减去训练集图像上RGB均值,图像经过一系列卷积层,这里我们使用很小的感受野 3*3。其中一个网络结构我们也使用了 1*1 滤波器,可以被看做是输入的线性变换。卷积步长固定为1个像素,通过填充使得卷积后的输出尺寸和输入尺寸一样大小,对于3*3卷积滤波器,周边分别填充一个像素。有5个最大池化层,采用 2*2 池化窗口,步长为 2。

卷积层(不同网络结构,卷积层数不一样)之后是3个全链接层,前两层有4096个通道,第三层有1000通道对应 ILSVRC分类中的1000类。网络最后一层是soft-max 层。所有网络结构的全链接层是一样的。

所有的隐层神经元都经过 ReLU 非线性处理,我们这里除了一个网络结构外没有采用 AlexNet 中的归一化 Local Response Normalisation (LRN),主要是因为我们发现它对 ILSVRC上数据没有性能改善,但是却增加了内存消耗和计算时间。当需要使用 LRN 时,可以使用 AlexNet 中关于 LRN 的参数。

2.2 Configurations
这里我们一共尝试了 6 个网络结构,主要差异在卷积层数,配置如下:

2.3 Discussion
这里我们网络结构和 AlexNet 以及其他网络模型中最大的不同是我们第一卷积层中的滤波器尺寸很小 3*3,其他的 都是 11*11 或 7*7 。此外我们网络其他层的滤波器都是 3*3大小。很容易发现两个 3*3 的卷积滤波器 (相邻不做空间池化)对应 5*5 的感受野。三个 3*3 对应 7*7 感受野。那么为什么这么做了?首先我们嵌入了三个非线性矫正层而不是一个,这么做增加了决策函数的表达能力。其次是降低参数的数量,假定三个叠加的3*3卷积层的输入输出都是 C 通道,那么一共有 3(3*3*C*C)=27*C*C个权值参数,而一个 7*7卷积层有 7*7*C*C= 49*C*C个参数。 所以参数总量降低了。

我们在 C 网络结构中嵌入了 1*1 卷积层,这可以增加决策函数的非线性表达能力而不影响卷积层的感受野。1*1卷积尽管是一个线性变换,但是因为引入了非线性激活函数,所以增加了非线性表达能力。我们可以看到最近提出的 Network in Network 网络结构就是利用了 1*1 卷积层。

在CNN网络中使用小尺寸卷积滤波器在其他文献已经存在,其中2014年提出的 GoogleNet 和我们类似,大量使用了小滤波器,但是它的网络拓扑结构更加的复杂。我们单个网络分类精度要高于GoogleNet。

3 Classificiaton Framework
3.1 Training
训练流程基本和 AlexNet 一样,文献也给出了一些参数设置。 其中参数的初始化,我们首先通过随机初始化训练了一个 A 网络,然后用 A 网络的参数 来初始化其他网络进行训练。

下面是一些测试结果:

上图主要是对比不同网络层数对精度的影响。


多尺度的影响

VGG - Very Deep Convolutional Networks for Large-Scale Image Recognition相关推荐

  1. 《Very Deep Convolutional Networks For Large-Scale Image Recognition》翻译

    1 引言 2 ConvNet配置 2.1 架构 2.2 配置 2.3 讨论 3 分类框架 3.1 训练 3.2 测试 3.3 实现细节 4 分类实验 4.1 单尺度评估 4.2 多尺度评估 4.3 多 ...

  2. 论文笔记 Very Deep Convolutional Networks for Large-Scale Visual Recognition - ICLR 2014

    VGG Very Deep Convolutional Networks for Large-Scale Visual Recognition Karen Simonyan and Andrew Zi ...

  3. Very Deep Convolutional Networks for Large-Scale Image Recognition—VGG论文翻译—中文版

    文章作者:Tyan 博客:noahsnail.com  |  CSDN  |  简书 声明:作者翻译论文仅为学习,如有侵权请联系作者删除博文,谢谢! 翻译论文汇总:https://github.com ...

  4. 《Very Deep Convolutional Networks for Large-Scale Image Recognition》——VGG论文总结

    题目 <Very Deep Convolutional Networks for Large-Scale Image Recognition> 简介 Abstract In this wo ...

  5. 【论文翻译】VGG网络论文中英对照翻译--(very deep convolutional networks for large-scale image  recognition)

    [开始时间]2018.09.23 [完成时间]2018.09.24 [论文翻译]VGG网络论文中英对照翻译--(very deep convolutional networks for large-s ...

  6. VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION(VGG网络)-论文阅读笔记

    VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION VGG网络 论文阅读笔记 //2022.4.11上午9:53开始阅 ...

  7. 论文笔记:Very deep convolutional networks for large-scale image recognition(VGG)

    一.基本信息 标题:Very deep convolutional networks for large-scale image recognition 时间:2014 出版源:arXiv 论文领域: ...

  8. VGGNet论文翻译-Very Deep Convolutional Networks for Large-Scale Image Recognition

    Very Deep Convolutional Networks for Large-Scale Image Recognition Karen Simonyan[‡] & Andrew Zi ...

  9. Very Deep Convolutional Networks for Large-Scale Image Recognition—中英文对照

    文章作者:Tyan 博客:noahsnail.com  |  CSDN  |  简书 翻译论文汇总:https://github.com/SnailTyan/deep-learning-papers- ...

最新文章

  1. C++中sizeof问题
  2. Dataset之Handwritten Digits:Handwritten Digits(手写数字图片识别)数据集简介、安装、使用方法之详细攻略
  3. 构建Android的交叉编译器、用NDK编译移植
  4. 红黑树的删除_深入理解红黑树
  5. 《蓝色协议BLUE PROTOCOL》技术分享解读
  6. python才能做爬虫,No,C#也可以!
  7. algorithm design manual: 8-19
  8. spring mvc 学习 转载
  9. 立体匹配算法(局部立体匹配 、全局立体匹配 、深度学习立体匹配 )
  10. 高德Mapabc地图标注 基础篇
  11. html怎么使表格居中,html怎么使表格居中
  12. 三国志战略版:先锋斥候广州行
  13. 《剑破武林》用户注册协议
  14. postgres 导入纯文本数据txt
  15. 什么是EOS(柚子)
  16. 【Linux网络编程】epoll进阶之水平模式和边沿模式
  17. 基于H5+js开发一款音乐播放器
  18. RecyclerView 配合 DiffUtil,RecyclerView局部刷新
  19. 常见条码碳带质量问题有哪些影响?
  20. Android am和pm命令

热门文章

  1. 用于分子生成的数据高效性图语法学习
  2. Machine Learning | (12) 非监督学习-k-means
  3. Win10+Python3.6下Pytorch安装(基于conda或pip)
  4. 附录1:python记事本
  5. 用Python解析AndroidManifest.xml文件找MainActivity
  6. ansys选择一个面上所有节点_如何使用ANSYS经典界面的选择工具
  7. 正定小主人机器人_石家庄正定县2015中小学生机器人运动大赛隆重开幕
  8. QIIME 2教程. 32如何写方法和引用Citing(2021.2)
  9. 最后一周报名微生物组-宏基因组分析(线上/线下同步开课,2020最后一期)
  10. 单词不用背,学完自然会!”这个方法,你知道越早越好!