VGGNet与GoogLeNet

  • VGGNet
    • VGG16
  • GoogLeNet
    • Inceptionv1 (test error 6.67% )
    • Inceptionv2 (test error 4.8% )
    • Inceptionv3 (test error 3.5% )
    • Inceptionv4 (test error 3.08% )

VGGNet

VGGNet 是由牛津大学著名研究组(Visual Geometry Group)提出
网络亮点:通过堆叠多个3*3的卷积核来代替大尺度卷积核(减少所需参数)
论文中提到,可以通过堆叠两个3x3的卷积核代替5x5的卷积核,堆叠三个3x3的卷积核代替7x7的卷积核,因为都拥有相同的感受野

原文中关于3x3卷积核可以代替7x7卷积核的论述

VGG16

经典的VGG16网络结构
VGG16经常作为一些网络的预训练模型或者目标检测网络的backbone,十分重要

一般采用D结构,也就是VGG16,为什么叫VGG16呢,因为这个网络中的卷积层+全连接层一共16个,其中Conv3代表卷积核kernal size为3,stride为1,padding为1,这样保证卷积层输出的Feature map尺寸不变, Maxpool的kernal size为2,stride为2,保证输出的feature map尺寸缩减为原来的一半
如E结构,就叫做VGG19

GoogLeNet

GoogLeNet在2014年由Google团队提出,斩获当年ImageNet竞赛中Classification Task第一名(VGG是同年第二名)

网络亮点:
1. 引入Inception结构(融入不同尺度的特征信息,即融合不同尺寸的感受野)

2. 使用1x1的卷积核进行降维以及映射处理

3. 添加两个辅助分类器帮助训练
在训练时,这两个分类器的损失会以0.3的比例添加到损失函数上。根据论文的解释,该分支有两个作用:

  • 保证较低层提取的特征也有分类物体的能力;
  • 具有提供正则化并克服梯度消失问题的能力;

需要注意的是,在测试的时候,这两个softmax分支会被移除。

辅助分类器结构

4. 丢弃了全连接层,使用全局平均池化(GAP),大大减少了网络参数数量

其实最大的亮点就是Inception模块,这里我在整理的时候,发现了一个CNN网络的进化演变过程,放在这里供大家了解一下

Inception模块是GoogLeNet最大的亮点,它由最初的v1版本已经演化到现在的v4版本

Inceptionv1 (test error 6.67% )

Inception module 的提出主要考虑多个不同 size 的卷积核能够增强网络的适应力,paper 中分别使用1x1、3x3、5x5卷积核,同时加入3x3 max pooling。1x1卷积主要起到降维作用,从而减少网络参数

针对Inception module中的Filter concatenation操作其实就是将每一个分支的输出的Feature map 在channel层上进行叠加(相加)

Inceptionv2 (test error 4.8% )

Inceptionv2 提出了Batch Normalization,代替 Dropout 和 LRN,其正则化的效果让大型卷积网络的训练速度加快很多倍,同时收敛后的分类准确率也可以得到大幅提高,同时学习 VGG 使用两个3x3的卷积核代替5x5的卷积核,在降低参数量同时提高网络学习能力;

Inceptionv3 (test error 3.5% )

Inceptionv3引入了 Factorization,将一个较大的二维卷积拆成两个较小的一维卷积,比如将3x3卷积拆成1x3卷积和3x1卷积,这样做的好处是:

  • 节约了大量参数,提升了训练速度并减轻了过拟合
  • 多层卷积增加了模型的拟合能力
  • 非对称卷积核的使用增加了特征的多样性。
  • 除了在 Inception Module 中使用分支,还在分支中使用了分支(Network In Network );

Inceptionv4 (test error 3.08% )

Inceptionv4研究了 Inception Module 结合 Residual Connection,即相当于在Inception中加入一条输入到输出的short cut。结合 ResNet 可以极大地加速训练,同时极大提升性能,在构建 Inception-ResNet 网络同时,还设计了一个更深更优化的 Inception v4 模型,能达到相媲美的性能

VGGNet 与 GoogLeNet相关推荐

  1. 【AI面试题】AlexNet、VGGNet、GoogLeNet,ResNet等网络之间的区别是什么

    AlexNet: AlexNet相比传统的CNN,主要改动包括Data Augmentation(数据增强).Dropout方法,激活函数用ReLU代替了传统的Tanh或者Siigmoid.采用了Lo ...

  2. 卷积神经网络常见架构AlexNet、ZFNet、VGGNet、GoogleNet和ResNet模型

    目前的常见的卷积网络结构有AlexNet.ZF Net.VGGNet.Inception.ResNet等等,接下来我们对这些架构一一详解. LeNet-5 LeNet-5模型诞生于1998年,是Yan ...

  3. VGGNet 阅读理解 - Very Deep Convolutional Networks for Large-Scale Image Recognition

    论文理解 - VGGNet - Very Deep Convolutional Networks for Large-Scale Image Recognition [VGG-Paper] [原文地址 ...

  4. 第5章 图像分类的数据集

    第5章图像分类的数据集 在我们实际进入到代码编写阶段来构建分类器之前,我们首先回顾下在本书中用到的数据集.一些数据集可理想的获得大于95%的准确率,另一些则还在开放研究阶段,还有一些是图像分类竞赛的部 ...

  5. 告别低分辨率网络,微软提出高分辨率深度神经网络HRNet | CVPR 2019

    来源 | 微软研究院AI头条(ID:MSRAsia) 作者简介:孙可,中国科学技术大学信息学院在读博士生,目前在微软亚洲研究院视觉计算组实习,导师是王井东和肖斌老师.他的研究兴趣包括人体姿态估计.语义 ...

  6. 首发 | 旷视14篇CVPR 2019论文,都有哪些亮点?

    译者 | Linstancy 责编 | Jane 出品 | AI科技大本营(公众号id:rgznai100) 回顾 CVPR 2018 ,旷视科技有 8 篇论文被收录,如高效的移动端卷积神经网络 Sh ...

  7. ResNet及其变体结构梳理与总结

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 [导读]2020年,在各大CV顶会上又出现了许多基于ResNet改 ...

  8. 目标检测--DSOD: Learning Deeply Supervised Object Detectors from Scratch

    DSOD: Learning Deeply Supervised Object Detectors from Scratch ICCV2017 https://github.com/szq0214/D ...

  9. 网络模型 Inception V2/V3-Rethinking the Inception Architecture for Computer Vision

    https://github.com/Moodstocks/inception-v3.torch 本文是对 GoogleNet 网络模型 Inception 架构的重思考和改进,Inception V ...

最新文章

  1. @程序员,如何“终身成长”与跨界?
  2. iOS自定义控件:简易下拉控件
  3. php 删除 r n,PHP去除换行符'/r/n'回车换行与PHP_EOL变量的使用
  4. C#简易通讯录的开发试题
  5. css 字体倾斜_css笔记3(文本,列表,背景声明)
  6. Selenium +Java自动化环境安装
  7. html 两个idv上下居中,Django搭建个人博客:回到顶部浮动按钮、矢量图标、页脚沉底和粘性侧边栏...
  8. new Image().src资源重复请求问题
  9. 不同浏览器中手动启用Flash Player
  10. 个人微信api接口调用,微信好友收发消息
  11. c语言 游程编码,游程编码C语言.doc
  12. Freeradius认证
  13. 介绍一个牛人的机器学习PPT
  14. 两条纵坐标折线图绘制
  15. linux为什么不能配置网络打印机,linux配置网络打印机
  16. pythonifelse简化_简化“if…elif..else”条件
  17. sega+model+3+android,新人求SEGA model3模拟器的键位设置的详细教程
  18. 【元宇宙】2021科技行业三大“神话”:元宇宙、NFT、Web3
  19. python中uniform函数_python scipy stats.uniform用法及代码示例
  20. Sovrin 白皮书:第五部分 - 影响

热门文章

  1. IELTS-Writing Exercises: Tak2:Aging society
  2. 解决flex布局导致图片变形
  3. 登陆到虚拟机查看目前服务器开放的端口,查看虚拟机开放端口号
  4. h5底部输入框被键盘遮挡_H5 键盘兼容性小结
  5. 1092: 【入门】时间的差! 题解
  6. 全志D1-H芯片 如何移植 rtl8821cu wifi 驱动到 Linux-5.4内核?
  7. JAVA如何在线程中加锁(四种方法)
  8. python大数据运维工程师_【大数据科普系列之二】大数据运维工程师
  9. macOS修改主机名和计算机名
  10. Android 权限设置大全