原文:http://www.ithao123.cn/content-8359874.html

摘要-今年的 CVPR 非常的火爆,总共有2800多人参与,相比去年增加了700多人,这与deep learning的异军突起是不无关系的。CVPR 2015 基本是 “the year of deep learning”,有大概70%的文章是关于deep learning的。

今年的 CVPR 非常的火爆,总共有2800多人参与,相比去年增加了700多人,这与deep learning的异军突起是不无关系的。CVPR 2015 基本是 “the year of deep learning”,有大概70%的文章是关于deep learning的。大会请来了2位 keynote speakers: 计算机学家 Yann LuCun (NYU, Facebook) 和 心理学家、神经学家 Jack Gallan (Berkeley)。 Yann是公认的 Convolutional Neural Network (CNN) 之父,而Jack是为数不多的神经学领域看好deep learning的科学家,他用实验显示了ConvNets不同层和 visual cortex (视觉皮层) 不同层 它们之间的相关性。

显然,deep learning在工程和科学领域都引起了不小的轰动,不过既然CVPR是一个工程领域会议,我们就先聊聊deep learning在工程领域过去2年的进展。

AlexNet和VGG-Net也成为约定俗成的术语

在过去的十年里,SVM,SIFT,HOG 已成为计算机视觉学者人人皆知的名词,每个计算机视觉学者直接把它们当作专有名词写进文章,而不需要加以解释,甚至到后来也不用注明出处。今年的 CVPR, 由于过去2年 deep learning 在 computer vision 的很多问题上取得了state-of-the-art 的结果,使得这2种 deep architectures: AlexNet & VGG-Net, 成为一个约定俗成的专有名词,大家开始在文中广泛的使用它们,就如大家以前广泛使用 HOG,SVM一样。

AlexNet和VGG-Net 的起源与network结构

AlexNet 是一种典型的 convolutional neural network,它由5层 convolutional layer,2层 fully connected layer,和最后一层 label layer (1000个node, 每个node代表ImageNet中的一个类别) 组成。2012年,deep learning的大牛教授 Geoffrey Hinton (University of Toronto, Google) 的学生Alex Krizhevsky 设计了一个8层的CNN,并把它用于ImageNet的image classification,直接把当时最好算法的错误率差不多减半。这引起了computer vision community 的强烈关注。这篇文章的出现也是 deep learning 开始被 computer vision community 接受的关键转折点。如是后来大家把这个8层的CNN命名为AlexNet。

VGG-Net同样也是一种CNN,它来自 Andrew Zisserman 教授的组 (Oxford),VGG-Net 在2014年的 ILSVRC localization and classification 两个问题上分别取得了第一名和第二名,VGG-Net不同于AlexNet的地方是:VGG-Net使用更多的层,通常有16-19层,而AlexNet只有8层。另外一个不同的地方是:VGG-Net的所有 convolutional layer 使用同样大小的 convolutional filter,大小为 3 x 3。

AlexNet和VGG-Net 中的 feature

Deep learning 实际上是一种 feature engineering 的方法。不论是AlexNet还是VGG-Net,倒数第二层都可以很好的描述image全局特征,所以它们通常用来当作 input image 新的 feature,用来做 image classification(最后一层N个node的softmax层,代表了N个类别)。那么, AlexNet 和 VGG-Net 的 intermediate layer(中间层)呢? 他们是否也可以作为特征来使用? 答案是肯定的。 这些 intermediate convolutional layer 描述了影像的 local feature (局部特征),而最后的几层(倒数第二、第三层) fully connected layer,描述了影像的 global feature (全局特征)。如果一个 deep architecture 只有 convolutional layer, 那么 input image 可以任意大小,可是一旦在convolutional layer 上面叠加上 fully connected layer,input image大小就需要固定了。今年CVPR有好多文章使用 convolutionally filtered intermediate layer 作为 local feature,典型的代表有 Jitendra Malik (Berkeley) 组的 Hypercolumns for Object Segmentation and Fine-grained Localization,Xiaoou Tang (CUHK) 组的 Action Recognition With Trajectory-Pooled Deep-Convolutional Descriptors。

AlexNet 和 VGG-Net的区别相关推荐

  1. 《动手学深度学习》(四) -- LeNet、AlexNet、VGG、NiN、GoogLeNet、ResNet、DenseNet 实现

    上一小节学习了卷积神经网络的卷积层和池化层的实现,趁热打铁继续学习现代卷积神经网络的搭建,欢迎小伙伴们一起学习和交流~ 为了能够应⽤softmax回归和多层感知机,我们⾸先将每个⼤小为28×2828 ...

  2. 一文读懂LeNet、AlexNet、VGG、GoogleNet、ResNet到底是什么?

    READING is better than SEX 文章目录 READING is better than SEX 什么是CNN? LeNet AlexNet VGG GoogLeNet ResNe ...

  3. Alexnet_经典的CNN模型架构-LeNet、AlexNet、VGG、GoogleLeNet、ResNet

    本文将引入 ImageNet图像数据库,并介绍以下几种经典的CNN模型架构: LeNet.AlexNet.VGG.GoogleLeNet.ResNet 1.ImageNet介绍 ImageNet是一个 ...

  4. 41_经典卷积网络、LeNet、AlexNet、VGG、GoogleNet、ResNet、NIN、DenseNet、EfficientNet、MobileNetV1/2/3、SENet等

    1.38.经典卷积网络 1.38.1.LeNet 1.38.1.1.介绍 1.38.1.2.网络结构 1.38.1.3.代码实现 1.38.2.AlexNet 1.38.2.1.介绍 1.38.2.2 ...

  5. Pytorch之CNN:基于Pytorch框架实现经典卷积神经网络的算法(LeNet、AlexNet、VGG、NIN、GoogleNet、ResNet)——从代码认知CNN经典架构

    Pytorch之CNN:基于Pytorch框架实现经典卷积神经网络的算法(LeNet.AlexNet.VGG.NIN.GoogleNet.ResNet)--从代码认知CNN经典架构 目录 CNN经典算 ...

  6. 【知识星球】LeNet5,AlexNet,VGG,MobileNet它们的前身都是什么,你知道吗?

    文/编辑 | 言有三 正所谓读史使人明智,没有一个经典的网络模型是突然之间冒出来的,都是厚积薄发的结果,我们会在知识星球每天更新一篇网络结构设计的文章,现在先来测试大家一下: LeNet5,AlexN ...

  7. 【LeNet、AlexNet、VGG】

    LeNet   LeNet是最早用于图像处理的神经网络,主要是为了解决手写数字识别的问题,著名的数据集Minist就是伴随着LeNet的诞生而出现的.下面是其基本架构:   其结构相对简单,其中的Po ...

  8. 图像分类经典神经网络大总结(AlexNet、VGG 、GoogLeNet 、ResNet、 DenseNet、SENet、ResNeXt )

    前言 在CNN网络结构的演化上,出现过许多优秀的CNN网络,CNN的经典结构始于1998年的LeNet,成于2012年历史性的AlexNet,从此盛于图像相关领域. 发展历史:Lenet --> ...

  9. AlexNet、VGG、GoogLeNet、ReaNet、MobileNet、ShuffleNet和EfficientNet网络的亮点和创新之处

    目录 AlexNet网络 VGG网络 GoogLeNet网络 ReaNet网络 MobileNet 网络 MobileNet v1网络 MobileNet v2网络 MobileNet v3网络 Sh ...

  10. AlexNet、VGG、GoogleNet学习笔记

    1. 深度学习奠基作:AlexNet AlexNet 赢得了2012年ILSVRC 2012(ImageNet Large Scale Visual Recognition Challenge)竞赛, ...

最新文章

  1. 浅谈 javascript 中的this绑定问题
  2. RPC框架原理及从零实现系列博客(二):11个类实现简单RPC框架
  3. react 合并数组_React快速上手
  4. Boost:基于Boost的一个微小的actor框架
  5. QT的QDateTimeEdit类的使用
  6. ---WebCam网络摄像头9 usb dirver
  7. Spring容器中导入组件方式
  8. [2011山东ACM省赛] Identifiers(模拟)
  9. 在.net3.5中使用ListView控件和DataPager控件笔记
  10. jenkins构建触发器定时任务
  11. java8 streams_Java 8 Streams API作为友好的ForkJoinPool外观
  12. JAVA入门级教学之(abstract抽象类)
  13. 12306验证码为什么那么变态?都是这项深度学习应用给逼的
  14. C语言实现的Python扩展模块
  15. day10.函数,函数的参数
  16. css鼠标移上去向上移动,css3鼠标移动图片上移效果
  17. 熟练运用计算机的重要性,计算机专业实习目的和意义
  18. ffmpeg:将webm无损转为mp4
  19. [prolog 基础系列] Prolog 的使用以及 Knowledge Base
  20. Python OpenCV 图片滑块验证码 滑块图片验证码 快速自动识别方案 代码简单 模板匹配识别 识别成功率达90%+

热门文章

  1. 大学生拍照搜题_大学生心理健康教育知识,请问:这个考试有没有找答案软件?...
  2. assignment symbolic automaton verilog设计
  3. frontpage编辑html,怎样用FrontPage软件编辑HTML帖子 | 音画代码学堂 - 中国音画家园 - Po...****...
  4. css3个性loading,css3 中实现炫酷的loading效果
  5. linux 网络服务器 源码下载,linux下 各类tcp网络服务器的实现源代码.doc
  6. java mouselistener,Java MouseListener接口
  7. matlab机械臂工作空间代码_老外研发模拟肌肉运动的机械臂,与人类协同工作动作完美同步...
  8. css 商城 两列_CSS 居中?来一探究竟
  9. django 用户管理相关的表
  10. 跟随光标下划线导航插件