网络架构

  • 这是论文中的图

PS:这个图的input尺寸应该是标错了??227*227*3吧??

上图中,其实能明显地看出上面一层和下面一层。上下两层各由一个GPU进行计算(其实是硬件条件补星2333)。这两个GPU只在固定的几层之间进行交流。

  • 一个易于计算的示意图

网络总共的层数为8层,5层卷积,3层全连接层。

  • 简化的图

  •  也有人理解成模块

其中前5模块四卷积模块,用于提取图片特征,后3个模块是全链接层,用于图像分类。

(1)第一、二模块

(2)第三、四模块

(3)第五模块

(4)第六模块

(5)第七、八模块

创新点

  • ReLu函数 ----------  f(x)=max(0,x)

什么是饱和函数?

基于ReLU的深度卷积网络比基于tanhsigmoid的网络训练快数倍,下图是一个基于CIFAR-10的四层卷积网络在tanh和ReLU达到25%的training error的迭代次数:

  • 标准化(Local Response Normalization)LRN

在神经网络中,我们用激活函数将神经元的输出做一个非线性映射,但是tanh和sigmoid这些传统的激活函数的值域都是有范围的,但是ReLU激活函数得到的值域没有一个区间,所以要对ReLU得到的结果进行归一化。也就是Local Response Normalization。局部响应归一化的方法如下面的公式:

表示输入的(x,y)位置做第i次卷积并通过relu单元的结果,而是对应的归一化相应结果。 n是指相同位置的第i 次前后附近的n次卷积,而N是总的卷积次数。而且,这个卷积核作用的次序是在训练前就已经定好了。实际上,这个局部响应归一化是模拟生物神经元的侧抑制作用,当前神经元的作用受附近神经元作用的抑制,这样我们就理解为何上图公式,在归一化阶段仅仅除以相同位置附近前后几次的神经元响应的平方,而不是N次结果响应的平方。

  • Dropout

​​​​​​​之前转载的一篇blog(理解dropout)

  • 数据增强(data augmentation​​​​​​​

在深度学习中,当数据量不够大时候,一般有4解决方法:

(1) data augmentation——人工增加训练集的大小——通过平移, 翻转, 加噪声等方法从已有数据中创造出一批"新"的数据

(2)Regularization——数据量比较小会导致模型过拟合, 使得训练误差很小而测试误差特别大. 通过在Loss Function 后面加上正则项可以抑制过拟合的产生. 缺点是引入了一个需要手动调整的hyper-parameter。

(3)Dropout——也是一种正则化手段. 不过跟以上不同的是它通过随机将部分神经元的输出置零来实现

(4) Unsupervised Pre-training——用Auto-Encoder或者RBM的卷积形式一层一层地做无监督预训练, 最后加上分类层做有监督的Fine-Tuning

参考

什么叫非线性处理单元,非饱和激活函数?

详解深度学习之经典网络架构(二):AlexNet 有代码实现

深入理解AlexNet网络​​​​​​​

深入理解AlexNet网络​​​​​​​

【AlexNet】ImageNet Classification with Deep Convolutional Neural Networks相关推荐

  1. AlexNet论文翻译(中英文对照版)-ImageNet Classification with Deep Convolutional Neural Networks

    图像分类经典论文翻译汇总:[翻译汇总] 翻译pdf文件下载:[下载地址] 此版为中英文对照版,纯中文版请稳步:[AlexNet纯中文版] ImageNet Classification with De ...

  2. 论文《ImageNet Classification with Deep Convolutional Neural Networks》阅读及AlexNet的Tensorflow2复现

    论文<ImageNet Classification with Deep Convolutional Neural Networks>阅读及AlexNet的Tensorflow2复现 论文 ...

  3. 经典DL论文研读(part4)--ImageNet Classification with Deep Convolutional Neural Networks

    学习笔记,仅供参考,有错必纠 文章目录 ImageNet Classification with Deep Convolutional Neural Networks 摘要 Introduction ...

  4. 《每日论文》ImageNet Classification with Deep Convolutional Neural Networks

    这篇论文是剖析 CNN 领域的经典之作,也是入门 CNN 的必读论文.作者训练了一个面向数量为 1.2 百万的高分辨率的图像数据集 ImageNet, 图像的种类为 1000 种的深度卷积神经网络. ...

  5. ImageNet Classification with Deep Convolutional Neural Networks论文翻译——中文版

    文章作者:Tyan 博客:noahsnail.com  |  CSDN  |  简书 翻译论文汇总:https://github.com/SnailTyan/deep-learning-papers- ...

  6. 论文研读 —— 6. ImageNet Classification with Deep Convolutional Neural Networks (1/3)

    文章目录 Authors and Publishment Authors Bibtex Abstract 1. Introduction 2. The Dataset Authors and Publ ...

  7. ImageNet Classification with Deep Convolutional Neural Networks论文翻译——中英文对照

    文章作者:Tyan 博客:noahsnail.com  |  CSDN  |  简书 翻译论文汇总:https://github.com/SnailTyan/deep-learning-papers- ...

  8. 《ImageNet Classification with Deep Convolutional Neural Networks》翻译

    1 引言 2 数据集 3 架构 3.1 ReLU 非线性 3.2 训练多个GPU 3.3 局部响应归一化 3.4 重叠池化 3.5 整体架构 4 减少过拟合 4.1 数据增强 4.2 Dropout ...

  9. 论文研读 —— 6. ImageNet Classification with Deep Convolutional Neural Networks (2/3)

    文章目录 3. The Architecture 3.1. ReLU Nonlinearity 3.2. Training on Multiple GPUs 3.3. Local Response N ...

最新文章

  1. 【案例】城市地址三级联动
  2. 博士在读却连矩阵的秩都搞不清,我该如何毕业?
  3. Slide:11g新特性-在线实施补丁online patching
  4. 找出最大和第二大的数PHP,2020-09-01 十大经典排序算法总结php为例
  5. 手把手教你查看android系统源码
  6. WCF,Net remoting,Web service概念(转)
  7. Docker自动补全容器名
  8. 计算机应用考试其一级属于中级,计算机软件水平考试可以直接考中级吗?
  9. php 获取系统环境变量,java读取操作系统环境变量
  10. 教你一秒理解setInterval与setTimeout的使用和区别
  11. Spark算子:RDD基本转换操作(2)–coalesce、repartition
  12. 话筒性能测试软件,LogiTech的话筒屏蔽性能测试方案
  13. 不用 qlv 格式转换成 mp4 - 优雅的下载腾讯视(mp4 格式)
  14. 德保罗大学计算机专业,2020年德保罗大学排名TFE Times美国最佳计算机科学硕士专业排名第75...
  15. php怎么实现网页切图,CSS_网站页面切图与CSS注意事项,一、Web页面切图 1) Web页面的 - phpStudy...
  16. 安徽阜阳计算机高中学校排名,安徽省高中学校实力排名
  17. BUUCTF 2021-10-4 Pwn
  18. python基础知识之整除、取余、幂运算
  19. 诚之和:虚假滤镜、照骗风波,小红书到底得了什么病?
  20. python组件化软件github_GitHub - cqingt/wepy: 小程序组件化开发框架

热门文章

  1. 从最近一次的计算机攻击中,我们学到的经验教训
  2. Linux错误:bash:finger 未找到命令...
  3. asp.net web开发框架_Web前端开发必不可少的9个开源框架
  4. 银河土星_不要购买三星银河笔记20
  5. flutter图片识别_Flutter 图片解码与缓存管理研究
  6. 计算机设备名称在哪里找,如何查看电脑驱动
  7. 【无人机航测实习简明教程】1 无人机航测常见名词术语解释
  8. React(4. 2)--数据流(实践篇)
  9. 不会编程,别着急!免编程工具助你快速开发App
  10. 基本系统调用性能lmbench测试方法和下载