常用的几种卷积神经网络介绍
标签(空格分隔): 深度学习

这是一篇基础理论的博客,基本手法是抄、删、改、查,毕竟介绍这几个基础网络的博文也挺多的,就算是自己的一个笔记吧,以后忘了多看看。主要是想介绍下常用的几种卷积神经网络。卷积神经网络最初为解决图像识别问题而提出,目前广泛应用于图像,视频,音频和文本数据,可以当做深度学习的代名词。目前图像分类中的ResNet, 目标检测领域占统治地位的Faster R-CNN,分割中最牛的Mask-RCNN, UNet和经典的FCN都是以下面几种常见网络为基础。

LeNet
网络背景

LeNet诞生于1994年,由深度学习三巨头之一的Yan LeCun提出,他也被称为卷积神经网络之父。LeNet主要用来进行手写字符的识别与分类,准确率达到了98%,并在美国的银行中投入了使用,被用于读取北美约10%的支票。LeNet奠定了现代卷积神经网络的基础。

网络结构

上图为LeNet结构图,是一个6层网络结构:三个卷积层,两个下采样层和一个全连接层(图中C代表卷积层,S代表下采样层,F代表全连接层)。其中,C5层也可以看成是一个全连接层,因为C5层的卷积核大小和输入图像的大小一致,都是5*5(可参考LeNet详细介绍)。

网络特点

每个卷积层包括三部分:卷积、池化和非线性激活函数(sigmoid激活函数)
使用卷积提取空间特征
降采样层采用平均池化

AlexNet
网络背景

AlexNet由Hinton的学生Alex Krizhevsky于2012年提出,并在当年取得了Imagenet比赛冠军。AlexNet可以算是LeNet的一种更深更宽的版本,证明了卷积神经网络在复杂模型下的有效性,算是神经网络在低谷期的第一次发声,确立了深度学习,或者说卷积神经网络在计算机视觉中的统治地位。

网络结构 
 
AlexNet的结构及参数如上图所示,是8层网络结构(忽略激活,池化,LRN,和dropout层),有5个卷积层和3个全连接层,第一卷积层使用大的卷积核,大小为11*11,步长为4,第二卷积层使用5*5的卷积核大小,步长为1,剩余卷积层都是3*3的大小,步长为1。激活函数使用ReLu(虽然不是他发明,但是他将其发扬光大),池化层使用重叠的最大池化,大小为3*3,步长为2。在全连接层增加了dropout,第一次将其实用化。(参考:AlexNet详细解释)

网络特点

使用两块GPU并行加速训练,大大降低了训练时间
成功使用ReLu作为激活函数,解决了网络较深时的梯度弥散问题
使用数据增强、dropout和LRN层来防止网络过拟合,增强模型的泛化能力

VggNet
网络背景

VGGNet是牛津大学计算机视觉组和Google DeepMind公司一起研发的深度卷积神经网络,并取得了2014年Imagenet比赛定位项目第一名和分类项目第二名。该网络主要是泛化性能很好,容易迁移到其他的图像识别项目上,可以下载VGGNet训练好的参数进行很好的初始化权重操作,很多卷积神经网络都是以该网络为基础,比如FCN,UNet,SegNet等。vgg版本很多,常用的是VGG16,VGG19网络。

网络结构

上图为VGG16的网络结构,共16层(不包括池化和softmax层),所有的卷积核都使用3*3的大小,池化都使用大小为2*2,步长为2的最大池化,卷积层深度依次为64 -> 128 -> 256 -> 512 ->512。

网络特点 
网络结构和AlexNet有点儿像,不同的地方在于:

主要的区别,一个字:深,两个字:更深。把网络层数加到了16-19层(不包括池化和softmax层),而AlexNet是8层结构。
将卷积层提升到卷积块的概念。卷积块有2~3个卷积层构成,使网络有更大感受野的同时能降低网络参数,同时多次使用ReLu激活函数有更多的线性变换,学习能力更强(详细介绍参考:TensorFlow实战P110页)。
在训练时和预测时使用Multi-Scale做数据增强。训练时将同一张图片缩放到不同的尺寸,在随机剪裁到224*224的大小,能够增加数据量。预测时将同一张图片缩放到不同尺寸做预测,最后取平均值。

ResNet
网络背景

ResNet(残差神经网络)由微软研究院的何凯明等4名华人于2015年提出,成功训练了152层超级深的卷积神经网络,效果非常突出,而且容易结合到其他网络结构中。在五个主要任务轨迹中都获得了第一名的成绩:

ImageNet分类任务:错误率3.57%
ImageNet检测任务:超过第二名16%
ImageNet定位任务:超过第二名27%
COCO检测任务:超过第二名11%
COCO分割任务:超过第二名12%
作为大神级人物,何凯明凭借Mask R-CNN论文获得ICCV2017最佳论文,也是他第三次斩获顶会最佳论文,另外,他参与的另一篇论文:Focal Loss for Dense Object Detection,也被大会评为最佳学生论文。

网络结构


 
上图为残差神经网络的基本模块(专业术语叫残差学习单元),输入为x,输出为F(x)+x,F(x)代表网络中数据的一系列乘、加操作,假设神经网络最优的拟合结果输出为H(x)=F(x)+x,那么神经网络最优的F(x)即为H(x)与x的残差,通过拟合残差来提升网络效果。为什么转变为拟合残差就比传统卷积网络要好呢?因为训练的时候至少可以保证残差为0,保证增加残差学习单元不会降低网络性能,假设一个浅层网络达到了饱和的准确率,后面再加上这个残差学习单元,起码误差不会增加。(参考:ResNet详细解释) 
通过不断堆叠这个基本模块,就可以得到最终的ResNet模型,理论上可以无限堆叠而不改变网络的性能。下图为一个34层的ResNet网络。


网络特点

使得训练超级深的神经网络成为可能,避免了不断加深神经网络,准确率达到饱和的现象(后来将层数增加到1000层)
输入可以直接连接到输出,使得整个网络只需要学习残差,简化学习目标和难度。
ResNet是一个推广性非常好的网络结构,容易和其他网络结合
论文地址: 
1. LeNet论文 
2. AlexNet论文 
3. VGGNet论文 
4. ResNet论文
--------------------- 
作者:feixian15 
来源:CSDN 
原文:https://blog.csdn.net/qq_34759239/article/details/79034849 
版权声明:本文为博主原创文章,转载请附上博文链接!

常用的几种卷积神经网络介绍相关推荐

  1. YJango的卷积神经网络——介绍

    YJango的卷积神经网络--介绍 本文作者:雷锋专栏 2017-07-04 17:16 导语:这里对卷积神经网络的讲解主要是以不同的思考侧重展开,通过对卷积神经网络的分析,进一步理解神经网络变体中& ...

  2. CNN卷积神经网络介绍

    CNN卷积神经网络介绍 1.ANN/CNN/RNN是什么? 2.CNN(卷积神经网络)简介 2.1输入层 2.2隐含层 2.2.1卷积层 2.2.2 激活层(ReLU) 2.2.3池化层 (Pooli ...

  3. 常用的几种GPRS模块介绍 GPRS模块选哪个好

    常用的几种GPRS模块介绍 GPRS模块选哪个好 所属分类:公司新闻发布时间:2018-12-05 GPRS模块采用GPRS的嵌入式系统可以实现无线数据传输领域的复杂应用,在远程抄表.工业控制.遥感遥 ...

  4. Nvidia技术路线和卷积神经网络介绍

    1.Nvidia技术路线概述 2.卷积神经网络介绍 软硬件平台 目的:用卷积神经网络(CNNs)将车前部摄像头捕捉到的原始像素图映射为汽车的方向操控命令. 训练:这套端到端学习系统使用了NVIDIA ...

  5. 卷积神经网络——介绍

    注:全文来自于知乎YJango专栏 如果要提出一个新的神经网络结构,首先就需要引入像循环神经网络中"时间共享"这样的先验知识,降低学习所需要的训练数据需求量. 而卷积神经网络同样也 ...

  6. 最全面的卷积神经网络介绍,都在这里了(附代码)

    来源:读芯术 本文约8000字,建议阅读16分钟. 手把手教你使用卷积精神网络构建图像分类器. 图片来源:pexels.com 神经网络由具有权重和偏差的神经元组成.通过在训练过程中调整这些权重和偏差 ...

  7. 代码详解:最全面的卷积神经网络介绍,都在这里了

    https://www.toutiao.com/a6702972788954645003/ 2019-06-16 11:57:48 全文共8600字,预计学习时长40分钟或更长 图片来源:pexels ...

  8. cnn神经网络可以用于数据拟合吗_代码详解:最全面的卷积神经网络介绍,都在这里了...

    全文共8600字,预计学习时长40分钟或更长 图片来源:pexels.com 神经网络由具有权重和偏差的神经元组成.通过在训练过程中调整这些权重和偏差,以提出良好的学习模型.每个神经元接收一组输入,以 ...

  9. 用螺纹铣刀铣螺纹转速进给怎么设_机加工中最常用的几种钨钢铣刀刀具介绍

    点击上方"机械设计一点通"关注我们,每天学习一个机械设计相关知识点 在机加工中最常用的几种铣刀你都知道吗? 首先呢,铣刀为多齿回转刀具,其每一个刀齿都相当于一把车刀固定在铣刀的回转 ...

最新文章

  1. 【转】SAP开关账期后台任务
  2. Java文档阅读笔记-Guide to the Hibernate EntityManager
  3. raspberry pi_如何保持您的Raspberry Pi更新
  4. 测试笔的使用_宽带故障怎么办?毕亚兹红光笔1秒定位光纤故障,快速解决问题...
  5. linux rm 命令删除文件恢复_【Linux】恢复误删除的文件或目录
  6. 插件地址(eclipse jrebel jed)、问题
  7. 纯C语言编程-游戏之弹跳球
  8. 5.1声道定位测试音源(PCM-WAV)定位测试音源(PCM-WAV)
  9. Spring Initializr文档翻译及源码解读
  10. 美图录爬虫(requests模块,re模块)
  11. 微信跳转浏览器提示_微信浏览器中打开提示的2种实现方式
  12. 圣诞邀请助力活动H5系统开发
  13. 闪电世界源码-闪电世界系统开发功能介绍
  14. 云呐|加强固定资产设备信息化管理工作
  15. java并发集合框架学习记录
  16. 2015_BOE_Chiu2 杜克大学oct数据集
  17. PDF标签文件用哪款条码标签打印软件制作?
  18. TL-WR941N救砖记
  19. 生成LaTeX使用的eps格式图片
  20. 甲骨文Oracle官网Java下载网址

热门文章

  1. 修改Sql server中列的属性脚本
  2. Biztalk Server 2006安装配置
  3. 浅谈爬虫 《一》 ===python
  4. [转]vue全面介绍--全家桶、项目实例
  5. php计算代码运行时间与内存使用的一段代码
  6. magento cms page、登錄頁面修改(增加)breadcrumbs
  7. oracle服务说明
  8. 区块链BAAS平台:公共或私人区块链编程以用于各种用途
  9. 多线程锁,线程池,消费者生产者模型
  10. CentOS7安装OpenFire