关于深度卷积神经网络的前世今生,就不在此处进行过多的介绍。在此,主要对网络的各个组成部分进行简要介绍:

图1 基本的深度卷积网络结构

通过图1可知深度卷积神经网络主要是由输入层、卷积层、激活函数、池化层、全连接层和输出层组成。以下将以人脸识别为例对网络的各个组成部分进行简单的介绍:

输入层:深度卷积网络可直接将图片作为网络的输入,通过训练提取特征,但是为了获得更好的效果,通常需要将图片进行预处理,在人脸识别中,就需要进行人脸检测等处理(MTCNN是一种较好的人脸检测方法)。此外,在样本不足的情况下会需要进行样本增强处理,包括旋转、平移,剪切、增加噪声、颜色变换等。

卷积层:通过卷积运算实质是对输入进行另一种表示,若将卷积层视为黑盒子,那么我们可以将输出看作是输入的另外一种表示,而整个网络的训练也就是训练出这种表示所需的中间参数。图2为一般神经网络的示意图:

图2 简单神经网络

图2中w和b即为网络训练所需得到的参数,在卷积层中需要添加激活函数对运算进行非线性化。深度卷积网络将小的神经网络串联起来构成深度神经网络,主要有两种特殊的处理方式:

  1. 采用局部感受野:神经元仅与其相邻的上一层神经元相连接,通过对学习到的局部特征进行组合形成最后的全局特征。
  2. 采用权值共享:同一个卷积核在对不同的局部感受野进行操作时,采用相同的权值参数,能够减少网络运行过程中所需的参数计算量。通过每一层的多个卷积核获得图片的不同特征,不需要特意考虑特征在图片中的具体位置,该处理方式使得其在分析和处理图片任务上具有显著优势

图3 卷积操作示意图

图3为某个三维图进行卷积处理,同一卷积核对不同输入层进行卷积操作,得到一组输出,多个卷积核得到多少个输出。不同的图层和不同的输入图处理方法相似,中间的卷积运算时一种对参数进行处理的过程,而最后决定分类个数的是最后一层全连接层的个数。如100张图片,大小为32*32,图片为3维,即输入为100*32*32*3,通过大小为3*3的256个卷积核进行边缘补充后计算,输出为100*32*32*256,即在该层的卷积运算仅需对256个卷积核进行共享就可实现卷积操作,大大减少了所需参数。

卷积运算输入和输出窗口的大小变化为:,其中W为输入的长/宽(输入长宽不一定相等),F为卷积核的大小,P为边缘补充个数,S为步长(卷积间隔个数),如图3中,输入为5*5,卷积核的大小为3*3,边缘补充为1,步长为2,其计算即为N=(5-3+1*2)/2+1,故而输出为3*3。

vggnet通过实验证明三个3*3的卷积核效果比一个7*7的卷积核效果好,2个3*3的卷积核比一个5*5的网络效果好。此外,resnet提出的残差网络结构能有效的避免网络中参数泛华的问题。

池化层:是卷积神经网络中的一种对数据进行的特殊处理操作,通过池化处理缩小图片特征尺寸,能有效的去除由上一层的结果作为输入而带来的计算量较大的问题,图4为常使用的池化方法。

图4 平均池化和最大池化

2*2的池化可以使特征图大小减半,后常采用大小为3*3,步长为2,pad=0的卷积核替换池化层,可实现类似的效果。

激活函数:网络中卷积操作和池化操作都是线性操作,而生活中的大量样本,在进行分类时并不是线性关系,因而需要在网络中引入非线性元素使得网络能解决非线性问题。常见的激活函数如下:

图5 Relu函数及其改进函数

全连接层:该层是网络中消耗参数最多的层,若全连接层的输入是4*4*100,全连接层的输出是512,则该层需要4*4*100* 512个参数;而一般的卷积层,若卷积核为4*4,输出为512,则仅需4*4*512个参数。常见的网络会含有两个全连接层,第二个全连接层的输出与分类个数的输出对应,而近期有文献表明,第一个卷积层是可以通过全局平均池化层等替换。

以上是通过个人学习进行的简要总结,若有不对的地方大家可以指出,期待与大家共同学习进步。

深度卷积神经网络基本介绍相关推荐

  1. 介绍深度卷积神经网络中各种类型的模型

    深度卷积神经网络(DCNN)是一种深度学习技术,它可以帮助计算机从复杂的图像或音频数据中识别出特征.DCNN可以用来解决许多计算机视觉和语音识别任务,其中包括图像分类.目标检测.语音识别和自然语言处理 ...

  2. 基于深度卷积神经网络的小样本分割算法综述

    ↑ 点击蓝字 关注视学算法 来源丨AI算法修炼营 编辑丨极市平台 介绍 深度卷积神经网络在图像分类.目标检测.语义分割等许多视觉理解任务上都取得了重大突破.一个关键的原因是大规模数据集的可用性,比如 ...

  3. 可视化卷积神经网络的过滤器_万字长文:深度卷积神经网络特征可视化技术(CAM)最新综述...

    ↑ 点击蓝字 关注极市平台作者丨皮特潘@知乎来源丨https://zhuanlan.zhihu.com/p/269702192编辑丨极市平台 极市导读 本文通过引用七篇论文来论述CAM技术,对CAM的 ...

  4. 基于深度卷积神经网络进行人脸识别的原理是什么?

    原文:https://www.zhihu.com/question/60759296 基于深度卷积神经网络进行人脸识别的原理是什么? 这里的人脸识别包括但不限于:人脸检测,人脸对齐,身份验证识别,和表 ...

  5. 【直播】如何获得更加高效的深度卷积神经网络

    在移动端使用深度学习模型时,我们需要参数少.计算速度快的模型,因此一个性能更高效的模型才是落地的关键.本次将从卷积核,拓扑结构,剪枝,量化,蒸馏,动态推理,AutoML等方向来讲述如何获得一个更加高效 ...

  6. 【直播】如何设计性能更强大的深度卷积神经网络

    从事深度学习算法研究的人员一直在追求精度更高的网络性能,这一次我们将从模型的宽度.深度.卷积核和步长的大小,Dropout和BN层的设计,残差网络,多尺度与信息融合,Attention机制,AutoM ...

  7. 【直播】深度卷积神经网络模型设计技术

    往后我们慢慢地会多做一些直播,平台就定在哔哩哔哩,这次是有三本周五直播的一个回放. 文/编辑 | 言有三 1 直播主题 网络结构是深度学习成功的关键因素之一,不仅是非常重要的学术研究方向,在工业界实践 ...

  8. 【论文阅读】Learning Traffic as Images: A Deep Convolutional ... [将交通作为图像学习: 用于大规模交通网络速度预测的深度卷积神经网络](1)

    [论文阅读]Learning Traffic as Images: A Deep Convolutional Neural Network for Large-Scale Transportation ...

  9. 基于深度卷积神经网络的目标检测研究综述

    基于深度卷积神经网络的目标检测研究综述 人工智能技术与咨询 来自<光学精密工程> ,作者范丽丽等 摘要:作为计算机视觉中的基本视觉识别问题,目标检测在过去的几十年中得到了广泛地研究.目标检 ...

  10. 深度卷积神经网络_深度卷积神经网络中的降采样

    加入极市专业CV交流群,与6000+来自腾讯,华为,百度,北大,清华,中科院等名企名校视觉开发者互动交流!更有机会与李开复老师等大牛群内互动! 同时提供每月大咖直播分享.真实项目需求对接.干货资讯汇总 ...

最新文章

  1. GDCM:gdcm::Attribute的测试程序
  2. oracle帮助系统,开启Oracle的帮助系统
  3. 安卓log.e函数打印示例_log1p()函数以及C ++中的示例
  4. 【HDU - 4185】Oil Skimming (二分图,建图,匈牙利算法)
  5. 项目总结2:ionic3开发跨平台App如何设置和替换应用图标及启动图
  6. edtext 从右边开始输入 安卓_FreeRTOS 从入门到精通6--详解任务管理下(对比PLC,安卓)...
  7. 在nhibernate 1.2 中使用sqlite时应注意sqlite的ado.net的提供者 .
  8. js使用的一些实用技巧
  9. delete postman 传参_Postman高级应用——串行传参和动态传参详解
  10. 《Android框架揭秘》——2.5节应用程序Framework源码级别调试
  11. 搭建直播平台,Android端直播APP源码如何实现礼物效果
  12. FileZilla传输文件乱码的解决方案
  13. C++ 动态申请二维数组与二维数组传参
  14. oracle mysql 同义词_Oracle数据库同义词
  15. CCCF“CNCC2017特邀报告”丘成桐:现代几何学与计算机科学
  16. 盘点:54款真正耐玩的独立游戏
  17. 上传图片到腾讯云(海外服务器)com.qcloud5.5.4版本
  18. 李白打酒递归java_李白打酒递归
  19. php 文字水印换行,thinkPHP5图片加文字水印实现换行的方法
  20. 计算机二级模板文档,江苏省计算机二级

热门文章

  1. decklink linux 驱动下载,Blackmagic Design DeckLink采集卡驱动
  2. winform之控件在Panel中居中
  3. Struts2通配符
  4. 使用python开发的GUI可视化界面植物名录查询系统,使用python读取xls文件,读取xlsx文件。tkinter使用
  5. 【软测面试】找工作前的准备|面试题
  6. linux计划任务踩坑
  7. CouchBase 入门
  8. 简单 申请 msn.com邮箱 @
  9. AspxGridView 排序分组刷新DetailRow的问题
  10. 神经网络控制的基本原理,神经网络技术及其应用