深度学习系列(三)卷积神经网络模型(ResNet、ResNeXt、DenseNet、Dence Unet)

内容目录

1、ResNet2、ResNeXt3、DenseNet4、Dence Unet

1、ResNet

《Deep Residual Learning for Image Recognition》https://arxiv.org/abs/1512.03385在模型发展中,网络的深度逐渐变大,导致梯度消失问题,使得深层网络很难训练,梯度反向传播到前面的层,重复相乘可能使梯度无穷小,随着网络的层数更深,其性能趋于饱和,甚至开始迅速下降,下图所示,56层的性能比20层的性能差。

ResNet 的核心思想是引入一个所谓的Residual Block,即「恒等快捷连接」(identity shortcut connection),直接跳过一个或多个层,这种残差函数更容易优化,能使网络层数大大加深,残差函数F(x) = H(x) – x。如下图所示:

ResNet 架构如下,基于VGG19的架构,我们首先把网络增加到34层,增加过后的网络我们叫做plain network,再此基础上,增加残差模块,得到我们的Residual Network

2、ResNeXt

《Aggregated Residual Transformations for Deep Neural Networks》https://arxiv.org/abs/1611.05431v1Xie et al. 提出 ResNet 的一种变体 ResNeXt,是ResNet和Inception的结合体,不同于Inception v4的是,ResNext不需要人工设计复杂的Inception结构细节,而是每一个分支都采用相同的拓扑结构。ResNeXt的本质是分组卷积(Group Convolution),通过变量基数(Cardinality)来控制组的数量,比Inception V4的超参数更少。它具备以下构建块:

作者在论文中引入了一个叫作基数(cardinality)的超参数,指独立路径的数量,这提供了一种调整模型容量的新思路。实验表明,通过扩大基数值(而不是深度或宽度),准确率得到了高效提升。作者表示,与 Inception 相比,这个全新的架构更容易适应新的数据集或任务,因为它只有一个简单的范式和一个需要调整的超参数,而 Inception 需要调整很多超参数(比如每个路径的卷积层内核大小)。这个全新的结构有三种等价形式,fig3.a 就是前面所说的aggregated residual transformations。fig3.b 则采用两层卷积后 concatenate,再卷积,有点类似 Inception-ResNet,只不过这里的 paths 都是相同的拓扑结构。fig 3.c采用的是grouped convolutions,采用32个 group,每个 group 的输入输出 channels 都是4,最后把channels合并。作者在文中明确说明这三种结构是严格等价的,并且用这三个结构做出来的结果一模一样。

3、DenseNet

《Densely Connected Convolutional Networks》https://arxiv.org/abs/1608.06993v3Huang 等人提出一种新架构 DenseNet,进一步利用快捷连接,形成Dense block将所有层直接连接在一起。在这种新型架构中,每层的输入由所有之前层的特征映射组成,其输出将传输给每个后续层,这些特征映射通过深度级联聚合。

公式是ResNet的,Xl表示l层的输出,Hl表示一个非线性变换,l层的输出是l-1层的输出加上对l-1层输出的非线性变换。

公式是DenseNet的,[x0,x1,…,xl-1]表示将0到l-1层的输出feature map做通道合并的concatenation,而resnet是做值的相加,通道数是不变的。Hl包括BN,ReLU和3 x 3的卷积。其中一个Dense block如下所示。

一个小的DenceNet如下图所示。

Growth rate

式中,k0代表第1个block的输入,k代表Growth rate,l-1代表当前block的中的前l-1个层。所以每层添加k个feature map到总的stack里面。当然了,这里每次添加的时候总是要以block为单位进行的。下表为growth rate=32和48的网络。

特点:(1) 相比ResNet拥有更少的参数数量.(2) 旁路加强了特征的重用.(3) 网络更易于训练,并具有一定的正则效果.(4) 缓解了gradient vanishing和model degradation的问题.

4、Dence Unet

我们在Herlev dataset(宫颈癌细胞公开数据集)上进行了测试,结果如下

代码已经开源:https://github.com/Minerva-jiezhao/D-MEM

unet是残差网络吗_深度学习系列(三)卷积神经网络模型(ResNet、ResNeXt、DenseNet、DenceUnet)...相关推荐

  1. 采用keras深度学习框架搭建卷积神经网络模型实现垃圾分类,基于树莓派上进行实时视频流的垃圾识别源代码

    一.项目概述 简介:该垃圾分类项目主要在于对各种垃圾进行所属归类,本次项目采用keras深度学习框架搭建卷积神经网络模型实现图像分类,最终移植在树莓派上进行实时视频流的垃圾识别. 前期:主要考虑PC端 ...

  2. 【深度学习系列】卷积神经网络CNN原理详解(一)——基本原理(1)

    上篇文章我们给出了用paddlepaddle来做手写数字识别的示例,并对网络结构进行到了调整,提高了识别的精度.有的同学表示不是很理解原理,为什么传统的机器学习算法,简单的神经网络(如多层感知机)都可 ...

  3. 吴恩达.深度学习系列-C4卷积神经网络-W2深度卷积模型案例

    吴恩达.深度学习系列-C4卷积神经网络-W2深度卷积模型案例 (本笔记部分内容直接引用redstone的笔记http://redstonewill.com/1240/.原文整理的非常好,引入并添加我自 ...

  4. unet是残差网络吗_基于深度监督残差网络的肝脏及肝肿瘤分割

    摘要: 针对医生手动对肝脏肿瘤CT图像分割耗时,耗力,且易受主观判断影响的问题,该研究提出一种深度监督残差网络(Deeply Supervised Residual Unet,DS-ResUnet)算 ...

  5. unet是残差网络吗_基于UNet神经网络的城市人流预测

    [原创] 1 利用手机信令数据计算人口流动数据 手机信令数据是研究人口的整体流动情况的重要数据来源.移动运营商在为手机用户提供实时通讯服务时,积累了大量的基站与设备的服务配对数据.根据配对和唤醒发生的 ...

  6. 2.4 残差网络为什么有用-深度学习第四课《卷积神经网络》-Stanford吴恩达教授

    ←上一篇 ↓↑ 下一篇→ 2.3 残差网络 回到目录 2.5 网络中的网络以及1x1卷积 残差网络为什么有用 (Why ResNets work?) 为什么ResNets能有如此好的表现,我们来看个例 ...

  7. python卷积神经网络cnn的训练算法_【深度学习系列】卷积神经网络CNN原理详解(一)——基本原理...

    上篇文章我们给出了用paddlepaddle来做手写数字识别的示例,并对网络结构进行到了调整,提高了识别的精度.有的同学表示不是很理解原理,为什么传统的机器学习算法,简单的神经网络(如多层感知机)都可 ...

  8. 【深度学习】经典卷积神经网络结构说明

    前言   20世纪 90年代,LeCun et al.等人发表一篇关于手写数字识别的论文 [论文PDF下载],论文中使用的网络结果如下: 此网络结构认为是卷积神经网络的开山鼻祖,也确立了CNN的现代结 ...

  9. 吴恩达深度学习笔记(109)-循环神经网络模型(RNN介绍)

    https://www.toutiao.com/a6652926357133066755/ 2019-02-06 20:15:53 循环神经网络模型(Recurrent Neural Network ...

最新文章

  1. xib与nib的区别
  2. jittor和pytorch生成网络对比之dcgan
  3. 【技术综述】人脸年龄估计研究现状
  4. Android开发中的多线程编程技术
  5. nginx 配置expires
  6. C#LeetCode刷题之#83-删除排序链表中的重复元素(Remove Duplicates from Sorted List)
  7. html自动图片墙,基于html5实现的图片墙效果
  8. RTP 时间戳的处理
  9. 清空文件夹,或删除文件夹
  10. 剑指offer面试题09. 用两个栈实现队列(队列、栈)
  11. nginx 错误Failed to start The nginx HTTP and reverse proxy server.
  12. 码出高效,码出质量:阿里Java开发手册正式发布!
  13. 八种点云聚类方法(一)— DBSCAN
  14. 便携式频谱仪无人机机载频谱仪解决方案
  15. 用机器学习来提升你的用户增长:第八步,Uplift模型
  16. Android:插值器(Interpolator)和估值器(TypeEvaluator)的理解和使用
  17. 【第五人格设计思路】囚徒“蝰”·时装设计思路
  18. android的wifi网卡移植详细过程已经通用驱动的问题
  19. 量化择时之移动平均线初探
  20. memcpy 内存越界分析

热门文章

  1. mongodb gridfs php,PHP操作MongoDB GridFS 存储文件的详解
  2. 解读java面试_解读王垠博客“一道 Java 面试题”
  3. [iOS UI进阶 - 0] Quiartz2D
  4. Docker私有仓库Registry使用
  5. i510200h和i79750h哪个好
  6. c++实现坦克大战(开源)无bug
  7. linkedblockingqueue使用_Java线程池的使用方式,核心运行原理、以及注意事项
  8. 学习总结-网关 架构演进
  9. 文档管理工具(支持http、websocket、富文本、markdown)
  10. 安装SSL证书后不能访问https网站怎么办