文章从残差网络的设计出发,分析了不同残差单元的构造方式,介绍了深度残差网络不同的变体。从不同角度比较了不同网络之间的差异以及这些网络架构常用图像分类数据集上的性能表现。最后对各种网络进行l总结,并讨论了未来深度残差网络在图像分类领域的一些研究方向。
在神经网络中,网络的深度并非越深越好,在一定深度范围内,随着网络层数的增加,模型可以更好拟合更加复杂的函数,模型性能也可以得到提升,但是在网络层数增到一定数目之后,继续增加网络的层数,训练精度和测试精度迅速下降。
试验表明,20层以上的深度网络,继续叠加增加网络的层数,分类精度反而会降低,50层网络的测试误差率大概是20层网络的一倍,这种网络的退化现象表明了直接增加深度的深度学习系统并不是很容易被优化。
在残差学习的启发下,He等人在网络中引入了恒等映射的设计,巧妙的缓解了由于深度增加带来的梯度爆炸或者梯度消失以及网络退化的问题,提升了信息传递路径的数量,使得网络的深度可以由几十层推到千层。深度残差网络的出现极大提高了系统的准确率,使得训练极深的网络成为可能,是图像分类领域具有重要意义的突破性进展。
深度残差网络的基本组成单元是残差单元,残差单元一般由卷积Conv层,批处理归一化Batchnorm层和非线性激活函数Relu共同构成。深度残差网络由多个残差学习单元堆叠而成,给定输入的图像数据,深度残差网络首先将输入的数据依次送入到卷积层Conv、非线性激活函数层Relu和批处理归一化层Batchnorm;然后将处理的结果进一步送入到多个残差单元,再经过批处理归一化层Batchnorm和多个全连接层;最后得到输出结果。
常用的图像分类数据集介绍
CIFAR-10和CIFAR-100是图像分类领域常用的比较性能的数据集。CIFAR-10数据集由来自10个类的60000个32X32彩色图像组成,其中每个类包干6000个图像,有50000个训练图像和10000个测试图像。
CIFAR-100数据集是CIFAR-10的扩展数据集,它包含的类别数更多(100个类别),每个类别中有600张图像(500张训练图像和100张测试图像)。除此之外,CIFAR-100中的100个小类还可以被分成20个大类,数据集中的每个图像都带有一个“精细”的类别标签(它所属的小类)和一个“粗糙”标签(它所属的大类).
:文章选自《基于深度残差网络图像分类算法研究综述》赵志成等

基于深度残差网络图像分类算法研究综述相关推荐

  1. 基于深度学习的目标检测研究综述

    基于深度学习的目标检测研究综述 摘要:深度学习是机器学习的一个研究领域,近年来受到越来越多的关注.最近几年,深度学习在目标检测领域取得了不少突破性的进展,已经运用到具体的目标检测任务上.本文首先详细介 ...

  2. 基于深度学习的图像识别模型研究综述

    基于深度学习的图像识别模型研究综述 摘要:深度学习是机器学习研究中的一个新的领域,其目的在于训练计算机完成自主学习.判断.决策等人类行为并建立.模拟人脑进行分析学习的神经网络,它模仿人类大脑的机制来解 ...

  3. 读“基于深度学习的图像识别技术研究综述”有感

    "基于深度学习的图像识别技术研究综述"总结 现在流行的图像识别技术都是基于深度学习的算法,经过前辈们的探索改进,图像识别技术经历很多阶段,现如今图像识别技术已经广泛的应用于生活的方 ...

  4. 基于深度残差网络的番茄叶片病害识别方法

    基于深度残差网络的番茄叶片病害识别方法 1.研究思路 该方法首先利用贝叶斯优化算法自主学习网络中难以确定的超参数,降低了深度学习网络的训练难度.在此基础上,通过在传统深度神经网络中添加残差单元,解决了 ...

  5. 手把手教你:基于深度残差网络(ResNet)的水果分类识别系统

    系列文章 手把手教你:图像识别的垃圾分类系统 手把手教你:人脸识别考勤系统 手把手教你:基于粒子群优化算法(PSO)优化卷积神经网络(CNN)的文本分类 目录 系列文章 一.项目简介 二.水果分类结果 ...

  6. NLP入门之综述阅读-基于深度学习的自然语言处理研究综述

    NLP入门-综述阅读-[基于深度学习的自然语言处理研究综述] 基于深度学习的自然语言处理研究综述 摘要 0 引言 1 深度学习概述 卷积神经网络 递归神经网络 2 NLP应用研究进展 3 预训练语言模 ...

  7. 基于深度学习的视频预测研究综述

    原址:http://html.rhhz.net/tis/html/201707032.htm (收集材料ing,为论文做准备)[综述性文章,,,可以做背景资料] 莫凌飞, 蒋红亮, 李煊鹏 摘要:近年 ...

  8. 【智能驾驶】基于计算机视觉的自动驾驶算法研究综述

    近年来,随着人工智能技术的迅速发展,传统汽车行业与信息技术结合,在汽车自动驾驶技术方面的研究取得了长足进步,业内很多大公司都在此领域投入巨资进行研发,如国外的谷歌.丰田,国内的百度.比亚迪等公司都推出 ...

  9. 基于深度学习的图像分类算法核心思想与算法优化总结(深度学习与图像分析-李松斌)

    深度学习-图像分类算法 小卷积核应用-VGGNet 最优局部稀疏结构-Inception 恒等映射残差单元-ResNet 多层密集连接-DenseNet 特征通道重标定-SENet 通道压缩与扩展-S ...

最新文章

  1. Altium designer中提示some net were not able to be matched问题解决办法
  2. 刷新页面 数组轮播
  3. .NET Core 2.0体验
  4. PointNet++详解与代码
  5. 【项目经验】--EasyUI DataGrid之右键菜单
  6. html关于计时的函数,关于JavaScript获取时间函数及实现倒计时
  7. psql执行sql的方式及一些基本命令
  8. SQL 2016 AlwaysOn 无域AlwaysOn配置要点
  9. 【PYTHON笔记】:文件打开和关闭
  10. 点击EditText可编辑,点击其他地方不可编辑
  11. 第二章 算法——程序的灵魂
  12. BZOJ 3689: 异或之 可持久化trie+堆
  13. 纠错式教学法对比鼓励式教学法 -----Lily、贝乐、英孚,乐加乐、剑桥国际、优学汇、北外青少...
  14. 程序人生之项目团队那些人与事(1)
  15. window expects a time attribute for grouping in a stream environment.
  16. Android app包下fragment详细使用
  17. 这篇文章教你用消除笔去水印
  18. layui实现报表数据
  19. 实现开关操作的C语言程序
  20. nginx参数sendfile

热门文章

  1. 中国科学院国家空间科学中心简介
  2. Spark机器学习——协同过滤推荐算法
  3. 使用dbeaver远程连接mysql数据库
  4. c语言假设有21根火柴棍,10道火柴棍趣味智力题,据说全对的都是天才!
  5. php输出12个月,在PHP中获取过去12个月
  6. idea连接数据库失败原因及解决方案
  7. ioremap执行过程
  8. wincc获取系统时间
  9. ISE中ChipScope使用方法
  10. ALSA(Advanced Linux Sound Architecture)声卡编程介绍