4.14 相关研究现状

鉴于卷积神经网络在应用中表现出的优异性能,近年来很多研究工作都着力于挖掘这一种多层次模型的巨大潜能,尤其是对那些应用于大数据集图像分类的网络模型[2] 。而这些改进的 CNN 算法则可以被粗略的分为以下四类。

第一类算法使用随机化的正则方法,它们在训练过程中引入随机性,从而减少模型对训练样本的过拟合,提高模型的泛化能力。Dropout [6] 方法是这个领域内第一个被提出和广泛应用的算法。在每一轮训练迭代中,被应用了 Dropout 的神经层会随机剔除一半神经元。因此,Dropout 层中每个神经元占有权值的实际训练次数小于总迭代周期数。在 Dropout 提出之初,它主要应用在分类层之前的全连接层,这样网络全体的输出可以视为若干个子网络的输出均值:每一个子网络都包含 Dropout 层一半的神经元,同时共享之前层叠的卷积神经层进行特征提取。这样的结构能够有效地降低过拟合,提升模型在测试集上的准确率。基于相同的思路,DropConnect [8] 方法则是随机剔除神经连接:在每一次迭代中,DropConnect 层中的部分权值被随机置 0。Dropout 方法可以视为它的一种特例——将某个神经元的所有关联权值置 0。更进一步地,Stochastic Pooling [7] 将这种随机性带入了池化层。相较于 average pooling 或者 max pooling 稳定地选择池化区域中神经元输出的均值或最大值作为输出,stochastic pooling 则根据区域内神经元输出形成的多项分布,随机地选择最终输出。

另外一类优化途径是寻找更合适的 CNN 网络结构。就算整体参数规模相近,层数不同、卷积核大小不同、每层特征图数目不同的卷积神经网络,在具体任务下也会有不小的性能差异。考虑到在仅仅使用随机权值的情况下,优异网络结构仍然比普通的网络结构有更佳的识别性能。在长时间的迭代训练之前,通过测试随机权值下的模型性能,我们可以快速搜索出最合适的模型结构[9] ,而避免浪费时间训练本身结构不好的网络。除此之外,也有一些被验证的优良结构风格。受大脑皮层中的纵列分布的神经细胞启发,若干深度神经网络(DNN)被 并 排 组 合 在 一 起 构 成 了 Multi-Column DNN(MCDNN [10] )。MCDNN 网络最后的输出标签其实是若干个 DNN 输出标签的均值,这种多模型的联合判决巧妙地利用了模型平均的思想,是一种提高测试集准确率的简单而高效的策略。NiN(Networkin Network)则提出在使用普通大小卷积核(3×3或 5×5)的卷积层后紧接着两个采用 1×1 小卷积核的卷积层[11] 。这种结构可以探测更抽象的局部特征,且对网络模型的总体参数规模影响甚微。

第三类方法专注于研究高性能的激活函数。经典神经网络的 sigmoid 激活函数在大型网络中有明显的梯度弥散(vanishing gradient)问题,并且本身计算效率也不高。而使用 max(0,x) 作为激活函数的 ReLU [12] ,则因为它提供的稀疏性和本身计算快速的优点而被广泛采用。在此基础上,为了保留负值部分的有用信息,leaky ReLU [13] 允许微弱的负神经元输出:负输出值乘上一个很小的固定常数,而不是直接置 0。 至此之后,又有 PReLU [14] 、EReLu [15] 等多种更复杂的激活函数被提出,这些方法同 ReLU 相比有显著的性能优势。

最后一类方法主要优化特征提取的核心——卷积神经层。区分度高的特征在分类时的效果更好,基于这一思想,Deeply-Supervised Nets [16] (DSN)使用支持向量机(SVM)评估卷积神经层输出特征图在分类中的区分度,并相应地对代价函数进行修正,引导卷积神经层输出更差异化的特征图。而在Recursive Convolutional Network 17 中,部分卷积层与其相邻层共享同一组滤波器,在不同抽象层次上提取相同特征。然而,在一个普通的训练收敛的 CNN 中,随着神经层深度的加深,特征图的抽象程度也递增,处理这些特征图的滤波器也逐渐变得复杂。RCN 简单地跨层次复用滤波器并未获得显著的性能提升。Recurrent ConvolutionalNeural Network [18] (RCNN)也使用了相同的思想,进一步扩展了这种递归性,并且将其与更深的卷积神经网络结合,获得了不错的学习效果。

本文介绍的关联滤波器方法也是一种针对卷积层的优化算法。它在从属于同一卷积神经层的滤波器间构造固定的关联。这种方法不需要附加额外的权值和神经元,人工构造的关联旨在引领同一卷积层内的滤波器协同处理特征图,以组成更泛化的视觉特征提取器。

《中国人工智能学会通讯》——4.14 相关研究现状相关推荐

  1. 中国人工智能学会通讯——智能系统测评:挑战和机遇

    上面的四个报告从四个维度讨论了智能系统测评的不同方面--产业.基础.基础和伦理.我受中国人工智能学会的委托,组织这次分论坛,为此对这个领域做了一些调研和思考,从现状和挑战这两个方面做了一些初步总结. ...

  2. 中国人工智能学会通讯——深蓝、沃森与AlphaGo

    在 2016 年 3 月 份,正当李 世石与AlphaGo 进行人机大战的时候,我曾经写过 一 篇< 人 工 智 能 的 里 程 碑: 从 深 蓝 到AlphaGo>,自从 1997 年深 ...

  3. 中国人工智能学会通讯——基于视频的行为识别技术 1.7 视频的深度分段网络...

    1.7 视频的深度分段网络 下面介绍另外一个工作,是我们和 CUHK.ETH 联合开展的,这个工作考 虑视频的分段特性,我们知道视频可以分 成很多段,每一段有不同的内容.我们 开发了一个深度模型,对不 ...

  4. 中国人工智能学会通讯——无智能,不驾驶——面向未来的智能驾驶时代 ( 下 )...

    到目前为止似乎比较完美,而实际还 存在着一些问题.我们现在看到很多道 路上面,交通标志牌它的分布非常稀疏, 可能每过一两公里才能够检测出来一个 交通标志牌,因为毕竟这个深度学习算 法是目前最完美的,它 ...

  5. 《中国人工智能学会通讯》——11.34 基于近似动态规划的优化控制研究及 在电力系统中的应用...

    11.34 基于近似动态规划的优化控制研究及 在电力系统中的应用 上世纪 50 年代以来,在空间技术发展和数字计算机实用化的推动下,动态系统的优化理论得到了迅速的发展,形成了一个重要的学科分支--最优 ...

  6. 《中国人工智能学会通讯》——9.21 基于任务规划的资源卫星智能管控模式

    9.21 基于任务规划的资源卫星智能管控模式 我国目前已建成包括高分.遥感.环境减灾.测绘和试验等多系列资源卫星系统,在轨运行的卫星 20 多颗.随着成像卫星的发展,成像卫星任务规划问题也逐渐引起重视 ...

  7. 《中国人工智能学会通讯》——5.31 制造服务的产生与聚合

    5.31 制造服务的产生与聚合 制造服务的产生与聚合,主要解决从制造资源和制造能力到制造服务,再从制造服务到制造服务池的问题.当前的相关研究大多致力于基于物联网相关技术实现各种制造资源的感知与接入,以 ...

  8. 《中国人工智能学会通讯》——6.7 实体链接任务及系统

    6.7 实体链接任务及系统 给定一段文本(如"在旧金山的发布会上,苹果为开发者推出新编程语言 Swift"),一个实体链接系统需要通过如下多个子任务来实现实体消歧 [4] . 1 ...

  9. 《中国人工智能学会通讯》——1.13 总结与展望

    1.13 总结与展望 本文对社区问答系统的组成结构.用户获取信息或者分享知识的典型流程,以及热点研究问题进行了简单介绍.从已有的相关研究工作中可以看出,作为一个新兴而实用的互联网应用,社区问答系统已经 ...

最新文章

  1. Servlet Listener
  2. Prismatic 机器学习不一定得用大框架
  3. PHP起点 - PHP常量
  4. 阿里巴巴大规模应用Flink的踩坑经验:如何大幅降低 HDFS 压力?
  5. 简朴的生活、高贵的灵魂是人生的至高境界。——杨绛
  6. 3D Reconstruction三维重建halcon算子,持续更新
  7. Transform(HDU-5637)
  8. 【debug】json.decoder.JSONDecodeError: Expecting value: line 1 column 1 (char 0)
  9. latex/Xelatex书籍排版总结---顺便附上一本排好的6寸android书…
  10. fork()的流程图
  11. java中与接口类,Java中类与类、类与接口、接口与接口的关系
  12. 苹果safari关掉java_如何在Safari,Chrome,Firefox和系统范围内禁用Java | MOS86
  13. bboss_spring_struts2_myibatis对比分析
  14. couchdb 安装_如何在Ubuntu上安装CouchDB –分步指南
  15. c++求两点的距离利用友元_「20525」高中数学:“二面角”和“点到平面的距离”的通解...
  16. 应用概率统计-第六章 极限定理
  17. 武汉大学计算机假期有什么活动,计算机学院关于2018年“清明节”学生放假通知...
  18. EndNote选择特定期刊的样式
  19. 简师网:考上教编才知道,小学教师和中学教师有这些差别!
  20. [大忌(。_。)]清明节外出

热门文章

  1. [leetcode]Sort Colors
  2. thinkphp执行流程
  3. nginx实现对chunk请求支持
  4. thrift的中文编码处理
  5. 快逸报表API直接生成v4统计图
  6. laravel5.5 不能正常自动回复的问题
  7. webpack 编译html模板文件
  8. Android sqlite 数据库保存Date 类型
  9. CentOS5.8 RHCS配置
  10. 解决Docker容器 iptables问题