主要思想

基于传统卷积模块设计,提出一种高效空间金字塔卷积模块(ESP Module),有助于减小模型运算量和内存、功率消耗,以提高在终端设备上的适用性。这款模型和MobileNet系列、ShuffNet系列相似,都是轻量级模型,可以部署到移动端。

模型具体结构

如下图所示,模型主要有两个模块构成,一个是Efficient spatial pyramid模块,一个是HFF模块。

Efficient spatial pyramid

这个部分由两个子部分构成,前面部分是逐点卷积,就是采用K个1x1xM的小卷积核对原图进行卷积操作,1x1卷积的作用其实就是为了降低维度,这样就可以减少参数,这也是轻量级模型的思路。后面的部分是空洞卷积,即在没有进行下采样(pooling)的操作下,扩大感受野。使用不同膨胀率的卷积核,可以得到不同感受野下的feature,这一点有点类似金字塔池化,所以这个模块也叫ESP。

参数计算

下面来计算下一共包含的参数,其实在效果上,以这种轻量级的网络作为backbone效果肯定不如那些重量级的,比如Resnet,但是在运行速度上有很大优势。

如上图所示,对Efficient spatial pyramid第一部分来说,d个1x1xM的卷积核,将M维的输入feature map降至d维。此时参数为: M∗N/KM*{N/K}M∗N/K,第二部分参数量为K∗n2∗(N/K)2K*{n^2}*{(N/K)}^2K∗n2∗(N/K)2,和标准卷积结构相比,参数数量降低很多。

HFF模块


如上图所示,因为使用了大感受野的膨胀卷积,导致了gridding artifacts现象,如下图所示。本文提出了使用HFF方法来解决该问题,具体做法就是从最小的膨胀卷积核输出的那张feature map开始,逐级叠加。这样的做法并没有引入任何新的参数,同时计算量上也没有增加太多,但却有效地改善了网格效应。


这里其实就是对空洞卷积的结果进行逐层点加向下传递,然后在通道方向上进行concat,concat之后,再对之前的特征做一个点加,这一点采用了残差的思想。

和其它模型的对比

这里,文章对其它模型和该模型做了一个对比,包括参数的数量以及核心网络结构,如下图所示。在这里,不再一一阐述。

ESPNet模型

作者提出了四种模型,分别如下图所示。

下面是以不同网络模型作为backbone的语义分割网络再VOC数据上的表现效果。

发现,ESPNet在较少的参数下,取得了很好的效果。

源代码

作者开源了基于ESPNet的语义分割网络源代码,ESPNet,支持测试和训练。下面展示几幅在kitti数据集上的测试效果。

原图像:


结果图像:

ESPNet: Efficient Spatial Pyramid of Dilated Convolutions for Semantic Segmentation(自动驾驶领域轻量级模型)相关推荐

  1. ESPNet: 自动驾驶领域轻量级分割模型

    原文首发于微信公众号「3D视觉工坊」--ESPNet: 自动驾驶领域轻量级分割模型 原文:ESPNet: Efficient Spatial Pyramid of Dilated Convolutio ...

  2. ESPNet系列:自动驾驶领域轻量级分割模型

    点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要5分钟 Follow小博主,每天更新前沿干货 ESPNet: Efficient Spatial Pyramid of Dilated Con ...

  3. 空间金字塔匹配Spatial Pyramid Matching 小结

    稀疏编码系列: (一)----Spatial Pyramid 小结 (二)----图像的稀疏表示--ScSPM和LLC的总结 (三)----理解sparse coding (四)----稀疏模型与结构 ...

  4. Spatial Pyramid Matching

    稀疏编码系列: (一)----Spatial Pyramid 小结 (二)----图像的稀疏表示--ScSPM和LLC的总结 (三)----理解sparse coding (四)----稀疏模型与结构 ...

  5. SPM——Spatial Pyramid Matching

    本文主要介绍:SPM(空间金字塔匹配)的基本原理和计算方法. 1 基本介绍 SPM 全称是Spatial Pyramid Matching,出现的背景是bag of visual words模型被大量 ...

  6. Spatial Pyramid Matching 小结

    稀疏编码系列: (一)----Spatial Pyramid 小结 (二)----图像的稀疏表示--ScSPM和LLC的总结 (三)----理解sparse coding (四)----稀疏模型与结构 ...

  7. 卫星图像分割--Effective Use of Dilated Convolutions for Segmenting Small Object Instances

    Effective Use of Dilated Convolutions for Segmenting Small Object Instances in Remote Sensing Imager ...

  8. Paper8:Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition

    Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition 还未读

  9. 膨胀卷积--Multi-scale context aggregation by dilated convolutions

    Multi-scale context aggregation by dilated convolutions ICLR 2016 https://arxiv.org/abs/1511.07122 C ...

  10. 空间金字塔Spatial Pyramid的BOW和Pyramid HOG的多核

    经过我的实验,发现在基于模板法的object detection或者classification中,将Pyramid Histogram of Oriented Gradients (PHOG)和Sp ...

最新文章

  1. vs2010发布、打包安装程序(超全超详细)
  2. 探索Julia(part2)--关于IDE
  3. SpringCloud(二) 服务注册到Eureka
  4. asp微信会员卡管理系统,超小的源码_带asp微信支付源码
  5. javamail腾讯企业邮箱发送邮件
  6. 应用层DNS:域名系统(DNS:Domain Name Systems)
  7. 深入浅出话VC++(2)——MFC的本质
  8. pandas 数据结构与基础功能
  9. 英文科技论文各部分的时态和语态
  10. Radish 任务抢占系统
  11. java h5服务器推送事件_初识H5开启多线程与服务器推送事件
  12. 【数学基础】欧式变换、相似变换、仿射变换、射影变换
  13. 日本开设无人机专业,打造无人机“人才市场”
  14. Debian安装谷歌浏览器(Google Chrome)
  15. PHP判断来访是搜索引擎蜘蛛还是普通用户的代码小结
  16. Chips-2.0(一) 安装
  17. 拒绝访问html,为什么IE常常出现拒绝访问 ie拒绝访问的原因及解决方法
  18. stm32f302实现斩波控制步进电机_spwm超级无敌stm32步进电机控制教程
  19. Android 仿淘宝京东商品详情页阻力翻页效果
  20. 和数软件新增9项计算机软件著作权登记证书

热门文章

  1. 免费内网映射外网绑定,tcp端口转发(windows)
  2. Hadoop MapReduce编程 API入门系列之倒排索引(二十四)
  3. 从无线安全到内网渗透
  4. 多线程下的资源同步访问
  5. javascript getComputedStyle,getPropertyValue,CurrentStyle说明
  6. Windows中MySQL主从数据库搭建(二)
  7. 使用 HTML5 webSocket API实现即时通讯的功能
  8. Fancybox—Fancybox的API和配置选项说明
  9. yii2 中 controller 向layout 传值
  10. 使用actuator优雅地停止SpringBoot应用