SKConv

  • 作者通过SKConv(选择性卷积核)来聚合多个卷积核的信息。(ps:虽然说聚合的是卷积核,但是具体的操作是含input 即特征映射的)
  • SKConv由3个部分组成:split,fuse和select,它们的作用分别是生成卷积核size不同的分支、聚合不同分支信息以获得选择权重的全局的表示、根据选择权重聚合不同size核的特征映射。

split

对于input:x∈RH′×W′×C′x\in R^{H'\times W'\times C'}x∈RH′×W′×C′,
分别进行F˘、F^\breve{F}、\hat{F}F˘、F^运算,即与不同的分组/深度conv进行运算,然后计算BN、ReLU。
这些convs是size不同的卷积(例如3x3与5x5),或者是不同dilation的不同的空洞卷积,简而言之就是split成感受野不同神经元Uˇ、U^\check{U}、\hat{U}Uˇ、U^。

fuse

fuse是利用门来控制信息流,这些信息流来自多个分支,可以将不同规模的信息传输到下一层的神经元中。

具体步骤:

  1. 融合不同分支的信息:U=Uˇ+U^U=\check{U}+\hat{U}U=Uˇ+U^;
  2. 通过简单地使用全局平均池FqpF_{qp}Fqp​来嵌入全局信息,以生成 s∈RCs∈R^Cs∈RC的通道统计信息;
  3. 通过FfcF_{fc}Ffc​降维成z∈Rdz\in R^dz∈Rd,
    z=Ffc(s)=δ(B(Ws))z=F_{fc}(s)=\delta\big(B(Ws)\big)z=Ffc​(s)=δ(B(Ws)),也就是先进行一次全连接层计算,接着BN、ReLU计算;
    为了研究ddd对模型效率的影响,作者使用减小比率γ\gammaγ来控制ddd的值:d=max(C/γ,L)d=max(C/\gamma,L)d=max(C/γ,L),其中LLL为ddd的最小值.

select

select首先分别生成a、b两个矩阵作为权重,分别对Uˇ、U^\check{U}、\hat{U}Uˇ、U^进行加权,然后相加V=ac×Uˇ+bc×U^V=a_c\times \check{U}+b_c\times \hat{U}V=ac​×Uˇ+bc​×U^。

a、b是卷积后Softmax生成的,这是为了 ac+bc=1a_c+b_c=1ac​+bc​=1.
同理,有多个分支的时候也是所有的权重矩阵相加等于1:f1c+f2c+f3c+...+fnc=1f_{1c}+f_{2c}+f_{3c}+... +f_{nc}=1f1c​+f2c​+f3c​+...+fnc​=1

实验

  1. 实验发现分支数D=2,分组数G=32时效果最佳。
  2. 输入object越大,SKConv越偏向于选择感受野大的的卷积核。

参考代码:
1. https://github.com/pppLang/SKNet/blob/master/sknet.py
2. 空洞卷积 https://github.com/developer0hye/SKNet-PyTorch/blob/master/sknet.py

SKNet:自适应感受野相关推荐

  1. SENetSKNet 解读

    简介 今年有很多基于 ResNet 的新成果诞生,包括由于代码实现错误等问题引起广泛关注却屠榜各个榜单的 ResNeSt,关于 ResNeSt 的好坏这里不多做评论,不过它基于的前人工作 SENet ...

  2. 视觉注意力机制(下)

    简介 在上篇文章中,我介绍了视觉注意力机制一些比较新的作品,包括 A 2 A^2 A2-Nets.GSoP-Net.GCNet和ECA-Net,本篇文章主要介绍一些近年以来最新的成果,包括SKNet. ...

  3. 高精地图中导航标识识别

    高精地图中导航标识识别 思路 主要介绍高精地图导航标识识别上的技术演进,这些技术手段在不同时期服务了高精地图产线需求. 高精地图介绍 当你开车导航的时候,导航地图会向我们推荐一条或几条路线,有些地图甚 ...

  4. 深度学习中的20种卷积

    1. 引言 卷积,是卷积神经网络中最重要的组件之一.不同的卷积结构有着不一样的功能,但本质上都是用于提取特征.比如,在传统图像处理中,人们通过设定不同的算子来提取诸如边缘.水平.垂直等固定的特征.而在 ...

  5. 全球计算机视觉顶会CVPR 2020论文出炉:腾讯优图17篇论文入选

    全球计算机视觉顶级会议CVPR2020  (IEEE Conference on Computer Vision and Pattern Recognition,即IEEE国际计算机视觉与模式识别会议 ...

  6. 一文看尽深度学习中的20种卷积(附源码整理和论文解读)

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 引言 卷积,是卷积神经网络中最重要的组件之一.不同的卷积结构有着不一样的功能,但本质上都是用于提取特征 ...

  7. CVPR 2020 | 腾讯优图17篇论文入选,含类比学习、人脸识别、物体检测、行人重识别等领域...

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 本文来源:腾讯优图 全球计算机视觉顶级会议CVPR2020  (IEEE Conf ...

  8. 高精地图中地面标识识别技术历程与实践

    导读:本文将主要介绍高德在高精地图地面标识识别上的技术演进,这些技术手段在不同时期服务了高精地图产线需求,为高德地图构建高精度地图提供了基础的技术保证. 1.面标识识别 地面标识识别,指在地图道路中识 ...

  9. 【论文阅读】Stroke Controllable Fast Style Transfer with Adaptive Receptive Fields

    Stroke Controllable Fast Style Transfer with Adaptive Receptive Fields Abstract Introduction Related ...

最新文章

  1. 【Runtime】动态添加方法demo
  2. 理解卷积神经网络?看这篇论文就够了
  3. 计算机电缆外径相差太大,DJYPVP计算机电缆标准外径
  4. toString()与new String ()用法区别
  5. 16、ASP.NET MVC入门到精通——MVC过滤器
  6. java基本数据类型线程_Java基本数据类型
  7. plotly使用mapbox实现地图可视化
  8. 在JConsole和VisualVM中查看DiagnosticCommandMBean
  9. Mybatis generator(复制粘贴完成)
  10. win2008r2服务器维护,win2008 r2 服务器安全设置
  11. jdbc数据库配置mysql数据库_JDBC连接MySQL数据库(一)——数据库的基本连接
  12. Easyui 中获取DataGrid中所有数据
  13. c++实现课程管理系统
  14. 3脚送话器内部电路图_电话机维修送话电路故障
  15. 简单聊聊利用DNS服务器提供单一入口
  16. NX/UG二次开发—建模—批量创建重复特征方案优化
  17. 多重背包二进制优化(wzk吃小鸡腿)
  18. 浅谈尾调用和尾递归(C语言)
  19. 网线顺序-水晶头顺序
  20. Python-OpenCV API

热门文章

  1. 2017年5月14日 星期日 --出埃及记 Exodus 26:2
  2. 【观点】996.ICU 会带来实质性的改变吗?
  3. 气象学需要计算机知识吗,应用气象学专业学什么 附学习科目和课程
  4. ios开发收藏按钮_iOS使用CoreData实现收藏功能
  5. Java hashCode是什么
  6. 图像矫正技术深入探讨
  7. 京东商品发布实现店铺商品批量上新,节省大量人力
  8. 适合小白入门的随机森林介绍
  9. 二手车数据分析-爬取人人车二十余万条线上二手车数据
  10. 二手物品交易管理系统