SKNet:自适应感受野
SKConv
- 作者通过SKConv(选择性卷积核)来聚合多个卷积核的信息。(ps:虽然说聚合的是卷积核,但是具体的操作是含input 即特征映射的)
- SKConv由3个部分组成:split,fuse和select,它们的作用分别是生成卷积核size不同的分支、聚合不同分支信息以获得选择权重的全局的表示、根据选择权重聚合不同size核的特征映射。
split
对于input:x∈RH′×W′×C′x\in R^{H'\times W'\times C'}x∈RH′×W′×C′,
分别进行F˘、F^\breve{F}、\hat{F}F˘、F^运算,即与不同的分组/深度conv进行运算,然后计算BN、ReLU。
这些convs是size不同的卷积(例如3x3与5x5),或者是不同dilation的不同的空洞卷积,简而言之就是split成感受野不同神经元Uˇ、U^\check{U}、\hat{U}Uˇ、U^。
fuse
fuse是利用门来控制信息流,这些信息流来自多个分支,可以将不同规模的信息传输到下一层的神经元中。
具体步骤:
- 融合不同分支的信息:U=Uˇ+U^U=\check{U}+\hat{U}U=Uˇ+U^;
- 通过简单地使用全局平均池FqpF_{qp}Fqp来嵌入全局信息,以生成 s∈RCs∈R^Cs∈RC的通道统计信息;
- 通过FfcF_{fc}Ffc降维成z∈Rdz\in R^dz∈Rd,
z=Ffc(s)=δ(B(Ws))z=F_{fc}(s)=\delta\big(B(Ws)\big)z=Ffc(s)=δ(B(Ws)),也就是先进行一次全连接层计算,接着BN、ReLU计算;
为了研究ddd对模型效率的影响,作者使用减小比率γ\gammaγ来控制ddd的值:d=max(C/γ,L)d=max(C/\gamma,L)d=max(C/γ,L),其中LLL为ddd的最小值.
select
select首先分别生成a、b两个矩阵作为权重,分别对Uˇ、U^\check{U}、\hat{U}Uˇ、U^进行加权,然后相加V=ac×Uˇ+bc×U^V=a_c\times \check{U}+b_c\times \hat{U}V=ac×Uˇ+bc×U^。
a、b是卷积后Softmax生成的,这是为了 ac+bc=1a_c+b_c=1ac+bc=1.
同理,有多个分支的时候也是所有的权重矩阵相加等于1:f1c+f2c+f3c+...+fnc=1f_{1c}+f_{2c}+f_{3c}+... +f_{nc}=1f1c+f2c+f3c+...+fnc=1
实验
- 实验发现分支数D=2,分组数G=32时效果最佳。
- 输入object越大,SKConv越偏向于选择感受野大的的卷积核。
参考代码:
1. https://github.com/pppLang/SKNet/blob/master/sknet.py
2. 空洞卷积 https://github.com/developer0hye/SKNet-PyTorch/blob/master/sknet.py
SKNet:自适应感受野相关推荐
- SENetSKNet 解读
简介 今年有很多基于 ResNet 的新成果诞生,包括由于代码实现错误等问题引起广泛关注却屠榜各个榜单的 ResNeSt,关于 ResNeSt 的好坏这里不多做评论,不过它基于的前人工作 SENet ...
- 视觉注意力机制(下)
简介 在上篇文章中,我介绍了视觉注意力机制一些比较新的作品,包括 A 2 A^2 A2-Nets.GSoP-Net.GCNet和ECA-Net,本篇文章主要介绍一些近年以来最新的成果,包括SKNet. ...
- 高精地图中导航标识识别
高精地图中导航标识识别 思路 主要介绍高精地图导航标识识别上的技术演进,这些技术手段在不同时期服务了高精地图产线需求. 高精地图介绍 当你开车导航的时候,导航地图会向我们推荐一条或几条路线,有些地图甚 ...
- 深度学习中的20种卷积
1. 引言 卷积,是卷积神经网络中最重要的组件之一.不同的卷积结构有着不一样的功能,但本质上都是用于提取特征.比如,在传统图像处理中,人们通过设定不同的算子来提取诸如边缘.水平.垂直等固定的特征.而在 ...
- 全球计算机视觉顶会CVPR 2020论文出炉:腾讯优图17篇论文入选
全球计算机视觉顶级会议CVPR2020 (IEEE Conference on Computer Vision and Pattern Recognition,即IEEE国际计算机视觉与模式识别会议 ...
- 一文看尽深度学习中的20种卷积(附源码整理和论文解读)
点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 引言 卷积,是卷积神经网络中最重要的组件之一.不同的卷积结构有着不一样的功能,但本质上都是用于提取特征 ...
- CVPR 2020 | 腾讯优图17篇论文入选,含类比学习、人脸识别、物体检测、行人重识别等领域...
关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 本文来源:腾讯优图 全球计算机视觉顶级会议CVPR2020 (IEEE Conf ...
- 高精地图中地面标识识别技术历程与实践
导读:本文将主要介绍高德在高精地图地面标识识别上的技术演进,这些技术手段在不同时期服务了高精地图产线需求,为高德地图构建高精度地图提供了基础的技术保证. 1.面标识识别 地面标识识别,指在地图道路中识 ...
- 【论文阅读】Stroke Controllable Fast Style Transfer with Adaptive Receptive Fields
Stroke Controllable Fast Style Transfer with Adaptive Receptive Fields Abstract Introduction Related ...
最新文章
- 【Runtime】动态添加方法demo
- 理解卷积神经网络?看这篇论文就够了
- 计算机电缆外径相差太大,DJYPVP计算机电缆标准外径
- toString()与new String ()用法区别
- 16、ASP.NET MVC入门到精通——MVC过滤器
- java基本数据类型线程_Java基本数据类型
- plotly使用mapbox实现地图可视化
- 在JConsole和VisualVM中查看DiagnosticCommandMBean
- Mybatis generator(复制粘贴完成)
- win2008r2服务器维护,win2008 r2 服务器安全设置
- jdbc数据库配置mysql数据库_JDBC连接MySQL数据库(一)——数据库的基本连接
- Easyui 中获取DataGrid中所有数据
- c++实现课程管理系统
- 3脚送话器内部电路图_电话机维修送话电路故障
- 简单聊聊利用DNS服务器提供单一入口
- NX/UG二次开发—建模—批量创建重复特征方案优化
- 多重背包二进制优化(wzk吃小鸡腿)
- 浅谈尾调用和尾递归(C语言)
- 网线顺序-水晶头顺序
- Python-OpenCV API