论文:https://thefoxofsky.github.io/files/ddf.pdf
代码:https://github.com/thefoxofsky/ddfnet
主页:https://thefoxofsky.github.io/project_pages/ddf

先从论文首页的图说起。第一行为普通静态卷积,对于道路、车辆、建筑使用相同的卷积核,这样会导致一个问题:sub-optimal feature learning。第二行为动态卷积,每一个像素都使用不同的卷积核,道路、车辆、建筑使用的卷积核就不一样了,有助于特征学习。但是会引入一个新的问题:参数量大大增加。

可以看出,动态卷积的参数量从普通静态卷积的 (c×c×k×kc \times c \times k \times kc×c×k×k) 提升为 (c×c×k×k×h×wc \times c \times k \times k \times h \times wc×c×k×k×h×w ),参数量显著增加,计算复杂。为了降低计算量,作者提出了解耦的思路,把 (c×h×wc \times h \times wc×h×w) 分解成 (h×w+ch \times w + ch×w+c),即先计算空间位置的动态卷积,再计算通道上的动态卷积。

如图所示,包含两个步骤:

  • 在 spatial 维度上,首先用 1x1 的卷积将 channel 数变成 k2k^2k2,reshape后,就是每个空间位置上的卷积核,参数量是 k×k×h×wk\times k \times h \times wk×k×h×w
  • 在 channel 维度上,通过 GAP + SE 操作,每个 channel 得到一个 k2k^2k2 向量,即每个 channel 分配一个卷积核,参数量是k×k×ck\times k \times ck×k×c。

好的,终极问题来了? 每个空间位置上有一个卷积核,每个 channel 上有一个卷积核,如何把卷积核作用到 (c,h,w)(c, h , w)(c,h,w) 的三维矩阵中的每个像素上?

具体方法是: 每个像素点,找到与它 对应位置的卷积核对应通道的卷积核 ,这两个卷积核进行 逐像素相乘 ,得到新的卷积核再对这个点进行卷积

论文中还有一个点值得注意,为了提升性能,卷积核归一化时,作者设计了一个 Filter-Norm,性能会优于使用 Batch-Norm 和 Sigmoid,具体可以参考作者实验,不再多说。

【CVPR2021】Decoupled dynamic filter networks相关推荐

  1. 《Dynamic Filter Networks》动态过滤网络

    Dynamic Filter Networks <Dynamic Filter Networks>NIPS 2016 论文链接:https://arxiv.org/abs/1605.096 ...

  2. 【Paper】2003_Consensus Problems in Networks of Agents with Switching Topology and Time-Delays

    此篇文章主要在于仿真代码,关于文献的解释请参考 [Paper]2003_Murr_Consensus Problems in Networks of Agents with Switching Top ...

  3. 【UWB】Savitzky Golay filter SG滤波器原理讲解

    文章目录 简介 推导 举例 最小二乘法原理 Ref: 关于 Matlab 程序的操作请参考:[UWB]Savitzky Golay filter SG滤波器快速入门并上手使用 简介 Savitzky- ...

  4. 【UWB】Savitzky Golay filter SG滤波器快速入门并上手使用

    文章目录 函数介绍 示例程序 Ref: 关于 S-G 滤波器原理的讲解请参考: [UWB]Savitzky Golay filter SG滤波器原理讲解 函数介绍 Savitzky Golay fil ...

  5. 【论文研读】【医学图像分割】【BCRNN】Fine-grained Recurrent Neural Networks for Automatic Prostate Segmentation ...

    [论文研读][医学图像分割][BCRNN]Fine-grained Recurrent Neural Networks for Automatic Prostate Segmentation inUl ...

  6. 论文笔记 |【CVPR2021】Uformer: A General U-Shaped Transformer for Image Restoration

    论文笔记 |[CVPR2021]Uformer: A General U-Shaped Transformer for Image Restoration 文章目录 论文笔记 |[CVPR2021]U ...

  7. 【去噪去模糊去雨】Multi-Stage Progressive Image Restoration 多阶段渐进式通用图像恢复【CVPR2021】

    论文:[CVPR2021]Multi-Stage Progressive Image Restoration 多阶段渐进式通用图像恢复 参考:多阶段渐进式图像恢复 | 去雨.去噪.去模糊 | 有效教程 ...

  8. Dynamic Filter Networks

    Dynamic Filter Networks 2019-06-10 11:29:19 Paper:http://papers.nips.cc/paper/6578-dynamic-filter-ne ...

  9. 【Matlab】conv、filter、conv2、filter2和imfilter卷积函数总结

    [Matlab]conv.filter.conv2.filter2和imfilter函数总结 1. conv函数 作用: 1.计算一维向量卷积 u = [1 1 1]; v = [1 1 0 0 0 ...

最新文章

  1. python中将一个全部为int的list 转化为str的list
  2. Microbiome:宏基因组分箱流程MetaWRAP安装和数据库布置
  3. ref的mysql_ref:Mysql授权远程登陆
  4. 模拟银行自动提款系统python
  5. mysql查看触发器_在mysql中如何查看和修改触发器的代码?请问各位大师,小弟先谢谢了!!!!!!!!!...
  6. android 纯c/c++开发(转)
  7. boost 学习笔记
  8. full outer join 与full join的区别_基础小白的SQL的JOIN语法解析
  9. c语言ch能储存多少字符,二级c语言程序设计习题与解答ch5-7函数字符(11页)-原创力文档...
  10. 【think server rd340安装windows server 2008 R2 同时安装RAID驱动程序】
  11. 高斯过程回归matlab,高斯过程回归及其应用.PDF
  12. c语言爬楼梯不用递归,[leetcode]爬楼梯的递归和非递归方法
  13. oracle 终止imp,终止imp/exp和expdp/impdp进程运行的方法
  14. 攻城狮还是产品运营?
  15. LeetCode,无它,唯手熟尔(四)
  16. Kafka学习笔记 --- 生产者producer与消费者关系comsumer
  17. 不知道短视频很火的配音怎么制作?只需要看这一篇就够了
  18. linux克隆tf卡中的内容,TF/SD内存卡数据克隆怎么做教程
  19. 方舟生存进化助手隐私政策条款
  20. 毕业设计--2020.02.18 奇耘4.2寸墨水屏的程序设计思路分享

热门文章

  1. 手机浏览器devtools_使用DevTools在浏览器中调整设计
  2. 【单元复习】之标日初级上册第五、六单元
  3. css样式计数器,详细介绍CSS计数器
  4. 前端计算色系渐变颜色
  5. 什么是光学生物传感器存储?第2部分---凯利讯半导体
  6. DPoS共识机制白皮书理解
  7. CSS中的宽高自适应以及最小最大宽/高
  8. 项目管理实战高级课程
  9. 几种百度云盘下载速度慢解决方法,彻底让你直接拉满宽带
  10. 多所高校官宣:寒假提前,延长假期!开启学生第一批返乡工作