Dynamic Filter Networks

2019-06-10 11:29:19

Paper:http://papers.nips.cc/paper/6578-dynamic-filter-networks.pdf

Code (Lasagne):https://github.com/dbbert/dfn

1. Background and Motivation:

标准卷积神经网络中,都是采用训练之后学习到的 filters,而本文则提出了一种新的学习框架,称为:Dynamic Filter Network,该网络中的 filter 是根据输入动态生成的。 这种框架更加灵活,强大,并没有提增加模型的参数个数。广泛的 filtering operation 都可以采用这种框架,包括:local spatial transformations, selective blurring 或者 adaptive feature extraction. 此外,也可以用于循环网络框架中(如 Recurrent architecture)。

该模型包含两个部分:

1). filter-generating network, 可以基于给定的输入,动态的生成 sample-specific filter network。该参数并非是固定的,像正则化模型参数;

2). dynamic filtering layer, 然后将这些 filters 应用到输入上。

这两个模块都是可微分的。作者还基于此提出了一种 dynamic local filtering layer,不但是 sample-specific,而且是 position-specific 的。这些 filters 从不同 position 以及 不同 samples 都是可变化的,允许我们在在输入上进行更多操作。该框架可以学习 spatial 和 photometric changes,因为像素不是简单的进行放置的,filters 可能在所有的近邻上进行操作。

2. Dynamic Filter Networks :

如上图所示,本文所提出的网络的结构,主要包含两个模块:一个是 filter 产生模块,另一个是 dynamic filter layer。这两个模块都是可微分的,模块的输入可以是相同的,也可以是不同的,具体跟所涉及的任务相关。为了清晰起见,作者这里解释了 model parameters 和 dynamically generated parameters 的区别:model parameters 表示预先进行初始化的 layer parameters,仅仅在 training 阶段进行更新;而 dynamic generated parameters 是 sample-specific 的,并且可以快速的进行产生,而不需要进行初始化。本文所涉及的 filter-generating network 输出的是 dynamically generated parameters,但是该网络本身的参数是属于 model parameters。

2.1 Filter-Generating Network:

滤波产生网络的输入是 $I_A$, 其输出 filter $F_{\theta}$,该滤波器可以用于输入 $I_B$ 上来产生一个输出 G,滤波器的大小决定了感受野的大小,其选择依赖于具体应用。感受野的大小还可以通过堆叠多层动态滤波模块来实现增加。

2.2 Dynamic Filtering Layer :

该模块将输入的图像或者特征 $I_B$ 作为输入,然后输出滤波之后的结果 G。

Dynamic convolutional layers: 就前文讲的,此处的卷积操作用的卷积核是动态生成的,而不是预训练产生的。其公式化表达如下:

这些 filter 是 sample-specific 的,并且是基于 filter-generating network 的输入的。动态卷积层如下图所示:

Dynamic local filtering layer :

作为上述 dynamic convolution layer 的一种拓展,dynamic local filtering layer 提供了一种更有意思的结果。在该 layer 中,filter operation 不再是 translation invariant。不同的滤波器用于输入 $I_B$ 的不同位置,这一点与传统的局部连接 layer 类似:对于输入 $I_B$ 的每一个位置 (i, j),一个特定的 local filter $F_{\theta}^{(i, j)}$ 是被用于 $I_B(i, j)$ 位置中心区域的:

用于这种 layer 的 filters 不再是 sample-specific,而是 position-specific。注意到,上述讲的 dynamic convolution 是 local dynamic filtering 的特例,其中 local filters 是在整个图像区域共享的。如下图所示,

当输入 $I_A$ 和 $I_B$ 都是图像的时候,一个很自然的方法是用卷积网络来实现 filter-generating network。也就是说,所产生的 position-specific filters 是依赖于 $I_A$ 区域中的 local image regions 的。

==

转载于:https://www.cnblogs.com/wangxiaocvpr/p/10980434.html

Dynamic Filter Networks相关推荐

  1. 《Dynamic Filter Networks》动态过滤网络

    Dynamic Filter Networks <Dynamic Filter Networks>NIPS 2016 论文链接:https://arxiv.org/abs/1605.096 ...

  2. 【CVPR2021】Decoupled dynamic filter networks

    论文:https://thefoxofsky.github.io/files/ddf.pdf 代码:https://github.com/thefoxofsky/ddfnet 主页:https://t ...

  3. 优于 ViT 和 MLP-Mixer 的全局滤波器:Global Filter Networks for Image Classification [NeurIPS 2021]

    Global Filter Networks for Image Classification [pdf] [project] [github] 目录 Global Filter Networks f ...

  4. Dynamic Memory Networks DMN+

    DMN出自论文Ask Me Anything: Dynamic Memory Networks for Natural Language Processing(2015-06),这个模型用于Quest ...

  5. 论文阅读:(ICLR 2021) MULTIPLICATIVE FILTER NETWORKS

    论文阅读:ICLR 2021 MULTIPLICATIVE FILTER NETWORKS Code:https://github.com/boschresearch/multiplicative-f ...

  6. 论文笔记(十二):Particle Filter Networks: End-to-End Probabilistic Localization From Visual Observations

    Particle Filter Networks: End-to-End Probabilistic Localization From Visual Observations 文章概括 摘要 1. ...

  7. 【论文阅读】A Survey on Dynamic Neural Networks for Natural Language Processing

    论文信息 A Survey on Dynamic Neural Networks for Natural Language Processing 发表单位:University of Californ ...

  8. 论文解读:Dynamic Connected Networks for Chinese Spelling Check

    论文解读:Dynamic Connected Networks for Chinese Spelling Check   我们知道,拼写纠错任务比较类似预训练语言模型中的**Masked Langua ...

  9. 【代码阅读】Multiplicative Filter Networks (ICLR 2021)

    Multiplicative Filter Networks 2022/7/9:今天从双人间搬到了单人间,整理完了寝室,稍微整理一下MFN的代码. 之前论文阅读的链接是论文阅读:(ICLR 2021) ...

最新文章

  1. 链路负载均衡的链路和NAT地址保持
  2. SQL-18 查找当前薪水(to_date='9999-01-01')排名第二多的员工编号emp_no、薪水salary、last_name以及first_name,不准使用order by...
  3. 博客会被搬去csdn
  4. Unrecognized Hadoop major version number: 3.0.0-cdh6.3.2
  5. leetcode - Single Number
  6. SpringMVC核心分发器DispatcherServlet分析[附带源码分析]
  7. 浪费超9000亿美金,数字化转型失败罪魁祸首在DevOps?
  8. mysql用一条sql语句删除重复记录_mysql中删除重复记录,并保留重复数据中的一条数据的SQL语句...
  9. 项目经理要提升需求分析的能力
  10. 纯Qt版中国象棋:实现双人对战、人机对战及网络对战
  11. c语言中如何识别空格键,在C++中如何判断“空格”键输入?
  12. OCR表格识别(三)——文本检测与文本识别理论学习
  13. 推荐系统中的bais系统(二)—Select Bais和Exposure Bias
  14. win11修改C盘用户文件夹名称
  15. 基于单片机的信号发生器设计
  16. WPF和Halcon编程第一步,导入图像到Halcon的WPF窗口控件出错?
  17. Autofac简单介绍
  18. Your anti-virus program might be impacting 防火墙
  19. 吉安计算机教师招聘,吉安教师招聘
  20. 背景图片和颜色混合叠加多种混合模式

热门文章

  1. python爬取vnd.openxmlformats-officedocument.spreadsheetml.sheet类型数据
  2. 刺激战场错误码服务器维护中,刺激战场国际服登陆出现错误码servermaintenance是怎么回事?错误码servermaintenance解决方法一览...
  3. java注解定义常量_java自定义注解
  4. int 为什么是2147483647_INT_MAX (2147483647) 和INT_MIN (-2147483648)溢出
  5. 膝盖中了一箭之康复篇第四个月
  6. 【科普贴】SPI接口详解
  7. 卷毛机器人符文_卷毛分享锤石天赋攻略:守护者虚弱主w
  8. css设置滚动条样式,隐藏滚动条,设置滚动条宽度及背景色
  9. python异步编程之asyncio----百万并发
  10. iphone扫描文档jpg_如何使用iPhone的Notes应用程序扫描文档