旷视提出 DRConv:动态区域感知卷积,提升分类 / 检测 / 分割性能。
《Dynamic Region-Aware Convolution》是2020年旷视在arXiv上的新论文,该论文实际上是在动态卷积(local形式)上引入了空间上的分组,从而显著提升了计算机视觉任务(分类检测分割)等性能,在云端实验还是非常值得尝试的。
论文地址:
https://arxiv.org/abs/2003.12243

内容

将图像划分成不同的区域,在不同的区域上使用不同的卷积。区域内卷积是通用的,不同区域卷积不通用。G()是生成卷积的模块,有多少个区域,就生成多少个卷积核。

在区域上的卷积:

u,v,c,o:高、宽、通道、output
W:卷积核
S:卷积区域

区域的生成:

其实是M个卷积核,在这个guided mask上卷积后生成了M个特征,将这些特征称作区域。
W是M个卷积和,Wm(u,v),M(u,v)是索引,范围是0到m-1,M(u,v)的值是在(u,v)处,m个特征F里,像素最大的F所在的通道。

guided mask的生成-Eq4:

对原始图像卷积后,使用argmax或者softmax将各通道像素合并成一个通道。

M个卷积核的生成-Eq.(5):

1,使用AAP将X下采样到kk的大小,共m个,不使用激活层
2,使用softmax将x映射成k
k的大小。
然后,使用1和2相加,或者其他方法(文中没说),合并12成为m个卷积核。

Dynamic Region-Aware Convolution相关推荐

  1. xilinx vivado 综合时内存不够问题 One or more synthesis runs failed during dynamic region dcp generation

    ERROR: [VPL 60-773] In '/home/john/project/vadd/vadd_system_hw_link/Hardware/binary_container_1.buil ...

  2. 三维点云的深度学习研究综述

    作者丨aaa 来源丨https://zhuanlan.zhihu.com/p/455210291 编辑丨3D视觉工坊 摘要 点云学习由于在计算机视觉.自动驾驶.机器人等领域的广泛应用,近年来受到越来越 ...

  3. Deep Learning for 3D Point Clouds: A Survey 论文阅读

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 Abstract:在点云深度学习中,主要包含的任务有:3D形状分类.3D目标检测和跟踪.3D点云分割. ...

  4. TPAMI三维点云深度学习技术综述

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 作者丨单博 来源丨 笑傲算法江湖 点击进入->3D视觉工坊学习交流群 国防科大 IEEE TPA ...

  5. 点云综述学习笔记(一)

    论文链接:Deep Learning for 3D Point Clouds: A Survey 参考博客http://www.huangli.com/?d 作者及团队:Yulan Guo∗, Han ...

  6. ICRA2021 SLAM方向论文汇总

    ICRA 2021会议也已经开完了, 所以对原来总结SLAM方向相关的文章进行了重新整理和补全,由于总结比较广泛,大约有200多篇,本文对论文进行了分类,并给出了下载地址和开源代码地址,希望对一起做S ...

  7. ICRA 2021自动驾驶相关论文汇总 | 科研党看过来,全文干货

    本文来源:知乎作者:wanghy,编辑:智车科技 / 导读 / ICRA(International Conference on Robotics and Automation)是IEEE机器人与自动 ...

  8. Reproducible Research in Computational Science

    Reproducible Research in Computational Science from: http://www.csee.wvu.edu/~xinl/source.html " ...

  9. 【今日CV 计算机视觉论文速览 第112期】Mon, 6 May 2019

    今日CS.CV 计算机视觉论文速览 Mon, 6 May 2019 Totally 31 papers ?上期速览✈更多精彩请移步主页 Interesting: ?HDR图像超分辨联合算法, 通过重建 ...

  10. 【今日CV 视觉论文速览】29 Nov 2018

    今日CS.CV计算机视觉论文速览 Thu, 29 Nov 2018 Totally 54 papers Daily Computer Vision Papers [1] Title: 3D human ...

最新文章

  1. python windows epoll_Windows 10生产力提升之WSL实践
  2. Shiro.ini文件概述
  3. ASP.NET MVC过滤器
  4. Java代码质量检测评估工具-Findbugs
  5. IOS 集成支付宝和邮件发送
  6. 误操作导致系统只剩下lo
  7. C++:04---内联函数
  8. Pensando Distributed Services Architecture [Pensando 分布式服务架构] - 翻译
  9. Unity 提取游戏资源之ktx转换
  10. 泰勒公式推导过程_#泰勒#(Taylor)公式真的很难很难吗?
  11. 在Ubuntu 18.04上搭建HttpRunnerManager服务
  12. java web mysql备份,Java Web 实现Mysql 数据库备份与还原
  13. 深入浅出通信原理MIMO合集
  14. [复习]Python基础回顾
  15. java foreach 中止_如何正确终止 forEach
  16. android手机电视投影,教程向 | 手机投屏激光电视操作指南
  17. 【github】上有意思的深度学习项目——照片漫画风
  18. C#重载函数与可选参数简单实例
  19. 【元胞自动机】元胞自动机地铁火灾疏散模型【含Matlab源码 246期】
  20. C#API说明【Write函数】[汉字转拼音]

热门文章

  1. linux shell之回放和广播
  2. %Y 与 %y 的区别
  3. 学习Vue3 第四章(模板语法 vue指令)
  4. 喝~,我笑了,组长交给他如何写定时任务,他却用来撩女朋友(schedule )
  5. Acwing---844. 走迷宫——BFS
  6. Java企业级开发框架(三):POM文件——1概述
  7. Document-Level Relation Extraction with Adaptive Focal Loss and Knowledge Distillation
  8. EasyNVR调取接口在web页实现多通道同时直播
  9. Unity - 优化 Vector3.ProjectOnPlane
  10. JAVA中parse和format用法