目标检测之Dynamic Head: Unifying Object Detection Heads with Attentions
cvpr2021
论文:https://arxiv.org/pdf/2106.08322v1.pdf
代码:https://github.com/microsoft/DynamicHead
1、摘要
作者认为目标检测的头部是由三个部分组成:首先,头部应该是尺度感知的,因为多个具有极大不同尺度的物体经常共存于一幅图像中,FPN。其次,头部应该是空间感知的,因为物体通常在不同的视点下以不同的形状、旋转和位置出现,膨胀卷积、可变形卷积。第三,头部需要具有任务感知,因为目标可以有不同的表示形式(例如边界框、中心和角点),它们拥有完全不同的目标和约束没,RPN。
本文的动态检测头就是通过注意力学习将这三个任务集中在一起解决。
2.实现方法unified attention
1.尺度感知:物体尺度上的差异合起所在不同的特征层有关,可以通过改进不同尺度的特征来提高尺度感知
2.空间感知:改进不同空间位置的表示学习可以提高目标检测的空间感知能力
3.任务感知:改进不同通道的特征提取方式来提高任务感知能力
R L × H × W × C R^{L×H×W×C} RL×H×W×C令 S = H ∗ W S=H*W S=H∗W得 R L × S × C R^{L×S×C} RL×S×C分别代表着Layer,Space,Channel。分别在level-wise,spatial-wise,和channel-wise等每个独特的特征维度上分别地应用attention 机制:
W ( F ) = π c ( π s ( π l ( F ) ∗ F ) ∗ F ) W(F)=π_c(π_s(π_l(F)*F)*F) W(F)=πc(πs(πl(F)∗F)∗F)
2.1Spatial-aware Attention
将这个模块分成两步:先用可变卷积学习稀疏的空间注意力,然后在同样的位置上,对不同层次的特征进行集成。
K K K是稀疏采样地点的数量, p k + Δ p k p_{k}+\Delta p_{k} pk+Δpk是self-learned空间位置的偏移量,通过自学习空间补偿 Δ p k \Delta p_{k} Δpk来关注有区别的区域,并且 Δ m k \Delta m_{k} Δmk是位置 p k p_{k} pk处的自学习重要标量。两者都从 F \mathcal{F} F的输入特性从平均水平。
self.DyConv = nn.ModuleList()self.DyConv.append(conv_func(in_channels, out_channels, 1))#只改stride和通道数的可变性卷积self.DyConv.append(conv_func(in_channels, out_channels, 1))self.DyConv.append(conv_func(in_channels, out_channels, 2))
2.2Scale-aware Attention πL
首先基于语义重要性,动态的融合融合特征
f为和1*1卷积类似的线性函数,σ为sigmoid函数
self.AttnConv = nn.Sequential(nn.AdaptiveAvgPool2d(1),#自适应均值池化nn.Conv2d(in_channels, 1, kernel_size=1),nn.ReLU(inplace=True))self.h_sigmoid = h_sigmoid()spa_pyr_attn = self.h_sigmoid(torch.stack(attn_fea))mean_fea = torch.mean(res_fea * spa_pyr_attn, dim=0, keepdim=False)
2.3Task-aware Attention
通过开关max()函数来控制是否学习这部分的注意力,这部分内容感觉有点牵强.αβ都是超参数,配合max函数来控制是否激活注意力的,fc是通道切片。动态的对通道进行开关,来适应不同的任务。
3.算法流程
在特征金字塔上的应用:首先在特征金字塔上应用scale-aware attention和spatial-aware attention,然后ROI-pooling layer之后开始使用task-aware attention来替代原来的全连接层
目标检测之Dynamic Head: Unifying Object Detection Heads with Attentions相关推荐
- Dynamic Head: Unifying Object Detection Heads with Attentions
Dynamic Head 论文标题:Dynamic Head: Unifying Object Detection Heads with Attentions 论文地址:https://arxiv.o ...
- Dynamic Head: Unifying Object Detection Heads with Attentions论文阅读
Dynamic Head: Unifying Object Detection Heads with Attentions论文阅读 摘要 介绍 相关工作 方法 Dynamic Head 扩展到现存的检 ...
- Dynamic Head Unifying Object Detection Heads with Attentions 论文阅读笔记
Dynamic Head Unifying Object Detection Heads with Attentions论文阅读笔记 这是微软在CVPR2021发表的文章,在coco数据集上取得了目前 ...
- Dynamic Head :Unifying Object Detection Heads with Attentions
Dynamic Head :Unifying Object Detection Heads with Attentions 作者针对目标检测中通过backbone提取特征金字塔后的输出后,会形成最基 ...
- 【目标检测】61、Dynamic Head Unifying Object Detection Heads with Attentions
文章目录 一.背景 二.方法 2.1 scale-aware attention 2.2 spatial-aware attention 2.3 task-aware attention 2.4 总体 ...
- Dynamic Head: Unifying Object Detection Heads with Attentions 阅读
Abstract 这里就是说在目标检测领域,很多工作都想提高检测头的性能,这篇文章提出了动态头,也就是Dynamic Head,来将检测头和注意力(Attention)结合.在尺度(scale-awa ...
- 目标检测-Oriented RepPoints for Aerial Object Detection(CVPR 2022)
目标检测-Oriented RepPoints for Aerial Object Detection(CVPR 2022) 论文地址:Oriented RepPoints for Aerial Ob ...
- 【开放域目标检测】一:Open-Vocabulary Object Detection Using Captions论文讲解
出发点是制定一种更加通用的目标检测问题,目的是借助于大量的image-caption数据来覆盖更多的object concept,使得object detection不再受限于带标注数据的少数类别,从 ...
- 人工智能 | 增强小目标检测(Augmentation for small object detection)
博主github:https://github.com/MichaelBeechan 博主CSDN:https://blog.csdn.net/u011344545 Augmentation for ...
最新文章
- MySQL为Null导致莫名其妙的5大坑
- 十年技术,不要再迷茫
- MATLAB实战系列(三十三)-技术和医疗的完美结合(续),基于最小二乘法的椭圆拟合
- 只开窗不镀锡_翡翠为什么要开窗??————开窗有哪几种?
- mysql数据库存储数据的过程_[数据库]MySql存储过程总结
- Django——2 路由分配设置 re_path正则匹配 include总路由 url传参 name使用 模板渲染render方法 模板渲染方法...
- python——rang函数、for、braek循环
- Nodejs学习笔记(六)——Mysql模块
- coreboot学习4:启动流程跟踪之romstage阶段
- 2.第一本 docker 书 --- docker 镜像
- C++ 使用sqrt函数计算平方根
- 2022-2028年中国全屋定制行业发展动态及投资前景分析报告
- 《甄嬛传》计谋汇总, 本文忠实于《后宫 甄嬛传》第1本~第7本+番外原文,而非电视剧。
- Windows Workflow Foundation中实现人工活动的demo,按照XPDL规范的实现
- 计算机毕业设计之java+ssm供应链管理信息系统
- (最新,所有kali版本通用)kali中安装搜狗输入方法
- 《Java编程思想》读书笔记
- 免费领取三个月苹果ARCADE订阅教程
- Bmob后端云初体验
- 光纤布线兵法之特色产品(一)
热门文章
- 广电炮轰宽带市场垄断幕后
- swift3 多个异步网络请求转同步
- C#学生管理系统——班级列表(查询功能)
- 聊聊周报-团队管理和自我管理的利器
- Oracle PL/SQL中EXCEPTION用法
- python按照字典顺序输出字母_按层次和字母顺序对字典排序(Python)
- 网络游戏demo开发实例:多人在线RPG游戏(MMO RPG)demo的开发记录(第3篇)
- numpy 数组 ::_看起来不错,没有麻烦:使用NumPy进行数组编程
- 惊艳!华为折叠屏5G手机Mate X发布,称3秒下载1GB视频
- 显示本地未连接服务器ip,本地连接显示未识别怎么办