论文

Learning Calibrated-Guidance for Object Detection in Aerial Images
paper:https://arxiv.org/abs/2103.11399
code:https://github.com/WeiZongqi/CG-Net

本篇论文是在arxiv偶然看到的,主要是在航空图数据集上做目标检测。目前航空图方面的检测由于dota数据集的产生以及结合小目标检测,旋转框检测等目标检测领域难点而日渐受到关注。这篇CG-net是将transformer应用在航空图小目标检测上的思路,给我们做小目标检测提供一些思路。这篇貌似是没中cvpr。。。不过效果挺不错的。

概述


常看cv论文的都知道,图画的清不清晰决定了这篇论文要看多久。这篇论文图画的非常清楚明了。

详解

整个网络结构简单来概括就是FPN+transformer,cv中的attention机制一般分为两种:spatial attention和channel attention。spatial attention就是给每个像素或者其他表示空间信息的参数添加一个权重参数,忽略不同通道上的信息。channel attention是给每个通道添加一个权重参数。本文说自己提出了一种新的attention,但看到网络结构图的时候发现就是transformer,Q,K,V一个没变,一模一样。。。

网络由backbone+FPN+RP-CG+head组成。重点在FPN和RP-CG。图中也画得比较明了了。backbone的输出分成不同尺寸的几层,每一层在channel维度上分成N个部分。然后进入N个注意力头,每个head中使用transformer中的self-attention模块。将N个head的输出再在channel维度上合成。

输出进入RP-CG后,对每一层进行上采样,统一到一个尺寸。每一层都进入self-attention模块,将结果进行平均池化,和FPN的输出相加。最后丢进检测网络。

实验结果


上表是在dota数据集上的表现。

小目标检测论文笔记:Learning Calibrated-Guidance for Object Detection in Aerial Images相关推荐

  1. 目标检测(降低误检测率及小目标检测系列笔记)

    深度学习中,为了提高模型的精度和泛化能力,往往着眼于两个方面:(1)使用更多的数据(2)使用更深更复杂的网络. ** 一.什么是负样本 ** 负样本是指不包含任务所要识别的目标的图像,也叫负图像(Ne ...

  2. Stitcher-小目标检测算法 | Stitcher: Feedback-driven Data Provider for Object Detection

    刚出来的小目标检测论文 论文地址:https://arxiv.org/pdf/2004.12432.pdf Abstract: 目标检测器通常会根据尺寸不同具有不同性能表现,其中小物体的性能最不令人满 ...

  3. IEEE TGRS2019|【论文笔记】R2-CNN: Fast Tiny Object Detection in Large-Scale Remote Sensing Images

    R²-CNN: Fast Tiny Object Detection in Large-Scale Remote Sensing Images 快速轻量的大尺度遥感图像目标检测框架 论文地址:http ...

  4. 【论文学习】Towards Accurate Oriented Object Detection in Aerial Images with Adaptive Multi-level Feature

    AFF-Det: 通过自适应多级特征融合实现航空图像中的精确定向目标检测 论文链接:<Towards Accurate Oriented Object Detection in Aerial I ...

  5. 3d object是什么文件_[单目3D目标检测论文笔记] 3D Bounding Box Estimation

    本文是3D Bounding Box Estimation Using Deep Learning and Geometry的论文笔记及个人理解.这篇文章是单目图像3d目标检测的一个经典工作之一.其目 ...

  6. 目标检测论文笔记二:CenterNet《Objects as Points》

    论文通过将物体建模成一个物体中心点,使用关键点估计网络来预测物体中心并回归一系列物体属性(长宽高等等).并且相比于基于anchor的物体检测器,CenterNet 更简单.更快.更准确. 网络的整个运 ...

  7. 目标检测 | RetinaNet:Focal Loss for Dense Object Detection

    论文分析了 one-stage 网络训练存在的类别不平衡问题,提出能根据 loss 大小自动调节权重的 focal loss,使得模型的训练更专注于困难样本.同时,基于 FPN 设计了 RetinaN ...

  8. 目标检测(二)--Hough Forests for Object Detection

    原文: http://www.cnblogs.com/walccott/p/4956860.html 09年cvpr上提出霍夫森林的文章--Class-Specific Hough Forests ...

  9. 【3D目标检测】WEAKM3D: TOWARDS WEAKLY SUPERVISEDMONOCULAR 3D OBJECT DETECTION

    目录 概述 细节 背景 算法流程 最终损失 几何目标点云对齐损失 射线追踪损失 基于点密度的点级损失平衡 边界框参数预测的解耦 概述 [2022][WEAKM3D] 研究的问题: 核心问题:如何以2D ...

最新文章

  1. 为什么Python没有main函数?
  2. windows下:ERROR 1366 (HY000): Incorrect string value: ‘\xC1\xF5\xB1\xB8‘ for column ‘name‘ at row 1
  3. 【图文详解】如何彻底删除JDK(以win10、jdk1.8为例)
  4. leetcode 231. 2的幂
  5. C/C++ 不可不知道的编程技巧!第一部分
  6. phpcmsV9 公告内容(图片不显示问题)
  7. 面向对象的JavaScript框架 MooTools
  8. 暴风影音CEO冯鑫的人生解读
  9. php mysql闪退_别批:mysql闪退问题如何解决??
  10. oracle 手动添加分区,Oracle 分区表怎么添加分区
  11. 交叉验证中cv=? 与 cv=KFold(n_splits=?)的区别
  12. 您要的FPGA开发软件都在这里
  13. 在自行下载的背景图片上写字
  14. 柜台收取西联汇款经验(网友分享)
  15. 2022.4.10 ShanDong Multi-University Training #1 QLU-team#8 の 赛后总结
  16. keil设置c语言字体大小,Keil uVision4怎么放大字体?放大字体和关键字标注颜色方法介绍...
  17. java 依赖的项目报错_关于eclipse的maven项目Java Build Path中maven依赖报错问题
  18. linux人必须知道之人
  19. 共享单车靠什么赚钱?
  20. java基础入门-04-【集合学生管理系统】

热门文章

  1. 学会php后能从事什么工作?
  2. 关于Java 软件工程师应该知道或掌握的技术栈
  3. docker(虚拟化,沙箱(沙盒),简介,docker和vm的区别,安装,基本操作,基本使用) 镜像的操作 容器的操作 使用mysql镜像 使用canda创建虚拟环境
  4. 打怪升级-世界机器人开发者大赛
  5. 3 5mm接头(耳机头)到RCA接头(莲花头)转接线制作
  6. 科一考完很久了,怕三年有效期快满了,如何查科一通过的具体日期?
  7. Flame Graphs 火焰图安装与使用
  8. 【附源码】计算机毕业设计JAVA医院预约挂号系统
  9. java 矩阵分解_矩阵论学习笔记四:矩阵分解 | 学步园
  10. UDP 的报文结构和注意事项