计算机视觉研究院专栏

作者:Edison_G

有些目标往往具有任意方向的分布。因此,检测器需要更多的参数来编码方向信息,这往往是高度冗余和低效的...

公众号ID|ComputerVisionGzq

学习群|扫码在主页获取加入方式

论文:

https://openaccess.thecvf.com/content/CVPR2021/papers/Han_ReDet_A_Rotation-Equivariant_Detector_for_Aerial_Object_Detection_CVPR_2021_paper.pdf

源代码:

https: //github.com/csuhan/ReDet

1

简要

近年来,航空图像中的目标检测在计算机视觉中得到了广泛的关注。与自然图像中的目标不同,航空目标往往具有任意方向的分布。因此,检测器需要更多的参数来编码方向信息,这往往是高度冗余和低效的。此外,由于普通的cnn没有明确地模拟方向变化,因此需要大量的旋转增强数据来训练精确的目标检测器。

研究者提出了一种旋转等变检测器(ReDet)来解决这些问题,该检测器对旋转等变和旋转不变性进行了显式编码。更准确地说,研究者在检测器中加入旋转等变网络来提取旋转等变特征,这样可以准确地预测方向,并大大减小模型尺寸。在旋转等变特征的基础上,提出了旋转不变RoI-Align(RiRoI-Align),该算法根据RoI的方向自适应地从等变特征中提取旋转不变特征。在DOTA-v1.0、DOTA-v1.5和HRSC2016等具有挑战性的航空影像数据集上进行的大量实验表明,新提出的方法能够在航空目标检测任务上达到最先进的性能。

2

背景

最近,许多设计良好的面向对象检测器被提出,并在具有挑战性的航空图像数据集上报告了有希望的结果。为了在无约束航空图像中实现精确的目标检测,大多数算法都致力于提取旋转不变特征。在实际应用中,旋转RoI(RRoI)扭曲(例如,rooi Pooling和rooi Align)是提取旋转不变特征最常用的方法,它可以根据二维平面上RRoI的边界框精确扭曲区域特征。然而,具有规则CNN特征的RRoI扭曲不能产生精确的旋转不变特征。通过使用更大容量的网络和更多的训练样本来模拟旋转变化,从而逼近旋转不变性。

如上图所示,规则cnn与旋转不等价,即向cnn传送旋转图像与原始图像的旋转特征映射不同。因此,从常规CNN特征图中扭曲出来的区域特征通常会随着方向的变化而变得不稳定。上图所示,新提出的方法由两部分组成:旋转等变特征提取和旋转不变特征提取。首先,将旋转等变网络引入到主干网络中,生成旋转等变特征,可以准确预测方向,降低建模的复杂度。由于直接应用RRoI扭曲仍然不能从旋转等变特征中提取旋转不变特征,研究者提出了一种新的旋转不变RoI对齐算法(RiRoI-Align)。

3

新框架

(a) Overall architecture of the proposed Rotation-equivariant Detector. We first adopt the rotation-equivariant backbone to extract rotation-equivariant features, followed by an RPN and RoI Transformer (RT) to generate RRoIs. Then we use a novel Rotation-invariant RoI Align (RiRoI Align) to produce rotation-invariant features for RoI-wise classification and bounding box (bbox) regression.

(b) Rotation-equivariant feature maps. Under the cyclic group CN , the rotation-equivariant feature maps with the size (K, N, H, W ) have N orientation channels, and each orientation channel is corresponding to an element in CN .

(c)RiRoI Align. The proposed RiRoI Align consists of two parts: spatial alignment and orientation alignment. For an RRoI (x, y, w, h, θ), spatial alignment warps the RRoI from the spatial dimension, while orientation alignment circularly switches orientation channels and interpolates features to produce completely rotation-invariant features.

4

实验结果

© THE END 

转载请联系本公众号获得授权

计算机视觉研究院学习群等你加入!

计算机视觉研究院主要涉及深度学习领域,主要致力于人脸检测、人脸识别,多目标检测、目标跟踪、图像分割等研究方向。研究院接下来会不断分享最新的论文算法新框架,我们这次改革不同点就是,我们要着重”研究“。之后我们会针对相应领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!

扫码关注

计算机视觉研究院

公众号ID|ComputerVisionGzq

学习群|扫码在主页获取加入方式

往期推荐

????

  • Sparse R-CNN:稀疏框架,端到端的目标检测(附源码)

  • 利用TRansformer进行端到端的目标检测及跟踪(附源代码)

  • 细粒度特征提取和定位用于目标检测(附论文下载)

  • 特别小的目标检测识别(附论文下载)

  • 目标检测 | 基于统计自适应线性回归的目标尺寸预测

  • 目标检测干货 | 多级特征重复使用大幅度提升检测精度(文末附论文下载)

  • SSD7-FFAM | 对嵌入式友好的目标检测网络,为幼儿园儿童的安全保驾护航

  • 目标检测新方式 | class-agnostic检测器用于目标检测(附论文下载链接)

  • 干货 | 利用手持摄像机图像通过卷积神经网络实时进行水稻检测(致敬袁老)

  • CVPR 2021 | 不需要标注了?看自监督学习框架如何助力目标检测

CVPR21最佳检测:不再是方方正正的目标检测输出(附源码)相关推荐

  1. CVPR最佳检测:不再是方方正正的目标检测输出(附源码)

    计算机视觉研究院专栏 作者:Edison_G 有些目标往往具有任意方向的分布.因此,检测器需要更多的参数来编码方向信息,这往往是高度冗余和低效的... 公众号ID|ComputerVisionGzq ...

  2. cmake的使用--目标的编译附源码

    building simple targets 代码仓库地址 https://github.com/zzu-andrew/linux-sys/tree/dfew/CMake Executables I ...

  3. Matlab之基于MTI雷达生成表面杂波和目标回波(附源码)

    目录 一.MTI 雷达基础知识 1.1 MTI 过滤器 1.2 平台几何形状 1.3 性能指标 二.宽边 MTI 仿真 2.1 场景配置 2.2 配置雷达 2.3 配置方案 2.4 配置平台 2.5  ...

  4. VC++实时检测耳机的插入与拔出(附源码)

    目录 1.实现继承于IMMNotificationClient接口类的CMMNotificationClient类,实时感知音频设备变化的通知事件

  5. 睿智的目标检测61——Pytorch搭建YoloV7目标检测平台

    睿智的目标检测61--Pytorch搭建YoloV7目标检测平台 学习前言 源码下载 YoloV7改进的部分(不完全) YoloV7实现思路 一.整体结构解析 二.网络结构解析 1.主干网络Backb ...

  6. 睿智的目标检测56——Pytorch搭建YoloV5目标检测平台

    睿智的目标检测56--Pytorch搭建YoloV5目标检测平台 学习前言 源码下载 YoloV5改进的部分(不完全) YoloV5实现思路 一.整体结构解析 二.网络结构解析 1.主干网络Backb ...

  7. 睿智的目标检测62——Keras搭建YoloV7目标检测平台

    睿智的目标检测62--Keras搭建YoloV7目标检测平台 学习前言 源码下载 YoloV7改进的部分(不完全) YoloV7实现思路 一.整体结构解析 二.网络结构解析 1.主干网络Backbon ...

  8. 深度篇——目标检测史(二) 细说 R-CNN 目标检测

    返回主目录 返回 目标检测史 目录 上一章:深度篇--目标检测史(一) 关于 古典 目标检测 下一章:深度篇--目标检测史(三)  细说 SPP-Net 目标检测 论文地址:<Rich feat ...

  9. 深度篇——目标检测史(七) 细说 YOLO-V3目标检测 之 代码详解

    返回主目录 返回 目标检测史 目录 上一章:深度篇--目标检测史(六) 细说 YOLO-V3目标检测 下一章:深度篇--目标检测史(八) 细说 CornerNet-Lite 目标检测 论文地址:< ...

最新文章

  1. 管理系统模板c语言,管理系统c语言
  2. tar.gz 文件类型(tar文件的解压和压缩)
  3. BeanUtils.copyProperties 需要getset方法支持
  4. 按月拆分数据库表--oracle
  5. MySQL 创建索引
  6. perl python ruby_perl,lua,python,ruby的对比(3) -- lambda,closure,proper tail function call
  7. sklearn中的xgboost_XGBoost的介绍、应用、调参、知识点
  8. ztree 后台异步加载_Ztree 分批异步加载
  9. 机器学习_深度学习毕设题目汇总——数据分析_数据挖掘
  10. Android控件组合应用四
  11. 基于c语言实现的TCP连网斗地主程序(一)
  12. “企业级零代码黑客马拉松大赛”决赛名单公布
  13. 初识Photoshop
  14. 美军回应网传UFO:视频为真 现有人类技术无法达到
  15. Apache漏洞汇总:
  16. 【雕爷学编程】Arduino动手做(57)---四档矩形波模块
  17. 美颜的奥秘——磨皮底层原理
  18. Web Sockets
  19. PlantSimulation属性操作全家桶
  20. qrc路径_Windows下 Qt 资源文件(.qrc)文件 的 编写与应用

热门文章

  1. 试用期程序员工作总结
  2. java 发送短信验证码(使用网易云信)
  3. Visual Basic 6 何以长盛不衰?
  4. 腾讯云游戏使用方法(不需要下载客户端就可以玩英雄联盟)(旧电脑玩英雄联盟方法)
  5. js 删除数组中指定元素
  6. java程序员的日常小感悟
  7. 地线与接地螺丝_接地线使用方法和注意事项
  8. 华容道3x3的技巧_数字华容道怎样才能有解
  9. [转]视觉中国的NoSQL之路:从MySQL到MongoDB
  10. 服务器断电导致虚拟机数据丢失怎么恢复?