Dense Label Encoding for Boundary Discontinuity Free Rotation Detection

原文链接

代码链接

文章目录

  • Author
  • Abstract
  • 1、Introduce
  • 2、Related Work
    • 2.1Horizental Object Detection Models(水平目标检测)
    • 2.2Rotation Object Detection Models(旋转目标检测)
  • 3、Mitigating Boundary Discontinuity by Classification(通过分类减轻边界不连续)

Author


上海交通大学和中国科学院大学

Abstract

旋转检测一般是基于回归的方向估计方法,本论文提出一种较少研究的基于分类的方法。主要有两方面内容:
1.一种新的编码机制
用于角度分类的两种密集编码标签Densely Coded Labels (DCL)代替稀疏编码标签Sparsely Coded Label (SCL):现存的基于分类检测器的标签机制
训练速度提高了三倍。
2.损失重新加权
提出 角度距离和纵横比敏感加权Angle Distance and Aspect Ratio Sensitive Weighting(ADARSW)
提高了方形物体的检测精度,使得基于DCL的检测器对角距离和纵横比敏感。

1、Introduce

旋转目标检测因在不同场景中的重要作用而越来越受到关注,包括航空图像、场景文本、人脸等,与具有大量文献的水平目标检测来说,旋转目标检测研究较少。水平目标检测不能估计精确的旋转,只能输出水平框。
很多主流的在航空图像、场景文本和人脸的旋转目标检测算法是由普通的检测算法衍生而来的。其中以基于五个参数
(x,y,w,h,θ)
(中心点的坐标,宽度,高度,旋转角度)描述旋转边界框

的旋转目标检测算法为主。与水平目标检测中坐标回归方法相似,角度参数也是通过回归预测的。虽然已经取得了一些成果,但是基于回归的旋转目标检测仍然有一些基础性的缺点。基于回归的角度预测经常引入边界不连续的,包括角度的周期性(PoA)和边缘的可交换性(EoE)。角度的周期性是由于角度参数的有界周期性。边缘的可交换性与边界框的定义有关。一般来说是理想的预测超出了边界框的范围。由于边界损失的急剧增加,边界和非边界的模型回归形式不能完全一致。因此模型在边界处预测角度必须以更复杂的形式,增加了模型的负担,也增加了边界预测的难度。这对于旋转目标检测获取高精度是一个致命的缺点,特别是具有大的横纵比的目标来说。
(基于回归得旋转目标检测:边界不连续造成的边界损失急剧增加)
目前大多数的工作旨在增加对损失函数的约束或者改变计算方法来消除突然增加的损失,如IoU Smooth L1 Loss和Modulated Loss,表1中所示。

这样做的好处是能够借用发展比较好的水平目标检测上的baseline,并且重用相关技术来提高检测性能。然而,一些专门的基于回归的检测器不能保证完全消除边界不连续问题。为了给出一个更有效地方法,最近的工作Circular Smooth Label(CSL)主张应用角度分类代替回归解决PoA(角度的周期性).。然后,基于CSL的方法结合边界框的长边定义(5个参数加180角度范围)进一步解决EoE(边可交换性)问题。
这种CSL+180的方法可以自然的解决边界不连续问题。由于基于角度分类的检测器处于早期阶段,存在一些问题,比如预测层过于厚重和处理类正方形存在困难。这第一个问题(预测层过于厚重)文献57初步探讨研究。本文是推进基于分类的努力之一,具体进展如下:

首先,与稀疏编码标签相比(与稀疏编码标签(SCL,包括CSL,One-Hot编码),我们设计了两个密集编码标签(DCL),这在经验上显著减少了训练时间,同时提高了检测精度。为了使DCL和CSL对角度距离一样敏感,我们计算预测角和角度标签的小数差值作为角度距离感知权重。然而这个权重又重新引入了PoA问题,并且发现长边定义方法不利于类正方形目标的训练。基于发现的以上两个问题,我们设计了角度距离和纵横比敏感加权(ADARSW)。ADARSW消除了PoA问题,并且可以根据目标的长宽比进行自适应调整,大大减轻了模型训练的负担。DCL+180◦+ADARSW作为一个整体,在不同数据集和检测器上上大量实验和可视化分析,基于DCL比基于角度回归和基于CSL更好。总之,我们的工作有以下贡献:
1)为了提高鲁棒性,特别是小长宽比的目标,我们提出ADARSW,通过基于DCL的检测器对角度距离和目标长宽比敏感,进一步提升了精度。相反,基于CSL的检测器受到用于检测正方形物体的长边定义。
2)我们比较了两个经典的密集编码标签(DCL)的影响,通过将它们引入角度分类任务来实现潜在的加速,即二进制编码标签(BCL)和格雷编码标签(GCL),它们比现有的CSL更紧凑。虽然对GCL进行了部分研究,但本文对其进行了更深入的研究。我们的经验表明,DCL,尤其是BCL,可以显著提高训练速度(约三倍)和检测精度。
3)对不同数据集和检测器的大量实验和可视化分析证明了我们技术的有效性。它优于最先进的CSL探测器:77.37% vs. 76.17% on DOTA dataset。

2、Related Work

2.1Horizental Object Detection Models(水平目标检测)

目标检测在计算机视觉领域是一个基础任务,它在近年来迅速发展。基于经典卷积神经网络(CNN)的检测器主要分为两类:两阶段目标检测和单阶段目标检测。两阶段是基于区域提案,在一些benchmarks已经取得了一些成果,单阶段的检测方法是回归问题,保持了一个很快的速度。与anchor-based相比,anchor free几年来变得越来越流行。CornerNet,FCOS,CenterNet和ExtremeNet尝试去预测一些关键点,比如角点或者极值点,然后将其分组到边界框中。最令人惊讶的是DETR是基于transformer的目标检测的新范式,实现了anchor free同时实现非极值抑制自由。然而,水平物体检测器不能提供精确的方向和比例信息,因此它们不能直接应用于某些特定的场景,例如航空图像和场景文本。

2.2Rotation Object Detection Models(旋转目标检测)

3、Mitigating Boundary Discontinuity by Classification(通过分类减轻边界不连续)

Dense Label Encoding for Boundary Discontinuity Free Rotation Detection相关推荐

  1. 文献记录(part91)--A boundary method for outlier detection based on support vector domain description

    学习笔记,仅供参考,有错必纠 关键词:离群点检测:支持向量域描述 A boundary method for outlier detection based on support vector dom ...

  2. 【ACMMM 2022】Depth-inspired Label Mining for Unsupervised RGB-D Salient Object Detection

    [ACMMM 2022]Depth-inspired Label Mining for Unsupervised RGB-D Salient Object Detection 代码:https://g ...

  3. CVPR2021目标检测方向论文

    完整的paper list已经出来了. http://cvpr2021.thecvf.com/node/142 CVPR2021录取结果刚出来,不过离全部的paper list还有一段时间,接下来应该 ...

  4. 华人占大半壁江山!CVPR 2021 目标检测论文大盘点(65篇论文)

    点击下方卡片,关注"CVer"公众号 AI/CV重磅干货,第一时间送达 作者:Amusi  |  来源:CVer 前言 CVer 正式盘点CVPR 2021上各个方向的工作,本篇是 ...

  5. CVPR 2021 | 上交和国科大提出DCL:旋转目标检测新方法

    本文作者:yangxue   |  来源:知乎(已授权) https://zhuanlan.zhihu.com/p/354373013 介绍 Densely Coded Labels (DCL)是 C ...

  6. ECCV2020 | 论文阅读——Arbitrary-Oriented Object Detection with Circular Smooth Label

    CSL基于圆形平滑标记的任意方向目标检测 Abstract 1 Introduction 2 Related Work 3 Proposed Method 3.1 Regression-based R ...

  7. 【笔记】DenseTNT:End-to-end Trajectory Prediction from Dense Goal Sets

    原文链接:https://arxiv.org/pdf/2108.09640.pdf Abstract TNT的方法是需要预先输入大概的target的,而DenseTNT不需要,是完全anchor fr ...

  8. 【目标检测】论文笔记Arbitrary-Oriented Object Detection with Circular Smooth Label(2020)

    目录 前情提要: 解决方案 Regression-based Rotation Detection Method Boundary Problem of Regression Method Some ...

  9. 【论文翻译】RetinaFace: Single-stage Dense Face Localisation in the Wild

    论文题目:RetinaFace: Single-stage Dense Face Localisation in the Wild 论文来源:RetinaFace: Single-stage Dens ...

最新文章

  1. 访问HTML标签的属性1
  2. 5G NR — gNB
  3. Daily Scrum4 11.6
  4. html.parser python_python模块之HTMLParser
  5. Linux下快速安装MySQL教程
  6. dvwa安装包linux,dvwa安裝、配置、使用教程(Linux)
  7. 祝广大运维人:2020新年快乐!
  8. USB加密狗复制克隆破解软件
  9. 前端之路--第三周学习
  10. 基于粒子群算法的微电网优化调度应用研究(六、总结与展望)
  11. Python 自动发送邮件
  12. CentOS下搭建Frp内网穿透服务
  13. 《苏菲的世界》读书笔记
  14. 摩托车新手驾驶教程[3]
  15. [蓝桥杯]蓝肽子序列(c++详解)
  16. 学习笔记三:MLP基本原理、矩阵求导术推反向传播、激活函数、Xavier
  17. APP下载二维码微信扫一扫无法打开解决方案
  18. LabVIEW编程基础:顺序结构编程
  19. 爬虫获取网易云音乐单曲或歌单实现音乐闹钟
  20. 盲源分离与压缩感知结合-论文阅读笔记

热门文章

  1. 惊爆:谷歌和苹果达成「抗疫」统一战线
  2. 采用计算机发布调度命令时 必须严格遵守,铁路行车规章复习题
  3. Java基础篇自然排序和定制排序
  4. CODING 联合 TKE,让应用发布更便捷
  5. 达梦数据迁移工具DMDTS
  6. 如何定时唤醒计算机命令,如何设置电脑每天自动关机,这个方法绝了!
  7. 面向对象___str__和__repr__
  8. ViewPager和Fragment实现滑动标签页步骤以及方法总结
  9. H5俄罗斯方块游戏开发-李强强-专题视频课程
  10. Cocos Creator基础(六) cc.Component使用+Shedule定时器操作