小目标检测(Small Object Detection)是指在图像中检测尺寸较小的目标物体,通常是指物体的尺寸小于图像大小的1/10或者更小,COCO为例,面积小于等于1024像素的对象维下目标。小目标检测是计算机视觉领域的一个重要研究方向,具有广泛的应用前景,例如安防监控、智能交通、无人机等。注:此篇会根据后面学的知识不断 更新,欢迎交流回访

背景:

目标检测在过去几年中取得了显著的进展,然而,由于小目标视觉特征较差、噪声较多,小目标检测已成为计算机视觉中最具有挑战性的任务之一。此外,用于小尺寸目标检测的大规模基准测试数据集仍然不够全面。

数据集:

SODA-D和SODA-A,分别关注驾驶场景和空中场景。SODA-D包括24704张高质量交通图像和9个类别的277596个实例。SODA-A收集了2510张高分辨率航空图像,并在9个类中注释了800203个实例。

目前研究现状:

虽然在通用目标检测方面取得了实质性进展,但小目标检测的研究进展相对缓慢,即使是SOTA网络,在检测小目标和正常尺寸目标方面也存在巨大的性能差距。以DyHead为例,DyHead在COCO测试集上小目标的平均精度(mAP)度量仅为28.3%,显著落后于中型和大型目标(分别为50.3%和57.5%)。
这种性能下降有两个原因:

  • 1) 从小物体的有限和扭曲信息中学习适当表征存在固有的困难;
  • 2) 缺乏用于小对象检测的大规模数据集;

最新进展:

  • 数据处理方法

    • 基于重/过采样的方法
    • 自动增强方案
  • 尺度感知方法
    • 分而治之的多尺度检测
    • 自适应定制的训练方案
  • 特征融合方法
    • 自上而下的信息交互
    • 精细特征融合
  • 超分辨率方法
    • 基于学习的尺度扩充
    • 基于GAN的超分辨率框架
  • 上下文建模方法
    • 人类可以有效地利用环境和物体之间的关系或物体之间的相互关系来促进物体和场景的识别。这种捕捉语义或空间关联的先验知识称为上下文,它将证据或线索传递到目标区域之外。上下文信息不仅在人类的视觉系统中至关重要,在场景理解任务中也至关重要。

主要挑战:

1.目标信息丢失
特征提取器通常利用子采样操作来过滤噪声,并降低特征图的空间分辨率,从而不可避免地丢失目标信息。考虑到最终特征仍然保留了足够的信息,这种信息丢失在一定程度上几乎不会影响大中型对象的性能。然而这对小目标来说是致命的,因为检测头很难在高度结构化的表示上给出准确预测,在这种表示中,小物体的微弱信号几乎被消除。

2.噪声特征表示
判别特征对于分类和定位任务都至关重要,小物体通常分辨率低,外观质量差,因此很难从其扭曲的结构中进行区分学习。同时,小对象的区域特征容易受到背景和其他情况的污染,从而进一步将噪声引入学习表示。综上所述,小目标的特征表示容易受到噪声的影响,阻碍后续检测。

3.边界框扰动的低容忍
定位作为检测的主要任务之一,在大多数检测范式中被表述为回归问题,其中定位分支被设计为输出边界框偏移,通常采用联合交集(IoU)度量来评估精度。然而,定位小对象比定位大对象更困难。如图下图所示,与中大型对象(56.6%和71.8%)相比,小对象预测框的微小偏差(沿对角线方向的6个像素)导致IoU显著下降(从100%降至32.5%)。同时,更大的差异(例如,12像素)进一步加剧了这种情况,对于小对象,IoU下降到可怜的8.7%。也就是说,与较大的对象相比,小对象对box扰动的容忍度较低,从而加剧了回归分支的学习。

主要算法如下:

  • 基于特征金字塔的方法:这种方法通过构建特征金字塔来捕获不同尺度的特征信息,然后将不同尺度的特征信息进行融合以提高目标检测的准确率。常见的基于特征金字塔的方法包括FPN(Feature Pyramid Network)、SSD(Single Shot Detector)等。

  • 基于注意力机制的方法:这种方法通过引入注意力机制来提高小目标的检测性能,例如SENet(Squeeze-and-Excitation Network)、CBAM、SKNet等。

  • 基于联合训练的方法:这种方法通过联合训练来提高小目标的检测性能,例如CornerNet、CenterNet等。

  • 基于弱监督学习的方法:这种方法通过利用弱监督学习技术来减少标注数据的需求,例如WOD(Weakly Supervised Object Detection)等。

  • 基于增强数据的方法:这种方法通过增加数据的多样性和难度来提高小目标的检测性能,例如使用数据增强技术 (随机裁剪、颜色抖动)、增加负样本等。

【aiy篇】小目标检测综述相关推荐

  1. 【文献阅读】小目标检测综述:挑战,技术和数据集(M. MUZAMMUL等人,ACM,2021)

    一.文章概况     文章题目:<A Survey on Deep Domain Adaptation and Tiny Object Detection Challenges, Techniq ...

  2. 【2022 小目标检测综述】Towards Large-Scale Small Object Detection: Survey and Benchmarks

    Towards Large-Scale Small Object Detection: Survey and Benchmarks 论文简介: 论文动机: 小目标检测方法回顾: 问题定义: 主要挑战: ...

  3. 文献精读——(第十四篇)目标检测综述

    引言 目标检测: 目标检测的目标是确定某张给定图像中是否存在给定类别(比如人.车.自行车.狗和猫)的目标实例:如果存在,就返回每个目标实例的空间位置和覆盖范围(比如返回一个边界框). 目标检测的意义 ...

  4. 2021年小目标检测最新研究综述 很全面值得收藏

    摘要 小目标检测长期以来是计算机视觉中的一个难点和研究热点.在深度学习的驱动下,小目标检测已取得了重大突破,并成功应用于国防安全.智能交通和工业自动化等领域.为了进一步促进小目标检测的发展,本文对小目 ...

  5. 小目标检测的相关挑战与问题

    今天读了一篇小目标检测的综述性文章,所以就做了下面的笔记进行学习自用.目标检测一般分为两类:第一:在所给定的图像中对目标进行定位,即获得目标的回归框.第二:对图像中的目标进行分类,得出该目标的所属类别 ...

  6. Deep Learning for Generic Object Detection: A Survey -- 目标检测综述总结

      最近,中国国防科技大学.芬兰奥卢大学.澳大利亚悉尼大学.中国香港中文大学和加拿大滑铁卢大学等人推出一篇最新目标检测综述,详细阐述了当前目标检测最新成就和关键技术.文章最后总结了未来8个比较有前景的 ...

  7. 2022最新综述 | 面向大规模场景的小目标检测:综述和 benchmark

    点击上方"计算机视觉工坊",选择"星标" 干货第一时间送达 作者丨汽车人 来源丨自动驾驶之心 1论文背景 目标检测在过去几年中取得了显著的进展,然而,由于小目标 ...

  8. 2020年最全目标检测综述(完结篇)

    点击蓝字关注我们 computerVision 计算机视觉战队 ● 扫码关注,回复:目标检测 ● 获取目标检测相关下载链接 今天我们的目标检测综述最后一章,也是这个系列的完结,希望有兴趣的同学可以从中 ...

  9. 基于深度学习的小目标检测方法综述

    随着深度学习的发展,基于深度学习的目标检测技术取得了巨大的进展,但小目标由于像素少,难以提取有效信息,造成小目标的检测面临着巨大的困难和挑战. 为了提高小目标的检测性能,研究人员从网络结构.训练策略. ...

最新文章

  1. list、dict、tuple的一些小操作总结
  2. 关于Oracle Stream的安装、配置和使用
  3. 《软件工程课程总结》
  4. 关于跨DB增量(增、改)同步两张表的数据小技巧
  5. 200730学习日报6字符串
  6. vue-router.esm.js?fe87:16 [vue-router] Route with name 'page' does not exist
  7. 代码逻辑分析_双11模块79.34%的前端代码是怎样智能生成的?
  8. 通过ifrmae异步下载文档
  9. Python 数据分析三剑客之 Pandas(十):数据读写
  10. 编译mcu media server
  11. 元组怎么变成列表_Python入门教程笔记(四)元组(tuple)及字典(dict)
  12. NPDP第四章 文化、组织与团队
  13. dell服务器怎么看故障信息,DELL服务器故障码详解
  14. 微信红包后台系统设计
  15. 胶囊网络之 Found a Reason for me? Weakly-supervised Grounded Visual Question Answering using Capsules论文笔记
  16. 2022最新常用API接口
  17. 计算机网络 --- 物理层(学习笔记)
  18. 【群晖nas】阿里域名DDNS 配置外网访问(华硕AC68U路由端口映射)
  19. TEACH_NLP——开篇
  20. AIWIN 心电图智能诊断Baseline【线上0.719】

热门文章

  1. 近端串扰与远端串扰分析
  2. 【数据库】Navicat编写MySQL自定义函数详解
  3. rfc-3227中文翻译
  4. JNA实战笔记汇总(二)——JNA和C / C ++的数据类型映射(dll函数回调、结构体、指针)
  5. 想做好网络营销?这四步网络营销推广方法至关重要
  6. 基于机器学习的花卉识别
  7. ICPC 沈阳M - United in Stormwind SOSDP+FWT+容斥
  8. 回顾Nginx网站服务配置
  9. 组件容器服务器的关系,什么是docker 容器编排
  10. VS2015企业版,社区版,专业版详细对比