目录

前言

问题是什么?

方法

效果

1、SOAT对比

2、消融实验

拓展


前言

论文链接:https://arxiv.org/pdf/2208.11533v2.pdf

一种新的 FPN Scale Sequence(s²) 特征提取方法,以加强小目标的特征信息。作者将 FPN 结构视为尺度空间,并在 FPN 的水平轴上通过 3D 卷积提取 Scale Sequence(s²)特征。s²基本上是一个尺度不变的特征,建立在小目标的高分辨率金字塔特征图上。此外,所提出的特征可以扩展到大多数基于 FPN 的目标检测模型。


问题是什么?

小目标上的平均精度相对低于中型目标和大目标上的平均精度 。

作者通过对MS COCO数据集进行分析发现,小目标所占比例更大,但是其平均检测精度最小。

基于深度学习的目标检测模型已经使用特征金字塔网络(FPN)作为Neck模块来有效地处理多尺度目标。在检测head之前,根据它们的比例将它们分配到一个单独的金字塔层。例如,在低分辨率金字塔特征图中检测大目标,在高分辨率金字塔特征图中检测小目标。

当输入图像输入 CNN 时,FPN 由通过每个卷积层的输出特征图组成。金字塔特征图的分辨率在卷积过程中变得更小。这种 FPN 架构类似于 Scale-SpaceFPN 的 level 轴可以被认为是 Scale 轴。因此,可以从 FPN 中提取尺度不变。这种方法也启发了FPN Scale Sequence(s²)的诞生。


方法

受尺度不变启发,可以将cnn卷积类比为高斯模糊的过程。本文将FPN视作尺度空间,将不同分辨率的FPN输出调整为相同分辨率进行拼接。

受视频时间序列启发,将不同尺度的FPN视作一项卷积运动存在,将输出视作视频帧,对其进行3D卷积。


效果

1、SOAT对比    

2、消融实验

2.1

2.2

2.3


拓展

1、什么是小目标:(1)尺寸小于32×32的物体 (2)宽高是原图宽高的十分之一以下

2、尺度空间理论:尺度空间是沿着图像的尺度轴构建的。它代表的不是一个尺度,而是目标可以具有的各种尺度范围。空间是通过使用高斯滤波器模糊图像而不是直接调整图像大小来生成的。(就是说通过滤波手段变换图像空间,每个滤波可以看作一个空间,对应变化后的图像,是原图像在该空间的映射或者是表现形式。)

论文阅读——ssFPN相关推荐

  1. 论文阅读工具ReadPaper

    对于搞科研的同学们来说,看论文是要经历的第一关,尤其是要读好多篇论文的时候,更是着实令人头大. 这不,最近无意中发现了个在线论文阅读网站:readpaper.com,号称「论文阅读笔记神器,硕博科研学 ...

  2. 多目标跟踪:CVPR2019论文阅读

    多目标跟踪:CVPR2019论文阅读 Robust Multi-Modality Multi-Object Tracking 论文链接:https://arxiv.org/abs/1909.03850 ...

  3. 快速人体姿态估计:CVPR2019论文阅读

    快速人体姿态估计:CVPR2019论文阅读 Fast Human Pose Estimation 论文链接: http://openaccess.thecvf.com/content_CVPR_201 ...

  4. Action4D:人群和杂物中的在线动作识别:CVPR209论文阅读

    Action4D:人群和杂物中的在线动作识别:CVPR209论文阅读 Action4D: Online Action Recognition in the Crowd and Clutter 论文链接 ...

  5. 深度学习点云语义分割:CVPR2019论文阅读

    深度学习点云语义分割:CVPR2019论文阅读 Point Cloud Oversegmentation with Graph-Structured Deep Metric Learning 摘要 本 ...

  6. 3D目标检测论文阅读多角度解析

    3D目标检测论文阅读多角度解析 一.前言 CNN(convolutional neural network)在目标检测中大放异彩,R-CNN系列,YOLO,SSD各类优秀的方法层出不穷在2D图像的目标 ...

  7. 3D目标检测论文阅读摘要

    3D目标检测论文阅读摘要 2D Object Detection 的研究已经非常成熟了,代表作品有RPN系列的FasterRCNN,One Shot系列的YOLOv1-YOLOv3,这里推荐一个2D ...

  8. 目标检测——Faster R-CNN论文阅读

    论文阅读--Faster R-CNN:Towards Real-Time Object Detection with Region Proposal Networks 文章目录 论文阅读--Faste ...

  9. 【独家】深度学习论文阅读路线图

    如果你是深度学习领域的一名新手,可能会遇到的第一个问题是"应该从哪篇论文开始读起呢?" 这里给出了深度学习论文阅读路线图! 路线图按照下面四个准则构建而成: 从提纲到细节 从经典到 ...

最新文章

  1. 2022-2028年中国硫化橡胶粉行业市场发展调研及竞争战略分析报告
  2. QIIME 2用户文档. 14数据评估和质控Evaluating and controlling(2019.7)
  3. 企业建设什么样的网站才能符合用户?
  4. vue使用python_如何使用Python和Vue创建两人游戏
  5. get clone 出现 fatal: the remote end hung up unexpectedly5 MiB | 892.00 KiB/s 报错信息
  6. IO模型(epoll)--详解-03
  7. pymongo的使用 0916
  8. C#算法设计排序篇之02-快速排序(附带动画演示程序)
  9. linux 切换用户身份、su、sudo、/etc/sudoers
  10. mysql中更新的命令是_MySQL 语言中,更新表数据的命令是( )。_学小易找答案
  11. iPhone 12再陷“信号门”:用户称每天需多次重启恢复;蚂蚁集团打新资金退款如期到账;Mutt 2.0 发布|极客头条
  12. webpack3 css,webpack3之处理css文件
  13. 赶快拿走!分享4款实用的软件,一般人我都不告诉他!
  14. OKR怎么写?100个OKR案例模板
  15. MySQL5.6安装流程(MySQL入门)
  16. EDA软件_AD14绘制等长线
  17. java 连接sybase数据库_Jdbc连Sybase数据库的几种方法_MySQL
  18. PPT、EXCEL、SPSS、水晶易表教程与学习资料汇总
  19. Photoshop CS3 Dreamwaver教程集合
  20. 为什么测网速时不显示服务器,为什么每个网站的网速测试结果不一样

热门文章

  1. POI PPT 给段落创建超链接
  2. MagicIndicator选中后字体样式
  3. 谷歌excel表格批量翻译各国语言
  4. 在m1芯片的MacBook上安装centos8
  5. 三菱m60系统波特率怎么设置_三菱 M60 三菱-M60 M60S series 操作 手册
  6. Livox-Mid40大疆雷达关于反射率的一个测试
  7. JSBox 基础接口 获取IOS信息 device
  8. asp.net 判断上传文件类型的几种方法
  9. centos的国内镜像源
  10. office文档如何免费转PDF