关注上方深度学习技术前沿”,选择“星标公众号”

资源干货,第一时间送达!

作者:黄浴

知乎链接:https://zhuanlan.zhihu.com/p/114167448

本文已由作者授权转载,未经允许,不得二次转载。

浙大在arXiv上2020年3月16日上传论文"Extended Feature Pyramid Network for Small Object Detection"。

摘要:小目标检测仍然是一个尚未解决的挑战,因为很难仅提取几个像素大小的小目标信息。尽管在特征金字塔网络中进行尺度级别的相应检测可以缓解此问题,但各种尺度的特征耦合仍然会损害小目标检测的性能。本文提出了扩展特征金字塔网络(EFPN,extended feature pyramid network),它具有专门用于小目标检测的超高分辨率金字塔层。具体来说,其设计了一个模块,称为特征纹理迁移(FTT,feature texture transfer),该模块用于超分辨率特征并同时提取可信的区域细节。此外,还设计了前景-背景之间平衡(foreground-background-balanced)的损失函数来减轻前景和背景的面积不平衡问题。在实验中,所提出的EFPN在计算和存储上都是高效的,并且在清华-腾讯的小型交通标志数据集Tsinghua-Tencent 100K和微软小型常规目标检测数据集MS COCO上产生了最好的结果。

如图所示,是扩展特征金字塔网络(EFPN)的框架。这里Ci表示CNN骨干网第i阶段的特征图,Pi表示EFPN上的相应金字塔层。EFPN的前4层是vanilla FPN层。特征纹理迁移(FTT)模块集成了P3中的语义内容和P2的区域纹理。然后,类似FPN的自顶向下(top-down)路径将FTT模块输出向下传递,形成最终的扩展金字塔层P'2。扩展的特征金字塔(P'2,P2,P3,P4,P5)被馈送到后续的检测器,以进行进一步的目标定位和分类。

顶部4层金字塔自顶向下构成,用于中型和大型目标检测。EFPN的底部扩展在图中包含一个FTT模块,一个自上而下的路径和一个紫色金字塔层,旨在捕获小目标的区域细节。更具体地讲,在扩展中,特征超分辨率(SR)模块FTT将图中绿色-黄色层表示的EFPN第三层-第四层金字塔混合,产生具有所选区域信息的中间特征P'3,图中用蓝色菱形表示。然后,自上而下的路径将P'3与定制的高分辨率CNN特征图C'2合并,生成最终的扩展金字塔层P'2。

如表所示,在ResNet / ResNeXt 第二步(stage 2)删除了一个最大池化层,并将C'2作为第二步的输出。C'2与原始C2具有相同的表示级别,但是由于分辨率较高,因此包含更多的区域细节。C'2中较小的接收场也有助于更好地定位小目标。从数学上讲,在提议的EFPN中扩展的操作可以描述为 (上箭头表示上采样操作)

如图所示,是特征纹理迁移(FTT)模块的框架。输入特征P3的主要语义内容首先由内容提取器(content extractor)提取。然后,通过亚像素卷积将内容特征的分辨率提高一倍。纹理提取器( texture extractor)从主流特征和参考特征的组合中选择可靠的区域纹理用于小目标检测。最后,残差连接(residual connection)有助于将纹理与超分辨的内容特征融合在一起,为扩展特征金字塔生成P'3层。

FTT模块的主要输入是EFPN第三层特征图P3,参考是EFPN第四层特征图P2。输出P'3可定义为 (Et操作符表示纹理提取器,Ec操作符表示内容提取器)


在训练模型中,正样本损失函数定义为(特征图误差):

全局重建损失函数是(特征图误差):

而前景-背景平衡损失函数:

最后,总损失函数(分别来自P'2-P2层特征图差和P'3-P3层特征图差)是:

下面给出一些实验结果对比:

还有一些直观的结果对比例子:


简单评论一下。

小目标检测的难度在于目标很小,其特征比较浅(如亮度/边缘信息等),语义信息较少;另外小目标和背景之间尺寸不均衡,用较小的感受野去关注其特征的话,很难提取全局语义信息;用较大感受野去关注背景信息的话,那么小目标的特征会丢失信息。

以前的方法主要是以下思路:

  • - 数据增强

  • - 特征融合

  • - 利用上下文信息,或者目标之间建立联系

  • - GAN试试

  • - 提升图像分辨率

  • - 小技巧:ROI pooling被ROI align替换

  • - 多尺度空间融合

  • - 锚点设计

  • - 匹配策略,不用IoU

本文算是超分辨率和多尺度特征融合的修正,集中在特征纹理迁移模块(FTT)。

重磅!计算机视觉交流群已成立!

欢迎各位Cver加入计算机视觉微信交流大群,本群旨在交流图像分类、目标检测、点云/语义分割、目标跟踪、机器视觉、GAN、超分辨率、人脸检测与识别、动作行为/时空/光流/姿态/运动、模型压缩/量化/剪枝、NAS、迁移学习、人体姿态估计等内容。更有真实项目需求对接、求职内推、算法竞赛、干货资讯汇总、行业技术交流等,欢迎加群交流学习!

进群请备注:研究方向+地点+学校/公司+昵称(如图像分类+上海+上交+小明)

广告商、博主请绕道!

???? 长按识别,即可进群!

【浙大出品】基于扩展FPN的小目标检测方法相关推荐

  1. 基于深度学习的小目标检测方法综述

    随着深度学习的发展,基于深度学习的目标检测技术取得了巨大的进展,但小目标由于像素少,难以提取有效信息,造成小目标的检测面临着巨大的困难和挑战. 为了提高小目标的检测性能,研究人员从网络结构.训练策略. ...

  2. 小目标检测:基于深度学习的小目标检测方法

    基于深度学习的小目标检测方法 小目标检测的难点:分辨率低.信息少,噪音多.图像模糊 解决方法:图像金字塔.特征金字塔.对包含小目标的图像进行oversampling.对小目标进行复制粘贴操作(不遮挡原 ...

  3. 基于改进SSD的车辆小目标检测方法

    基于改进SSD的车辆小目标检测方法 人工智能技术与咨询 来源:<应用光学>,作者李小宁等 摘 要:地面车辆目标检测问题中由于目标尺寸较小,目标外观信息较少,且易受背景干扰等的原因,较难精确 ...

  4. 目标检测论文解读复现【NO.21】基于改进YOLOv7的小目标检测

    前言 此前出了目标改进算法专栏,但是对于应用于什么场景,需要什么改进方法对应与自己的应用场景有效果,并且多少改进点能发什么水平的文章,为解决大家的困惑,此系列文章旨在给大家解读最新目标检测算法论文,帮 ...

  5. 目标检测YOLO实战应用案例100讲-基于卷积神经网络的小目标检测算法研究

    目录 基于卷积神经网络的小目标检测算法研究 基于卷积神经网络的小目标检测相关理论 2.1 引言

  6. 目标检测论文解读复现之十六:基于改进YOLOv5的小目标检测算法

    前言 此前出了目标改进算法专栏,但是对于应用于什么场景,需要什么改进方法对应与自己的应用场景有效果,并且多少改进点能发什么水平的文章,为解决大家的困惑,此系列文章旨在给大家解读最新目标检测算法论文,帮 ...

  7. 基于深度学习的显著性目标检测方法综述

    源自:电子学报       作者:罗会兰  袁璞  童康 摘 要 显著性目标检测旨在对图像中最显著的对象进行检测和分割,是计算机视觉任务中重要的预处理步骤之一,且在信息检索.公共安全等领域均有广泛的应 ...

  8. 深度学习中的单阶段小目标检测方法综述

    随着深度学习的不断发展,目标检测技术逐步从基于传统的手工检测方法向基于深度神经网络的检测方法转变.在众多基于深度学习的目标检测方法中,基于深度学习的单阶段目标检测方法因其网络结构较简单.运行速度较快以 ...

  9. 目标立体检测 红外图像_一种有效的红外小目标检测方法

    [3]CHEN Bing-wen, WANG Wen-wei, QIN Qian-qing. Infrared dim target detection based on fuzzy-ART neur ...

最新文章

  1. BCH协议升级倒计时——超过68%的BCH全节点已支持升级
  2. 主成分分析 PCA算法
  3. 重新定义智能平板电脑 第四范式与联想达成战略合作
  4. Linux下提示命令找不到
  5. ssm影城项目_影场与属性访问器界面
  6. java 暂停循环_java小白关于while死循环时处理办法的一发求助帖
  7. 求素数: 一般线性筛法 + 快速线性筛法
  8. AttributeError : module ‘enum‘ has no attribute ‘IntFlag‘
  9. 教你动手做一个 iOS 越狱 app
  10. 零基础学sql要多久_成人零基础学习钢琴,要多久能学会?
  11. NIKKEI Programming Contest 2019 翻车记
  12. 从M个数中随机等可能的取出N个的问题
  13. centos7 卸载 jdk
  14. 代码生成的思考:MyMeta提供数据库架构,反射、Emit提供构建的提供动态创建的环境...
  15. ApacheHttpServer出现启动报错:the requested operation has failed解决办法
  16. pythonnumpy安装教程_windows 下python+numpy安装实用教程
  17. 搜索引擎优化、常用SEO优化方法总结
  18. Python爬虫爬取豆瓣高分电影附源码(详细适合新手)
  19. python定义一个汽车类_定义一个创造汽车的工厂类
  20. SpaceShooter打飞机教程笔记(四)

热门文章

  1. 计算机丢失filter.dll,AxCoFilter.dll
  2. 北方股份无人驾驶矿卡_踏歌智行携手北方股份10台无人驾驶新车批量投产 | 合创投资...
  3. spacy spaCy主要功能包括分词、词性标注、词干化、命名实体识别、名词短语提取等等
  4. javap 查看class文件的字节码命令用法
  5. java中堆与栈的区别 彻底理解
  6. pycharm执行python程序报错ImportError: DLL load failed: torchvision找不到指定的程序
  7. 院士 人工智能专业理解
  8. JAVA sql2000 连接细节
  9. 大模型技术实践路线图出炉,唐杰牵头,近百位智源、清华、北大、MILA等顶尖研究者联合推出...
  10. 程序员必读10本算法书推荐