Extended Feature Pyramid Network for Small Object Detection
Extended Feature Pyramid Network for Small Object Detection
论文链接:https://arxiv.org/abs/2003.07021v1
Introduction
- 现有的目标检测方法对于小目标的检测效果都不是很好,小目标在图片中占据很少的像素点,在池化的过程中很容易被过滤掉。
- 融合高层和低层的特征信息来检测小目标的特征金字塔网络虽然在一定程度上改善了小目标检测效果,但是在金字塔层级和建议区域的映射过程中,小目标和中目标以及一些大目标共享特征图,如下图a所示。
- 同时如下图b所示,随着目标尺寸的减小,特征金字塔网络的检测效果会急速下降。
本文针对以上问题提出了一种新的检测方法,主要包括以下内容extend feature pyramid network(EFPN), feature texture transfer(FTT)以及一个foreground-background-balanced loss。
Approach
首先建立利用底层高分辨率的特征图专门为小目标检测的扩展特征金字塔。同时为了实现扩展特征金字塔设计了一个feature texture transfer的模块,用来生成中间特征。最后,利用一个前景背景平衡损失函数来加强网络学习正像素点的能力。
Extended Feature Pyramid Network
FPN中通过上采样高层次的CNN特征图并将它们和低层次的特征进行横向连接来构建4层特征金字塔结构,尽管利用不同层次的特征来检测不同尺寸的目标,但是小目标和中目标的检测还是耦合在一起。
EFPN中在FPN上扩展了一个新的层次,利用一个SR模块在低分辨率的特征图上生成高分辨率的特征图来检测小目标物体,具体结构如下图所示。
前四层通过自顶向下的连接是为中目标和大目标做检测的,扩展的P2’层是为做小目标检测。P2’层的生成过程:在FTT模块中利用P2、P3融合生成P3’,然后结合C2’生成P2’,公式表示如下(采用最近邻插值方法进行上采样),
建议框大小和金字塔的映射采用如下的公式:
l为金字塔的层次,w和h为建议框的宽高,224是规范的ImageNet预训练的尺寸,l0是映射的目标层次。
Feature Texture Transfer
FTT模块在对特征进行超分辨率的同时从参考特征中提取区域纹理,FTT模块还可以减少P2直接转换到扩展层P2’的噪声。FTT模块利用P3作为主要输入,P2为参考特征层,输出P3’可以定义为如下公式:
Et表示纹理特征提取组件,Ec表示为内容特征抽取组件,向上采样两倍采用的是亚像素卷积,||表示的是特征串联,两个组件都是由残块组成。过程如下图所示:
Training Loss
前景和后景平衡损失能够提升EFPN的性能,一般的全局损失不足以学习到小目标的特点,因为小目标的像素点数目只占整图的一笑部分。前后景平衡损失由全局重建损失和真像素点损失组成。
(1)全局重建损失,用来加强和真背景的相似性,使用的是SR常用的l1损失,表示为Lglob,F为生成的特征图,Ft是目标特征图。
(2)真像素点损失是为了将注意力转移到相应的像素点上,不平衡的前后景会影响检测器的性能。将前景区域作为真像素点,使用l1函数来计算真像素点损失Lpos,Ppos表示为真实框中的像素点,N表示真像素带你的数目,(x,y)表示特征图中对应的像素点。
前后景平衡损失定义为Lfbb:
λ为超参数,平衡损失函数通过提高前景区域特征质量来挖掘真阳性,通过提高背景区域的特征质量来消除假阳性。
EFPN的整体损失表示为如下:
Experiments
Tsinghua-tencent 100K(交通标识检测的数据集,具有很多小目标)
MS COCO
Conclusion
EFPN是在FPN框架下扩展的来检测小目标的方法,在FPN框架中引入FTT模块和前后景平衡损失函数,通过实验表明,EFPN对于小目标检测具有比较好的结果。EFPN在未来可以应用到更具体的领域,比如面部识别和卫星图片检测。
Extended Feature Pyramid Network for Small Object Detection相关推荐
- [论文阅读] Cross-layer feature pyramid network for salient object detection
论文地址:https://dx.doi.org/10.1109/TIP.2021.3072811 发表于:TIP 2021 Abstract 基于特征金字塔(FPN)的模型,以渐进的方式融合语义与显著 ...
- 论文阅读:BPFINet: Boundary-aware progressive feature integration network for salient object detection
论文地址:https://doi.org/10.1016/j.neucom.2021.04.078 代码地址:https://github.com/clelouch/BPFINet 发表于:Neuro ...
- CONTEXT AUGMENTATION AND FEATURE REFINE- MENT NETWORK FOR TINY OBJECT DETECTION
论文地址:https://openreview.net/pdf?id=q2ZaVU6bEsT 由于分辨率低.体积小,微小物体很难被探测到.微小目标检测性能差的主要原因是网络的局限性和训练数据集的不平衡 ...
- M2Det: A Single-Shot Object Detector based on Multi-Level Feature Pyramid Network
参考 M2Det: A Single-Shot Object Detector based on Multi-Level读) - 云+社区 - 腾讯云 目录 一.摘要 二.简介: 1.存在的问题 ...
- [纯理论] FPN (Feature Pyramid Network)
Feature Pyramid Networks for Object Detection 作者: Tsung-Yi Lin, Piotr Dollár, Ross Girshick, Kaiming ...
- 目标检测--A Unified Multi-scale Deep Convolutional Neural Network for Fast Object Detection
A Unified Multi-scale Deep Convolutional Neural Network for Fast Object Detection ECCV2016 https://g ...
- 【译】A Fully Spiking Hybrid Neural Network for Energy-Efficient Object Detection
文章目录 [译]A Fully Spiking Hybrid Neural Network for Energy-Efficient Object Detection 1 Abstract 2 Int ...
- 分析显著性目标检测--Global Context-Aware Progressive Aggregation Network for Salient Object Detection
分析显著性目标检测--Global Context-Aware Progressive Aggregation Network for Salient Object Detection 引入 方法 网 ...
- 论文精读《OFT: Orthographic Feature Transform for Monocular 3D Object Detection》
OFT: Orthographic Feature Transform for Monocular 3D Object Detection 文章目录 OFT: Orthographic Feature ...
最新文章
- bzoj 2119 股市的预测 —— 枚举关键点+后缀数组
- 计算机换色带技巧,色带盒怎么更换 色带盒更换安装方法【图文教程】
- SecureCRT配置proxy连接云主机
- 【2018.6.7】阶段总结
- mysql表在线转成分区表_11g普通表在线转换分区表
- django再windows下测试命令总结
- Python实现bp神经网络识别MNIST数据集
- hdu2046-饭卡
- 数学分析学习(一):映射与不等式
- 【软考 系统架构设计师】软件架构设计④ 基于架构的软件开发方法
- 结构梁配筋最牛插件_牛肉食用指南(五):日式烧肉的由来,各部位怎么烤最好吃?...
- 河北师范大学计算机专业保研率,12所师范大学2018-2020年保研率对比!附9所师范大学2021保研率...
- ContentProvider跨进程通信
- Echars 双击Legend 显示自己隐藏其他Legend
- Linux - chmod授权文件权限命令详解
- 删除电脑中删不掉的文件或文件夹
- springboot配置https(阿里云免费证书)
- 如何在别的电脑上用自己的系统------在移动硬盘上装win10
- html 字体模糊,详解css3使用transform出现字体模糊的解决办法
- 中国版LinkedIn到底长什么样
热门文章
- 互联网快讯:阿里云发布第四代神龙架构;微信支付正式推出品牌视频号;猿辅导加速布局素质教育
- NodeMCU学习(二)--NodeMCU介绍及使用(一)
- arp 已知mac找ip_知道IP查MAC地址,知道MAC地址查IP
- 如何获取新浪股票行情查询接口?
- 微软魔镜——从“解语花”到“读心树”的神奇魔法
- orangepi——uart串口开发(TX,RX)
- OPENWRT 适用于 K1/K2/K2P/newifi Y1/newifi Y1S等路由器,使用 Mesh/有线 + 802.11R 组网无线漫游
- 距离度量对传统萤火虫算法开发特性和收敛行为的性能分析(Matlab代码实现)
- 从前慢-MySql高级
- linux开放目录注意