简单说两句

Feature pyramids已经被各种目标检测器使用,不管是one-stage还是two-stage类型。浅层的feature map有利于检测小目标,深层的feature map有利于检测大目标,所以SSD采用了特征金字塔网络,检测结果要优于YOLOv1。但只是简单地利用从backbone抽出来的Feature maps有很多的局限性,因为这些网络是为了图像分类而设计,而不是检测任务。
总体来说,高阶特征包含更多的语义信息,对分类子任务的判别能力更强,低阶特征包含更多位置信息,对回归任务的判别能力更强。除此之外,低阶特征更适合表征外观简单的物体,高阶特征更适合表征外观复杂的物体。在实际中,小物体的复杂程度可能相差甚远,比如一个交通指示灯和一个离的很远的人,在图像中都是小物体,但是人的复杂程度要高很多。
基于以上理解,作者在SSD的基础上进行改进,设计了M2Det,一个mutil-level,mutil-scale检测网络,mutil-scale解决目标物体大小不一的问题,mutil-level解决物体不同复杂度的问题。

网络结构

由上图可见:
主体框架是MLFPN,首先从backbone中抽取2层feature map,通过FFM1方法融合后作为主框架MLFPN的base feature,feed给TUM和FFMv2。然后,每一个TUM会生成大小不一的feature maps,通过SSAM方法将每一组feature maps按照大小分别融合,形成mutil-level、mutil-scale的feature pyramids。和SSD一样,最后会在每一种尺寸的feature map后面加两个卷积层来预测位置信息和类别,最后使用NMS算法得到最终的结果。
值得注意的是,每一个TUM的输出使用FFMv2方法和base feature融合,作为第二个TUM的输入。所以第一个TUM只吸收了浅层特征base feature,后面的TUMs会同时吸收浅层base feature和较深层特征信息(前一个TUM的输出),从第一个(图中最上面的)TUM到最后一个,由浅至深,这是mutil-level的由来。

下面介绍上面提到的几种方法:

FFM1
将20201024的feature map通过11卷积降低通道数,然后上采样得到40 * 40 * 512的feature map;将40 * 40 * 512的feature map通过1 * 1卷积将通道数降为256,然后将两者进行concate(上图(a)),concate后,通道数为512+256=768。
FFMv2
将40 * 40 * 768的base feature降低通道数为128,然后和前一个TUM输出的feature maps中尺寸最大的(40 * 40)feature mapconcate(上图(b))。
TUM
如上图©所示,encoder(编码器)由5个卷积核为3 * 3,stride为2
2的卷积操作组成,每一次卷积后feature map的尺寸会缩小为原来的1/2,decoder(解码器)的每一个输出都吸收了encoder的每一个卷积层输出。从图中第二排操作可以看出,蓝色的+号是将前一个卷积结果上采样后和上层编码结果进行ele-wise sum操作。解码器中添加1*1卷积层是为了增强学习能力和保持平滑。最后TUM会输出6种scale的feature maps,所以是mutil-scale。
SFAM
SFAM是为了将TUMs产生的mutil-level mutil-scale的features集合为feature pyrimid。
如下图,分2步操作:
1、将相同scale的features结合(concate),因此每一种scale的features来自不同的level。
2、加入channel-wise attention机制,让features聚焦于对它们最有用的通道上。

网络设置

作者使用了两种backbone进行实验:VGG16和ResNet。
默认参数有:8个TUM、每个TUM包含5个striding-conv和5次上采样,输出6中scale的features。
图像输入尺寸有320、512和800。
检测阶段,对6种scale的features,分别添加2个卷积层来分别获得回归和分类。
对于每一个feature map cell,使用3种长宽比,共6个anchors。

结果对比

M2Det与之前网络相比,成为了新的state-of-the-art,见下图:


总结

强大高效的M2Det的主要贡献的MLFPN,其设计加入mutil-level的思想,使得不同尺寸的目标检测更加高效。

目标检测M2Det论文总结相关推荐

  1. 对象检测目标小用什么模型好_[目标检测] YOLO4论文中文版

    点击上方 蓝字 关注我呀! [目标检测] YOLO4论文中文版 文章目录 YOLO4论文中文版 摘要 1.介绍 2.相关工作 2.1.目标检测模型 2.2.Bag of freebies 2.3.Ba ...

  2. 一文看尽10篇目标检测最新论文(MetaOD/P-RSDet/MatrixNets等)

    前言 恰逢 2020年,本文再次更新近期值得关注的最新检测论文.这次分享的paper将同步推送到 github上,欢迎大家 star/fork(点击阅读原文,也可直接访问): https://gith ...

  3. 一文看尽10篇目标检测最新论文(SpineNet/AugFPN/LRF-Net/SABL/DSFPN等)

    点击上方"CVer",选择加"星标"或"置顶" 重磅干货,第一时间送达 前言 一周前 Amusi 整理了 目标检测(Object Detec ...

  4. 显著性目标检测SOD论文大盘点

    显著性目标检测SOD论文大盘点 2020/6/15 图像SOD Hierarchical Saliency Detection cvpr2013 salient detection by multi- ...

  5. 【R-CNN论文翻译】目标检测经典论文R-CNN最新版本(v5版)全面中文翻译

    R-CNN目标检测的奠基性文章,学习目标检测必看的经典论文之一,后续有Fast R-CNN,Faster R-CNN一系列论文. 目前网上能找到的论文翻译版本要么不全,要么不是最新版本的(论文从201 ...

  6. 单阶段目标检测重要论文总结

    文章目录 一.Yolov1 1.论文简介 2.检测原理 3.结构设计 4.疑难问题 5.论文总结 二.Yolov2 1.论文简介 2.更好.更快.更强 1)为什么更好? 2)为什么更快? 3)为什么更 ...

  7. 目标检测经典论文——Fast R-CNN论文翻译(中英文对照版):Fast R-CNN(Ross Girshick, Microsoft Research(微软研究院))

    目标检测经典论文翻译汇总:[翻译汇总] 翻译pdf文件下载:[下载地址] 此版为纯中文版,中英文对照版请稳步:[Fast R-CNN纯中文版] Fast R-CNN Ross Girshick Mic ...

  8. 目标检测经典论文——YOLOv2论文翻译(纯中文版):YOLO9000:更好、更快、更强

    目标检测经典论文翻译汇总:[翻译汇总] 翻译pdf文件下载:[下载地址] 此版为纯中文版,中英文对照版请稳步:[YOLOv2中英文对照版] YOLO9000:更好.更快.更强 Joseph Redmo ...

  9. 目标检测经典论文——Faster R-CNN论文翻译(纯中文版):Faster R-CNN:通过Region Proposal网络实现实时目标检测

    目标检测经典论文翻译汇总:[翻译汇总] 翻译pdf文件下载:[下载地址] 此版为纯中文版,中英文对照版请稳步:[Faster R-CNN中英文对照版] Faster R-CNN:通过Region Pr ...

  10. 目标检测经典论文——Fast R-CNN论文翻译(纯中文版):Fast R-CNN(微软研究院)

    目标检测经典论文翻译汇总:[翻译汇总] 翻译pdf文件下载:[下载地址] 此版为纯中文版,中英文对照版请稳步:[Fast R-CNN中英文对照版] Fast R-CNN Ross Girshick 微 ...

最新文章

  1. JavaBean网页电子时钟
  2. HOJ 2576 HOJ 2577 Simple Computing I II 容斥原理
  3. 动态规划:斐波那契数列里面的东西?
  4. 1045: 愚人节的礼物
  5. oracle中偏移,怎么对相同的坐标点偏移?
  6. kata_FizzBu​​zz Kata与Java流
  7. 我看中国软件---问题篇
  8. 国产 14nm 迎曙光,进口荷兰光刻机顺利入厂!
  9. Centos7安装完毕后无法联网的解决方法
  10. 动态规划之01背包问题(含代码C)
  11. 新手学习selenium路线图(老司机亲手绘制)-学前篇(转上海悠悠)
  12. i春秋 第二届春秋欢乐赛 Web-Hello World
  13. ln建立软链接出现错误:broken symbolic link to
  14. 中英对照的网络游戏术语
  15. CAN总线和CANOpen协议栈总结
  16. CommonJS模块化
  17. 调侃物联网开源框架,我们什么时候也来开源一个?
  18. CS294-112 深度强化学习 秋季学期(伯克利)NO.9 Learning policies by imitating optimal controllers...
  19. 【软件分享】免费多线程下载神器,可完全替代IDM(支持MacWindows)
  20. dlp型3d打印机_DLP与LCD光固化3D打印技术的对比

热门文章

  1. 绝地求生 java 雷达透视_绝地求生jar雷达透视辅助
  2. QT 快捷键 识别小写字母
  3. 得到app产品体验报告
  4. Activiti 流程配置可视化:SpringBoot 集成 Activiti6 + Activiti Modeler
  5. 清理tomcat服务器日志文件,Tomcat日志配置与清理
  6. Siamese Network(孪生网络)
  7. java8用什么tomcat_Tomcat8+JDK8安装与配置
  8. XSS自动化工具——Beef
  9. scala下载和环境搭建
  10. html5svg在线编辑器,新技术应用——HTML5内联SVG