今天说的是《Soft Anchor-Point Object Detection》,其也是最近关于anchor free的目标检测的论文,作者来自于CMU,一作同样也是FSAF(2019 CVPR)的作者。该论文的出发点还是在样本选择和FPN特征选择层面。

背景

Anchor free是目标检测领域的一个研究热点,其主要可以分为anchor-point和keypoint两类。后者在往往在一个高分辨率的特征图上进行检测,其优点是准确率高,但是计算量大。而anchor-point的方法往往在多个分辨率上进行检测,结构简单,速度更快。作者认为anchor-point的方法性能不高主要还是在于训练的不充分,主要是注意力偏差(attention bias)和特征选择(feature selection)。因而作者提出了两种策略:1)soft-weighted anchor points对不同位置的样本进行权重分配,2)soft-selected pyramid levels,将样本分配到多个分辨率,并进行权重加权。

方法框架

整体框架其实和FSAF是类似

Soft-Weighted Anchor Points

清晰的目标更容易获得关注和更高的分数,而边缘或者被遮挡的目标比较难检测。具体的问题如下:

上图中有五个足球运动员,分类输出的得分图score map如图b所示,可以看到有两个运动员的得分区域占了主导地位。甚至这两个运动员的得分区域还侵占了其他运动员的得分区域。

作者认为引起该问题的主要原因是特征不对齐,位于gt边缘的anchor和位于中心的anchor不应被同等对待。解决思路就是对不同位置的样本引入不同的权重,其离gt的中心越近,其权重越高,离gt中心越远,其权重越低(因为边缘往往意味着包含很多背景信息)。从而引入了广义中心度来确定权重:

概述我们的训练策略与h soft-weighted anchorpoints和soft-selected pyramid levels。黑条表示正锚定点对网络损耗贡献的指定权重。

Soft-Selected Pyramid Levels ●

该问题实际上在FSAF中也研究过,即如何选择合适的分辨率(尺度)来进行目标的检测。FSAF是通过loss来选择合适的分辨率。该论文同时也借鉴了FoveaBox将一个anchor映射到多个分辨率进行检测的思想(实际上工程中也会用到)来提升性能。同时作者还给不同的分辨率分配不同的权重。具体地,作者额外训练了一个子网络来预测不同尺度的权重,该网络具体为:

而该子网络的输入,是在不同分辨率上利用roialign提取gt(ground truth)的特征,并concat起来。

实验结果

作者和FSAF(基于anchor-free分支)进行比较,soft-weighted anchor points(SW)策略提升了1.1个点,soft-selected pyramid levels(SS)提升了1个点。作者还采用了BFPN(2019 CVPR Libra RCNN中的特征融合策略)进行了加强,还能有性能提升。

可视化结果

论文最好的性能是47.4,在R50上也达到了41.7。

总结

作者在FSAF的基础上进一步地分析了现有的两个问题:注意力偏差和特征选择问题。前一个问题通过对不同样本加权实现,后一个问题通过对不同分辨率加权实现,论文讲述清晰,思路简单。同时也要注意到,该论文特征选择预测网络的训练问题,工程上是否真的有效还需进一步地尝试验证。

论文地址:由于头条的限制,需要请留言

目标检测_目标检测 | Anchor free的目标检测进阶版本相关推荐

  1. 基于python的移动物体检测_感兴趣区域的移动物体检测,框出移动物体的轮廓 (固定摄像头, opencv-python)...

    感兴趣区域.特定区域.框出移动物体的轮廓.越界检测.入侵物体检测.使用 opencv-python库的函数cv2.findContours.cv2.approxPolyDP.cv2.arcLength ...

  2. flutter 人脸检测_【转载】opencv实现人脸检测

    全文转载自CSDN的博客(不知道怎么将CSDN的博客转到博客园,应该没这功能吧,所以直接复制全文了),转载地址如下 http://blog.csdn.net/lsq2902101015/article ...

  3. python 目标直方图_深入了解扩展事件–直方图目标

    python 目标直方图 An Extended events target is the destination for all of the information that is capture ...

  4. 垃圾邮件检测_如何在您的电子邮件中检测垃圾邮件

    垃圾邮件检测 Nowadays, the SPAM coming into your mailbox is disguised forms of any type of trying to look ...

  5. python dlib人脸检测_使用Python+OpenCV+Dlib实现人脸检测与人脸特征关键点识别

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 今天,我们将学习如何检测图像中的人脸并提取面部特征,如眼睛.鼻子. ...

  6. 信用卡欺诈行为检测_在无监督学习的情况下检测欺诈行为

    信用卡欺诈行为检测 It's common to hear about fraudulent acts on e-commerce platforms. In recent years, the sp ...

  7. python图色检测_利用python打开摄像头及颜色检测方法

    最近两周由于忙于个人项目,一直未发言了,实在是太荒凉了....,上周由于项目,见到Python的应用极为广泛,用起来也特别顺手,于是小编也开始着手学习Python,-下面我就汇报下今天的学习成果吧 小 ...

  8. pcb成型板aoi检测_一种PCB板的AOI检测控制系统的制作方法

    本实用新型属于SMT贴片加工工艺技术领域,具体涉及一种PCB板的AOI检测控制系统. 背景技术: 随着表面贴装元件的广泛应用,电子产品的体积变得越来越小,其焊接质量直接影响到产品的稳定性,目前电子元件 ...

  9. javacv 人脸检测_使用JavaCV进行手和手指检测

    javacv 人脸检测 这篇文章是Andrew Davison博士发布的有关自然用户界面(NUI)系列的一部分,内容涉及使用JavaCV从网络摄像头视频提要中检测手. 注意:本章的所有源代码都可以从h ...

  10. c# opencv 轮廓检测_基于OpenCV的区域分割、轮廓检测和阈值处理

    OpenCV是一个巨大的开源库,广泛用于计算机视觉,人工智能和图像处理领域.它在现实世界中的典型应用是人脸识别,物体检测,人类活动识别,物体跟踪等. 现在,假设我们只需要从整个输入帧中检测到一个对象. ...

最新文章

  1. Pytorch——YOLOv3
  2. 找对业务G点, 体验酸爽 - PostgreSQL内核扩展指南
  3. 安全研究人受够!再公布WordPress 3大外挂漏洞
  4. Spring Web 应用的最大败笔
  5. 2021 校招 | 神策数据,数说未来
  6. 数据库连接池-连接的关闭内幕
  7. SAP 电商云 Spartacus UI 的 checkout 场景中的串行请求设计分析
  8. 哈儿小波分解和重构(降维和升维)实现算法
  9. NoSql理解+传统关系型数据库ACID+Nosql的CAP+BASE的理解
  10. C++,string类的指针,string类数组的指针 string *s
  11. HDU1248 寒冰王座 【数学题】or【全然背包】
  12. 08面向对象编程风格
  13. 安装mysql时报错:计算机中丢失VCRUNTIME140_1.dll,亲测有效
  14. PyTorch学习笔记(七):PyTorch可视化
  15. 关于ODBC使用SQL语句和调用存储过程传递参数的使用方式说明
  16. 揭秘ASP.NET 2.0之Page.Eval
  17. 侠客工具盒 v5.0 build 0313 bt
  18. 给自己做一块开发板 #AnyBoard
  19. 你距离哈佛学霸到底有多远?实力证明,真正的学霸精神不是智商,而是。。。
  20. cadence导入dxf文件_CADENCE16.3导入DXF文件

热门文章

  1. 李开复唱衰互联网手机:大部分公司会失败
  2. mp4(H264容器)的详细文件格式分析
  3. RBSP、SODB、EBSP三者的区别和联系 SPS: sequence parameter sets
  4. C语言的面向对象设计-对X264/FFMPEG架构探讨
  5. VisualCode 查看代码历史版本、还原代码到既定历史版本
  6. MySQL 的各个json 函数说明
  7. navigator.geolocation的应用 - 将定位信息显示在百度地图上
  8. windows下xmllib2使用简介 64位
  9. java常用简略语含义
  10. wampserver 虚拟主机