拥挤场景中的目标检测

Detection in Crowded Scenes: One Proposal, Multiple Predictions

论文链接:

https://arxiv.org/abs/2003.09163

code链接:

https://github.com/megvii-model/CrowdDetection

摘要

本文提出了一种简单而有效的基于提议的目标检测器,旨在检测拥挤场景中高度重叠的实例。本文方法的关键是让每个方案预测一组相关实例,而不是以前基于方案的框架中的单个实例。该探测器采用EMD损耗、设置NMS等新技术,有效地解决了高重叠度目标的检测难题。在FPN-Res50基线上,本文的检测器在挑战性的众人类数据集上可以获得4.9%的AP增益和
的AP增益对CityPersons数据集的改进,没有钟声和哨声。此外,对于像COCO这样的不太拥挤的数据集,本文的方法仍然可以获得适度的改进,这表明所提出的方法对拥挤是鲁棒的。

  1. Introduction

本文介绍了一种新的方案来解决这一难题:对于每个方案框,本文建议预测一组可能高度重叠的实例,而不是像通常那样预测单个实例,如图2所示。利用这个方案,邻近方案的预测预计将推断相同的实例集,而不是区分个体,这很容易学习。本文还介绍了新方案中的一些技术。首先,提出了一种EMD损失来监督实例集预测的学习。其次,提出了一种新的后处理方法Set-NMS来抑制不同方案中的重复,以克服拥挤场景中不支持NMS的缺点。最后,一个可选的增强模块(RM)被设计用来处理潜在的误报。

  1. Background

如引言所述,基于建议的对象检测器的范例主要包括两个步骤:第一步是建议框生成,可以通过选择性搜索[12,11]、预先确定/可学习的锚[29,28,24,21,41,39,45]或区域建议网络(RPN)[29,20,13,4,2]来实现。第二步是实例预测,即预测对应于每个方案框的重新确定的检测结果。本文主要关注本文的第二步。例如预测,当前最先进的对象检测框架[29、20、21、24、28]通常在每个建议框上附加一个检测函数,用于确定建议是否与某个基本真实实例相关联;如果为真,进一步预测对象的相应类标签和重新定义的边界框。这个机制意味着每个提案框对应于单个基本事实(通常是与提案框相对应的最大值)。因此,建议框必须过度完成,以确保每个实例都有机会被检测到,这会给预测引入许多重复项。因此,非最大抑制(NMS)等重复消除方法对于那些框架过滤出重复结果是必要的。尽管上述范式似乎在一些基准上取得了出色的结果,如COCO[22]和PASCAL VOC[8]。由于后处理方法(如NMS),它在拥挤的场景中会丢失检测。图1(a)示出了一个示例:虚线框中的人被附近的框错误地抑制。

  1. Multiple Instance Prediction

本文的方法是由观察结果驱动的:假设有多个对象彼此严重重叠,如图2所示;如果一个方案对应于任何一个对象,则很可能重叠所有其他对象。所以,对于这样一个提案框,与其预测一个对象,不如预测所有对象?在形式上,对于每个方案框bi,新方案建议预测相关的一组基本事实实例G(bi),而不是单个对象:

其中,G是所有地面真值框的集合,θ是给定的并(IoU)比相交阈值。图2(b)将概念可视化。与以往的单实例预测框架相比,本文的新方案可以大大简化拥挤场景下的学习。如图2(b)所示,所有三个建议框都被分配给同一组基本事实实例,这是一种可行的行为,因为三个建议实际上具有几乎相同的特征。而对于先前的单实例预测范式(图2(a)),每一个预测都会产生不同的预测,这在本质上可能是困难的。

在本文的方法中,每一个建议都会生成一组实例,而不是一个单独的实例,由于生成了更多的预测,这可能会导致误报的增加。虽然在本文的真实图像实验中很少观察到故障情况,但本文引入了一个可选的故障模块,以防出现风险,如图3(b)所示。该模块只需将预测作为输入,并将其与建议功能相结合,然后执行第二轮预测。本文希望固件模块能够纠正可能的错误预测。

  1. Experiment

表1列出了每个数据集的“实例密度”。因为本文提出的方法主要是为了改进拥挤检测。因此,本文在CrowdHuman上执行大多数比较和消融。注意,在像COCO这样的非拥挤数据集上的实验是为了验证本文的方法是否对孤立对象检测有害,而不是为了显著的性能改进。

表2显示了第3节中所述方法的融合实验,包括EMD损失的多实例预测、设置NMS和增强模块。基线是FPN[20],使用NMS(IoU阈值为0.5)进行后处理。很明显,本文的方法在所有标准中都不断改进性能。

在图1中,由于NMS错误地抑制了一些实例,一种可能的假设是,可以通过使用不同的NMS策略来改进预测。表3探讨了一些变体。对于纯粹的NMS,与默认设置(0.5)相比,稍微增大IoU阈值(从0.5到0.6)可能有助于调用更多实例,因此AP增加。

表4还比较了最近的工作AdaptiveNMS[23],这是一种用于拥挤检测的增强的NMS策略。在[23]中,报告了基于FPN的众人类结果。值得注意的是,由于基线翻新,本文无法与本文的结果进行直接比较。从数据来看,本文发现本文的方法可以在更强的基线(尤其是AP)上实现显著的改进,此外,管道也简单得多。表4还评估了本文在级联R-CNN[2]框架上的方法。在级联R-CNN的最后阶段加入EMD损耗,并设置NMS。研究结果表明,本文的方法仍然可以显著提高级联R-CNN在拥挤数据集(如crowdhman)上的性能。

为了进一步了解本文的方法对拥挤对象的有效性,本文分别比较了拥挤和非拥挤情况下不同方法的召回率。结果如表5所示。请注意,召回与信任分数阈值有关。为了公平比较,本文分别使用与每个条目的最佳JI索引对应的阈值。从表中本文发现,对于FPN基线/软NMS,拥挤对象的召回率远低于非拥挤对象,这意味着拥挤检测的困难。相比之下,本文的方法大大提高了拥挤实例的召回率(从54.4%提高到63.3%,提高了8.9%),另外,非拥挤实例的召回率也略有提高。

表7分别将本文的方法与具有原始NMS和软NMS的FPN基线进行了比较。本文的方法使AP和MR-2分别比NMS基线提高了0.9%和1.0%,表明了本文的方法的有效性。表7还列出了CityPersons的一些其他最新结果。尽管由于不同的超参数设置,直接比较可能不公平,但至少它意味着本文的方法在相对较强的基线上获得了显著的收益。

表6进一步分析了不同方法的召回情况。与CrowdHuman(见表6)中的方法类似,本文的方法主要显著提高了对拥挤对象的召回率——在验证集中的108个实例中,从64个增加到96个。通过比较进一步说明本文的方法对于再次处理拥挤场景是非常有效的。





  1. Conclusion

在本文中,本文提出了一个非常简单而有效的基于建议的目标检测器,专门为拥挤的实例检测而设计。该方法利用多实例预测的概念,引入了EMD损失、SetNMS和re-fiment模块等新技术。本文的方法不仅有效,而且灵活,可以与大多数最先进的基于提议的检测框架进行合作;此外,还可以很好地推广到不太拥挤的场景。

拥挤场景中的目标检测相关推荐

  1. 地平线机器人Waymo Open Dataset Challenge中2D目标检测赛道第二名方案解析

    点击上方"AI算法修炼营",选择"星标"公众号 精选作品,第一时间送达 这是地平线机器人在CVPR 2020 Waymo Open Dataset Challe ...

  2. 算力限制场景下的目标检测实战浅谈

    作者:张钊宁 本文为极市原创,转载请注明作者和出处. 原文:算力限制场景下的目标检测实战浅谈 本篇文章为张博19年1月18日在极市直播分享的文字详细整理. 算力限制场景主要是指在嵌入式设备,也就是算力 ...

  3. 工业视觉中的目标检测——兼谈天池大赛优胜方案

    点击我爱计算机视觉标星,更快获取CVML新技术 目标检测是计算机视觉领域研究最火热的方向,这从计算机视觉顶会CVPR相关论文数量就能看得出来. 目标检测应用范围广泛,上至卫星遥感,下至自动驾驶,大到鲸 ...

  4. X射线图像中的目标检测

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 1 动机和背景 每天有数百万人乘坐地铁.民航飞机等公共交通工具,因 ...

  5. 无人驾驶中的目标检测--MODNet: Moving Object Detection Network for Autonomous Driving

    MODNet: Moving Object Detection Network with Motion and Appearance for Autonomous Driving 这里讲视频动作识别中 ...

  6. 如何在实际场景中使用异常检测?阿里云Prometheus智能检测算子来了

    作者|梵登.白玙 审核&校对:白玙 编辑&排版:雯燕 背景 异常检测作为智能运维(AIOps)系统中基础且重要功能,其旨在通过算法自动地发现 KPI 时间序列数据中的异常波动,为后续的 ...

  7. CVPR2020 | 真实场景中的玻璃检测,有趣的应用

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 本文是我在浏览CVPR2020文章中发现的一篇有趣的有关玻璃检测的文章,平常很少有人关注玻璃检测有关的 ...

  8. AAAI 2021中的目标检测(详细版with code)

    本文转自知乎,已获作者张泽今授权转载,请勿二次转载.原文链接: https://zhuanlan.zhihu.com/p/345472885 本篇文章来介绍一下 AAAI 2021 会议录取的目标检测 ...

  9. 2022最新综述 | 面向大规模场景的小目标检测:综述和 benchmark

    点击上方"计算机视觉工坊",选择"星标" 干货第一时间送达 作者丨汽车人 来源丨自动驾驶之心 1论文背景 目标检测在过去几年中取得了显著的进展,然而,由于小目标 ...

最新文章

  1. 科学养猪的真正奥义,培养拯救人类的医学英雄
  2. PCIPCIE MSI中断
  3. windows 打开.ipynb文件
  4. ORA-01092: ORACLE 例程终止 强行断开连接
  5. 多工作线程获取工作队列简单实现
  6. EOJ_1102_任务调度问题
  7. 【网络编程】之一、初识WinSocket
  8. HALCON示例程序max_connection.hdev确定分割区域的最大区域数目
  9. (ECC)椭圆曲线加密算法原理和C++实现源码
  10. androidannotations gradle Android Studio
  11. 项目管理学习总结(16)——如何突破技术管理
  12. 壁仞科技A轮融资11亿元, 创近年芯片设计领域新纪录
  13. Pandas系列(九)axis参数理解
  14. Web前端/辅助工具
  15. WIFI篇(2.python破解wifi--生成密码字典)
  16. 好用的医药管理软件都有哪些特点
  17. 判断常用贴片元器件正负极简述(嵌入式硬件篇)
  18. 微信推出赞赏码,有人欢喜有人愁
  19. oracle按照汉语拼音排序
  20. 打开文件位置在计算机游戏里面,Win7电脑“打开或关闭windows功能”里面没有游戏文件夹的修复方法...

热门文章

  1. 2022-2028年中国石化行业节能减排投资分析及前景预测报告
  2. Python+OpenCV 图像处理系列(7)—— 图像色彩空间及转换
  3. 多分类 数据不平衡的处理 lightgbm
  4. xgboost重要参数2为主但不全要参照1
  5. 正则表达式中?=和?:和?!的理解
  6. 2020了,还要学JSP嘛?入个门呗!毕竟Servlet亲兄弟~
  7. DeepLabV3+语义分割实战
  8. PyTorch 自动微分
  9. CUDA Pro:通过向量化内存访问提高性能
  10. 什么是视觉Visual SLAM