#今日论文推荐# ResNet50上天 | DDQ改进Sparse RCNN让ResNet50在coco上来到了49.8的AP

在 DETR 出现之后,端到端的目标检测得到了迅速的发展。DETR 使用一组稀疏查询来替换大多数传统检测器中的密集候选框。相比之下,稀疏查询不能保证作为密集先验的高召回率。但是,在当前框架中,使查询变得密集并非易事。它不仅计算成本高,而且优化困难。由于稀疏查询密集查询都不完美,那么端到端目标检测中的预期查询是什么?
本文表明预期的查询应该是密集的不同查询(DDQ)。具体来说,将密集先验引入框架以生成密集查询。对这些查询应用重复查询删除预处理,以便它们彼此区分开来。然后迭代处理密集的不同查询以获得最终的稀疏输出。
实验展示了 DDQ 更强大、更健壮且收敛更快。它在 MS COCO 检测数据集上仅用 12 个 epoch 就获得了 44.5 AP;在各种数据集上的目标检测和实例分割任务上都优于以前的方法。DDQ 融合了传统密集先验和最近的端到端检测器的优势。作者希望它可以将 DDQ 作为一个新的Baseline,并激发研究人员重新审视传统方法和端到端检测器之间的互补性。

目标检测是计算机视觉中最基本的挑战之一,旨在用单个边界框定位每个目标。它带来了一个具有挑战性的问题,即准确的目标检测器既要检测所有目标又要避免预测重复的框。

为了解决这个问题,以前最先进的方法大多遵循标准范式,如图 1(a)所示,首先生成密集的候选框,然后将一个 GT 分配给许多候选框以实现高目标召回;然而,一对多的分配会导致冗余预测。由于在目标检测中每个目标应该只有一个预测,因此采用辅助后处理,例如非极大值抑制(NMS)来去除重复的预测。尽管多年来一直主导目标检测,但该 Pipeline 在不损害正确预测的情况下完美过滤掉了重复框。

论文题目:What Are Expected Queries in End-to-End Object Detection?
详细解读:https://www.aminer.cn/research_report/62a158557cb68b460fcded85?download=falsehttps://www.aminer.cn/research_report/62a158557cb68b460fcded85?download=false
AMiner链接:https://www.aminer.cn/?f=cs

#今日论文推荐# ResNet50上天 | DDQ改进Sparse RCNN让ResNet50在coco上来到了49.8的AP相关推荐

  1. ResNet50上天 | DDQ改进Sparse RCNN让ResNet50在coco上来到了49.8的AP

    在 DETR 出现之后,端到端的目标检测得到了迅速的发展.DETR 使用一组稀疏查询来替换大多数传统检测器中的密集候选框.相比之下,稀疏查询不能保证作为密集先验的高召回率.但是,在当前框架中,使查询变 ...

  2. #今日论文推荐# 阿里达摩院最新FEDformer,长程时序预测全面超越SOTA | ICML 2022

    #今日论文推荐# 阿里达摩院最新FEDformer,长程时序预测全面超越SOTA | ICML 2022 时间序列预测在众多领域中(例如电力.能源.天气.交通等)都有广泛的应用.时间序列预测问题极具挑 ...

  3. #今日论文推荐# 莫纳什大学最新《长文档摘要》综述,39页pdf长文档摘要的实证研究:数据集、模型和指标

    #今日论文推荐# 莫纳什大学最新<长文档摘要>综述,39页pdf长文档摘要的实证研究:数据集.模型和指标 像学术文章和商业报告这样的长文档已经成为了详述需要额外关注的重要问题和复杂主题的标 ...

  4. #今日论文推荐# 朱松纯团队最新研究:机器人可与人类“推心置腹”!还说下一步要造“AI大白”

    #今日论文推荐# 朱松纯团队最新研究:机器人可与人类"推心置腹"!还说下一步要造"AI大白" 机器人能否像<超能陆战队>中的"大白&quo ...

  5. #今日论文推荐# 将有色液体图像转换成透明液体,CMU教机器人准确掌控向杯中倒多少水

    #今日论文推荐# 将有色液体图像转换成透明液体,CMU教机器人准确掌控向杯中倒多少水 借助不同风格之间的图像转换,CMU 的研究者教会了机器人理解透明液体. 如果机器人可以倒液体,则可以帮助我们自动完 ...

  6. #今日论文推荐#CVPR 2022 | 道高一尺,魔高一丈,ConvNet还是ViT?

    #今日论文推荐#CVPR 2022 | 道高一尺,魔高一丈,ConvNet还是ViT? 作者在 Introduction 部分里,从 ConvNet 的前世今生开始讲起,并且在第二段就表明了一个观点: ...

  7. #今日论文推荐# 中国矿大团队,开发集成多尺度深度学习模型,用于 RNA 甲基化位点预测

    #今日论文推荐# 中国矿大团队,开发集成多尺度深度学习模型,用于 RNA 甲基化位点预测 研究表明,通过转录后 RNA 修饰进行的表观转录组调控,对于所有种类的 RNA 都是必不可少的.准确识别 RN ...

  8. #今日论文推荐# 文字秒变3D?苹果发布最新AI生成模型GAUDI,根据文字提示创建3D场景

    #今日论文推荐# 文字秒变3D?苹果发布最新AI生成模型GAUDI,根据文字提示创建3D场景 继 AI 将文字变成图片后,又有 AI 可以将文字变成 3D 场景了. 苹果发布新 AI 系统 GAUDI ...

  9. #今日论文推荐# 斯坦福开发微型机器人,改善靶向给药技术

    #今日论文推荐# 斯坦福开发微型机器人,改善靶向给药技术 小小一枚圆形药片就能治疗从胃痉挛到头痛的多种症状,但是如果你曾吞服过此类药物,就会知道它们并不能精准地产生止痛效果. 虽然非处方药早已问世,并 ...

最新文章

  1. 关于Arrays类总结
  2. asp.net之request获取数据
  3. axure8.0导出页面打不开问题_excel怎么转pdf?excel打不开?转换成PDF就行了
  4. 使用脚本动态操作 SVG 文档
  5. struts2学习(3)struts2核心知识II
  6. JavaScript事件处理程序的3种方式
  7. mysql主从北_mysql北非之主从同步
  8. [转载]stl之string类用法详细总结
  9. 【鱼眼镜头2】[鱼眼畸变模型]:评估了五个模型:radial,division,FOV,多项式(如双三次]和rational模型。
  10. 在Windows上安装jupyter notebook的scala kernel —— jupyter-scala
  11. chrome 开启HEVC硬件解码
  12. app用户注册、登录原理、注册页面
  13. 时间复杂度:O(1)、O(n)、O(n²)、O(nlogn)等是什么意思,白话文解释专业术语。
  14. 数据库与数据库管理系统之间的关系
  15. [MacOSX]_[LaunchDaemons]_[Mac OS X 安装Tomcat开机启动服务的方法之一]
  16. 2020-10-1 //严蔚敏《数据结构》 //赫夫曼树及其应用:创建顺序赫夫曼树创建及得到赫夫曼编码
  17. iOS截屏后仿今日头条实现一键分享
  18. java 侵入性_侵入式列表实现Java?
  19. 阿里云服务器开放端口的正确方式(超详细图文教程)
  20. 【元胞自动机】元胞自动机单车道交通流(时空图)【含Matlab源码 1681期】

热门文章

  1. 如何在苹果Mac上开启AirDrop?
  2. Windows上获取文件大小的几种方法及获取文件夹大小方法
  3. xxl-job(许雪里开发),分布式任务调度平台+定时任务
  4. 【气球】关于气球动力与控制的设想
  5. 基于形变势理论计算载流子迁移率
  6. 《深度工作》一书摘抄
  7. 【Python基础】Python调试器pdb
  8. Android 8刘海屏特性,Android 8.0刘海屏适配方案 小米和华为根据官方api即可获取隐藏显示转态,oppo和Vivo没有公开API...
  9. 薄荷油的全球与中国市场2022-2028年:技术、参与者、趋势、市场规模及占有率研究报告
  10. 算法到底应该怎么学?