CPNDet论文链接

一.背景

anchor-based方法将大量框密集分布在feature map上,在推理时,由于预设的anchor与目标差异大,召回率会偏低。而anchor-free不受anchor大小限制,在任意形状上会更加灵活,但是像CornerNet这种,先进行角点检测,将有效的角点枚举组合成大量候选预测框,容易带来大量的FP。而FCOS需要回归关键点到边界的距离,对于长宽大的物体也比较难以预测。

二.网络介绍

1.网络结构以及loss函数

Stage 1: Anchor-free Proposals with Corner Keypoints

假定每个目标都由两个关键点进行定位,先根据CornerNet输出一对左上右下的heatmap,选择top-k个左上角点以及top-k个右下角点。将有效的关键点组合成目标的候选框,关键点组合是否有效主要有两个判断:

  1. 左上右下关键点是否属于同一个类别

  2. 左上角点坐标比右上角点小

同时作者认为cornernet那种embedding向量组合不是保证能够学习到的,在未见过的场景和目标挨得比较近时都会造成性能下降。

Stage 2: Two-step Classification for Filtering Proposals

由于产生heatmap的feature map较大,在角点进行组合时,虽然极大提高了召回率但同时特提升了误检率,还加大了过滤的计算量。所以先进行二分类,过滤掉80%候选框,然后在对剩下的框进行多分类。

首先在feature map上选用7*7RoIAlign提取每个候选框的特征,在使用1个32*7*7输出二分类的分类score。

二分类loss采用focal loss变种。

N:正样本数量;

IoUm:第m个候选框和所有gt box的IOU;

p m:第m个候选区域的分类score;

τ:IOU阈值,一般选择0.7;

α :超参,为2,用来平滑loss函数。

第二步对剩下的框进行多分类,用一个256*7*7输出C维向量,进行C分类,C分类loss也采用focal loss变种。

M̂:上一步过滤后的候选框;

N̂:正样本框

IoU m,c:类别是c为第m个候选框和所有gt box的IOU;

qm,c:类别是c,第m个候选区域的分类score;

α,β:超参,为2,用来平滑loss函数

2.总的loss函数

Ldetcorner:角点定位和cornernet一样;

Loffsetcorner:角点偏移

Lprop:二分类fcoal loss

Lclass:多分类fcoal loss

3.推理阶段

第一个阶段先使用0.2阈值,过滤掉大部分框,在对剩下的框进行多分类。在进行soft Nms即可。

s1:角点的分类score(两个角点的平均)

s2:多分类的score

当两个中一个大于0.5时,才采用上述式子得出预测的类别score,在归一化为[0,1]之间。

三.实验结果

1.是否带二分类的实验结果对比

2.和各种检测框架的实验结果对比

3.速度和精度的对比

CPNDet:Corner Proposal Network for Anchor-free, Two-stage Object Detection相关推荐

  1. ECCV2020 AABO: Adaptive Anchor Box Optimization for Object Detection via Bayesian Sub-sampling论文翻译

    ECCV2020 AABO论文翻译 摘要 1.介绍 2.相关工作 3.提出的方法 3.1 初步分析 3.2 anchors的搜索空间优化 3.3 通过子抽样的贝叶斯锚优化 4.实验 4.1数据集,指标 ...

  2. DAL(Dynamic Anchor Learning for Arbitrary-Oriented Object Detection)

    遥感第二篇读了DAL,也是本校自动化专业前辈的工作.本篇也是参考了其自己的博客用于学习和总结,附上链接.个人认为这篇的流畅程度+严谨程度要胜过S2ANet. 总体理解 S2ANet从网络结构入手,主要 ...

  3. Corner Proposal Network 论文阅读(2020ECCV)

    Introduction 引言 介绍了anchor base 和 anchor free 与one stage 和 two stage ,然后说通常认为的anchor base 有低召回的问题,anc ...

  4. CVPR2020 | 论文阅读——Multiple Anchor Learning for Visual Object Detection

    MAL 用于视觉目标检测的多锚点学习 Abstract 1 Introduction 2 Related Work 2.1 Anchor-Based Method 2.2 Anchor-Free Me ...

  5. Dynamic Refinement Network for Oriented and Densely Packed Object Detection

    摘要 在过去的十年中,目标检测取得了显著的进展.然而,由于以下内在原因,定向和高密度物体的检测仍然具有挑战性: (1)神经元的感受都是轴向对齐的,形状相同,而物体通常是不同的形状,沿着不同的方向排列 ...

  6. CTPN模型详解--Detecting Text in Natural Image with Connectionist Text Proposal Network

    文章目录 Abstract 1 Introduction 1.1 Contributions 2 Related Work 3 Connectionist Text Proposal Network ...

  7. 目标检测方法简介:RPN(Region Proposal Network) and SSD(Single Shot MultiBox Detector)

    原文引用:http://lufo.me/2016/10/detection/ 最近几年深度学习在计算机视觉领域取得了巨大的成功,而在目标检测这一计算机视觉的经典问题上直到去年(2015)才有了完全使用 ...

  8. High Performance Visual Tracking with Siamese Region Proposal Network全文翻译

    摘要   近年来,视觉对象跟踪一直是一个基本主题,许多基于深度学习的跟踪器在多个基准测试中取得了最先进的性能.然而,这些跟踪器中的大多数很难以实时速度获得最佳性能.在本文中,我们提出了 Siamese ...

  9. RPN(Region Proposal Network)

    RPN(Region Proposal Network) 学习RPN前最好先过一遍RCNN和Fast RCNN,本文的图来自原论文和bvBV1af4y1m7iL,有纰漏之处欢迎在评论区指出 RPN什么 ...

最新文章

  1. 一篇长文带你在python里玩转Json数据
  2. ubuntu下安装极点五笔
  3. 视频编码器的智能化——AI辅助编解码的ASIC解决方案
  4. 【HISI系列】之IP/MAC地址配置
  5. Linux Kernel 多个本地安全绕过漏洞
  6. 如何用 Nginx 禁止国外 IP 访问网站 ?
  7. Dz插件-Discuz插件-免费Discuz采集伪原创发布插件
  8. 绿色版电子书PDF转换Word转换器
  9. Arduino 实现PWM输出背后的相关知识
  10. win10微软拼音输入法输入文字时候下方不出现中文提示
  11. 多模态知识问答:MMCoQA: Conversational Question Answering over Text, Tables, and Images
  12. 函数周期表丨筛选丨行值丨EARLIER与EARLIEST
  13. mysql三表联合查询(员工表,部门表,工资表)
  14. 软技能之基本沟通技巧
  15. Lustre—配置和管理磁盘配额
  16. C# 从TTF文件加载自定义字体
  17. python 爬虫 --字符编写问题
  18. PTA 7-5 字符串的连接
  19. Visual Micro for Microsoft Visual Studio 2022.08
  20. Python imp的代替

热门文章

  1. python展开 c函数中的宏预处理_C 语言常用的预处理-宏函数
  2. 做一个好的搜索引擎有多难
  3. ICDAR 2019论文:自然场景文字定位技术详解
  4. 论文浅尝 - CVPR2020 | 基于网格特征的可视问答系统
  5. 论文浅尝 | 混合注意力原型网络的含噪音少样本的关系分类
  6. Android官方开发文档Training系列课程中文版:管理音频播放之控制APP的音量与播放
  7. 一篇文章学习Python中的多线程
  8. 【动态规划】洛谷 P1282 多米诺骨牌
  9. centos 7 Hadoop2.7.4完全分布式搭建(一)
  10. [数位dp] bzoj 3209 花神的数论题