在目标检测中,常用的目标包围框是水平矩形包围框,这对于一些目标方向不定的场景,并不能很好的进行检测。

典型的场景比如遥感图像中的目标检测,船只、飞机、大型建筑物等目标的方向不保证总是平行于图像 x 轴。在场景文本检测、鱼眼图像行人检测、无人机航拍目标检测中也都存在这种问题。允许倾斜的带方向的包围框能更好的描述目标区域。

华科等单位研究学者发表于计算机视觉顶级期刊PAMI的文章 Gliding vertex on the horizontal bounding box for multi-oriented object detection,试图改进目标的包围框表示来解决这个问题,方法简单有效,易于扩展,在通用的目标检测算法上修改得来,几乎不增加计算负担,取得了较好的效果。

该文作者信息:

作者来自华中科技大学、武汉大学、上海交通大学。

该文称业界已经有一些多方向目标检测的文章,比如 EAST: An efficient and accurate scene text detector ,通过对经典目标检测方法得到的包围框进行旋转,更好的表示带方向的目标,但这种方法对于旋转角度计算误差异常敏感,没有很好的解决这一问题。

算法原理

该文如何解决这一问题呢?正如题目中所透露的,作者在通用的水平包围框(x,y,w,h)上设计了滑动的顶点的目标表示方法,通过检测时一次性回归得到这些参数,获得计算新包围框的必要元素。

看懂了下面这两幅图,就可完全理解该算法的要义。

该文算法整体过程:

图1 整体流程

目标包围框的滑动顶点表示方法:

图2

图像经过CNN检测网络,对于每一个候选目标,得到三部分计算结果:

1)分类分数,代表是不是某类目标;

2)回归得到的包围框表示(细节在图2),除了中心点(x,y)、宽高(w,h),还有表示四个滑动顶点的长度比例参数(a1a2a3a4);

3)回归得到的倾斜因子(r,obliquity factor),表示目标方向偏离水平方向的大小,倾斜因子越大代表越水平。

根据倾斜因子大小,若其大于某个阈值,则将其看作为水平目标检测,反之,则使用包围框参数计算新的包围框。

如何计算新的包围框呢?从图 2 显而易见可知,(a1a2a3a4)这四个长度比例参数代表着目标新包围框顶点位置。

所以回过头来,该文实际上是增加了目标的包围框表示参数,在任意目标检测算法框架下回归这些参数,都可完成方向任意的目标检测。

文中,作者使用的是Faster RCNN算法,改动示意图如下:

因为增加了预测目标,相应的多任务损失函数也需要做改变:

实验结果

作者在含有方向任意目标的遥感图像数据集DOTA、HRSC2016,文本数据集MARA-TD500、RCTW-17,鱼眼镜头行人数据集MW-18Mar上进行了实验,并与之前的state-of-the-art方法进行了比较。

DOTA数据集上的结果比较:

该文提出的方法几乎都是精度第一高或第二高。

HRSC2016上也超越了其他算法:

在多方向文本检测领域也表现的很好:

在鱼眼行人检测数据集上也大幅超越了baseline和之前的方法;

下图为在遥感图像的检测结果示例:

遥感和文本图像上的结果:

与之前方法在遥感图像上结果的比较可视化:

鱼眼行人检测比较可视化:

可见,该文提出的方法在多个方向任意目标检测问题中均取得了进步,无论是数值比较还是可视化效果。

另外,作者已经开源了代码,欢迎大家参考!

论文地址:

https://arxiv.org/abs/1911.09358

在我爱计算机视觉公众号后台回复“任意方向目标”,即可收到论文下载。

代码地址:

https://github.com/MingtaoFu/gliding_vertex

END

备注:目标检测

目标检测交流群

2D、3D目标检测等最新资讯,若已为CV君其他账号好友请直接私信。

我爱计算机视觉

微信号:aicvml

QQ群:805388940

微博/知乎:@我爱计算机视觉

投稿:amos@52cv.net

网站:www.52cv.net

只有不到7%的公众号还在坚持原创

欢迎点在看支持我  

华科PAMI黑科技,方向任意目标检测新算法相关推荐

  1. CVPR 2020 | 中科院、商汤联合提出大规模多标签目标检测新算法

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 仅作分享,不代表本公众号立场,侵权联系删除 转载于:学术头条 AI博士笔记系列推荐 周志华<机器学习>手 ...

  2. CVPR 2020 |商汤提出应对尺度变化的目标检测新算法

    在CVPR 2020上,为了更好的解决物体检测中的尺度问题,商汤EIG算法中台团队重新设计了经典的单阶段检测器的FPN[1]以及HEAD结构,通过构造更具等变性的特征金子塔,以提高检测器应对尺度变化的 ...

  3. 2021IAAA北京理工大学面向任意目标检测的动态锚点学习(DAL)

    面向任意目标检测的动态锚点学习 摘要:面向任意的目标广泛地出现在自然场景.航空照片.遥感图像等中,因此面向任意的目标检测得到了广泛的关注.目前许多旋转探测器使用大量不同方向的锚点来实现与地面真实框的空 ...

  4. NWD-Based Model | 小目标检测新范式,抛弃IoU-Based暴力涨点(登顶SOTA)

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 作者丨ChaucerG 来源丨集智书童 小目标检测是一个非常具有挑战性的问题,因为小目标只包含几个像素 ...

  5. CVPR 2020 | CentripetalNet:目标检测新网络,COCO 48 % AP超现所有Anchor-free网络

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 Anchor-free目标检测新网络,在COCO上可达48 AP!性能优于CenterNet.RPDe ...

  6. 超越 MobileNet,谷歌提出 MobileDets:移动端目标检测新标杆

    原文链接:超越 MobileNet,谷歌提出 MobileDets:移动端目标检测新标杆 导读:在移动端上的目标检测架构,目前比较流行的三大派系分别为:谷歌出品的MobileNet系列(v1-v3). ...

  7. CVPR 2020 | 港中文提出3D目标检测新框架DSGN

    ©PaperWeekly 原创 · 作者|张承灏 学校|中科院自动化所硕士生 研究方向|双目深度估计 本文介绍的是香港中文大学贾佳亚团队在 CVPR 2020 上提出的 3D 目标检测新框架--深度立 ...

  8. 何恺明团队最新研究:3D目标检测新框架VoteNet,两大数据集刷新最高精度

    [导读]FAIR何恺明等人团队提出3D目标检测新框架VoteNet,直接处理原始数据,不依赖任何2D检测器.该模型设计简单,模型紧凑,效率高,在两大真实3D扫描数据集上实现了最先进的3D检测精度. 当 ...

  9. 云服务器竞争,比格云将以“黑科技”开启云服务器竞争新格局

    (原标题:比格云将以"黑科技"开启云服务器竞争新格局) 齐鲁晚报济南10月20日讯:当以集成电路上晶体管数量级为标志的摩尔定律走到了尽头,贝索斯定律登场亮相,以单位计算能力提升与价 ...

最新文章

  1. 使用 Azure CLI 2.0 从自定义磁盘创建 Linux VM
  2. Sqlcmd连接SQL方式(远程机器直接查询SQL)
  3. 基于Xml 的IOC 容器-寻找入口
  4. GAN也有脾气:「太难的部分我就不生成了,在下告退」
  5. Tornado部署时那些奇怪的错误
  6. EXTJS源码分析与开发实例-原创2章下载
  7. Xmanager Xbrowser--Win10远程连接CentOS7
  8. 利用开区间覆盖的约简给出有限覆盖定理的一个新证明
  9. 雇佣兵(程序设计与算法(一))
  10. SPSS多元线性回归输出结果的详细解释
  11. 国外服务器被攻击以及应对方法
  12. A16z:为什么 NFT 创作者要选择 cc0?
  13. 实现基于XDP/eBPF的快速路由转发功能
  14. 信心在生活中起到了什么样的作用
  15. Mq的幂等性问题分析和基本处理
  16. 混合馈能悬架的设计与仿真(MATLAB)
  17. 成都青羊考场科目二考试分享
  18. 【Unity-学习-014】EasyAR4.0稀疏空间地图 扫描场景功能
  19. 总结常见应用层协议端口号
  20. java解析pdf文档(前面写了docx的解析所以也思考写一份pdf的解析)--PdfReader底层分析

热门文章

  1. JQuery ZTree简单使用
  2. CSU 1111 三家人
  3. iphone短信尚未送达_潮讯:iPhone12重大升级;华为麒麟被炒价;抖音上线云游戏;骚扰短信要凉了;一加刘作虎回归OPPO...
  4. gcn 图卷积神经网络_复制一文读懂图卷积GCN
  5. n分解后的最大乘积java_【编程题】乘积最大的拆分
  6. 保利管道微服务1_.netcore 3.1高性能微服务架构:webapi规范
  7. eclipse远程连接hadoop_hadoop上搭建hive
  8. 优先级调度算法实现_React17新特性:启发式更新算法
  9. buck电路 dac stm32_STM32定时器学习---基本定时器
  10. java哈夫曼树编码_哈夫曼树的编码实验