> 论文提出从IoU指标延伸来的PIoU损失函数,能够有效地提高倾斜目标检测场景下的旋转角度预测和IoU效果,对anchor-based方法和anchor-free方法均适用。另外论文提供了Retail50K数据集,能够很好地用于评估倾斜目标检测算法的性能

来源:晓飞的算法工程笔记 公众号

论文: PIoU Loss: Towards Accurate Oriented Object Detection in Complex Environments

Introduction

当前的目标检测方法由于BB(bounding boxes)的特性,对倾斜和密集物体的检测存在一定的局限性。为了解决这个问题,研究者扩展出了带旋转参数的OBB(oriented bounding boxes),即从BB($c_x,c_y,w,h$)扩展为OBB($c_x,c_y,w,h,\theta$),其中$\theta$旋转角度,这样OBB就能更紧凑地包围目标,可以更好地检测旋转和密集的物体。

目前的OBB-based方法大多数在anchor-based架构上采用距离损失来优化上述的5个参数,并且在航空图片的目标检测上已经有一些应用。但其检测性能在更复杂的场景中依然存在局限性,主要原因在于距离损失更多地是优化旋转角度误差,而不是优化全局IoU,特别是对长条形物体很不敏感。如图a所示,两个IoU相差很大的情景下,距离损失的结果却是一样的。

为了解决这个问题,论文提出PIoU(Pixels-IOU)损失来同时提高旋转角度和IoU的准确率。如图b所示,PIoU损失能直接反映物体间的IoU,但由于OBB间的相交区域可能是多边形,OBB的IoU比BB的IoU要难算得多,所以PIoU损失以逐像素判断的方式进行IoU计算并且是连续可微的。另外论文还提供了包含高长宽比倾斜目标的检测数据集Retail50K,方便OBB-based检测算法的研究。

论文的贡献如下:

提出新的损失函数PIoU损失,能够提升倾斜目标的检测效果。

提供新的数据集Retail50K,可以更好的进行OBB-based算法的评估。

通过实验证明PIoU损失的有效性,能够运用于anchor-based和anchor-free方法。

Pixels-IoU (PIoU) Loss

对于OBB $b$($c_x, c_y, w,h,\theta$),理想的损失函数能够引导网络最大化IoU,降低$b$的错误率。为了到达这个目的,需要准确且高效地计算OBB间的IoU,论文采用了像素计数的方式来计算IoU。

对于点$p_{ij}$和OBB $b$,根据其到中线的距离$d^h_{i,j}$和中线交点到中点的距离$d^w_{i,j}$来判断点是否在OBB内:

定义$B_{b,b^{'}}$为包围$b$和$b^{'}$的最小正方形,可以通过判断$B_{b,b^{'}}$中的所有像素来计算$b$和$b^{'}$间的交集区域和并集区域:

最后通过$S_{b\cap b^{'}}$除以$S_{b\cup b^{'}}$计算IoU,但公式1并不是连续可微函数,导致不能进行反向传播训练。为了解决这个问题,将公式1转换为两个核的乘积$F(p_{i,j}|b)$:

其中$k$用于控制对目标像素$p_{i,j}$的敏感程度,由于公式9使用了相对位置信息(图a的点距离和三角形的角度),所以$S_{b\cap b^{'}}$和$S_{b\cup b^{'}}$均是对OBB的旋转角度和大小敏感的。

如图b所示,$F(p_{i,j}|b)$是连续可微的,且与公式1类似。当$p_{i,j}$在$b$内时,$F(p_{i,j}|b)$接近于1,反之则接近于0。为此,$b$和$b^{'}$的交并集区域计算变为:

为了降低公式11的计算量,简化为:

基于公式10和公式12,PIoU的计算为:

定义$M$为所有正样本对,PIoU损失的计算为:

PIoU损失也可用于无交集的OBB,因为PIoU始终大于零,梯度依然可以计算,另外PIoU损失也可以用于正常的BB场景中。

Retail50K Dataset

之前的大多数OBB数据集都是航空图片,少部分数据集对MSCOCO等数据集进行重新标注。据统计,航空图片数据集中大多数OBB的长宽比都在1:4内,而主流数据集则集中在1:1,不能够很好地评价OBB-based方法的性能。为此,论文提供了Retail50K数据集,由47000张不同的超市图片构成,标注对象为货架的层架边。数据集包含复杂的背景和高长宽比目标,并且具有实际使用意义。

Experiments

不同$k$下对比实验。

对比其它损失函数在OBB场景下的性能。

对比其它损失函数在BB场景下的性能。

Retail50K数据集上的性能对比。

HRSC2016数据上的性能对比。

DOTA数据上的性能对比。

结果可视化对比。

Conclustion

论文提出从IoU指标延伸来的PIoU损失函数,能够有效地提高倾斜目标检测场景下的旋转角度预测和IoU效果,对anchor-based方法和anchor-free方法均适用。从结果来看,PIoU损失的效果还是十分明显的。另外论文提供了Retail50K数据集,能够很好地用于评估倾斜目标检测算法的性能。

> 如果本文对你有帮助,麻烦点个赞或在看呗~

更多内容请关注 微信公众号【晓飞的算法工程笔记】

hrsc2016 下载 数据集_PIoU Loss:倾斜目标检测专用损失函数,公开超难倾斜目标数据集Retail50K | ECCV 2020 Spotlight...相关推荐

  1. Facebook 开源3D目标检测框架VoteNet,曾刷新两大数据集最高精度

    点击我爱计算机视觉标星,更快获取CVML新技术 VoteNet为Facebook何恺明等人于今年4月在论文Deep Hough Voting for 3D Object Detection in Po ...

  2. 腾讯提超强少样本目标检测算法,公开1000类检测训练集FSOD | CVPR 2020

    作者 | VincentLee 来源 | 晓飞的算法工程笔记 不同于正常的目标检测任务,few-show目标检测任务需要通过几张新目标类别的图片在测试集中找出所有对应的前景.为了处理好这个任务,论文主 ...

  3. yolov3为什么对大目标检测不好_基于改进Yolov3的目标检测的研究

    晏世武 罗金良 严庆 摘要:目标检测在视频监控.无人驾驶系统.机械自动化等领域起着重要作用.在如今大数据的背景下,为进一步提高Yolov3在不同数据集下的性能,本文以KITTI数据集为基础,利用重新調 ...

  4. 目标检测算法综述 | 基于候选区域的目标检测器 | CV | 机器视觉

    目标检测算法综述 | 基于候选区域的目标检测器 | CV | 机器视觉 滑动窗口检测器 自从 AlexNet 获得 ILSVRC 2012 挑战赛冠军后,用 CNN 进行分类成为主流.一种用于目标检测 ...

  5. ECCV 2020 Spotlight,COCO关键点检测冠军算法RSN解析

    "15分钟看顶会"是旷视研究院全新推出的论文快速解读专栏,聚焦旷视在全球各大顶会.期刊等平台所发表的工作,覆盖深度学习.计算机视觉.视觉导航与控制.计算摄影学.大规模机器学习系统. ...

  6. 目标检测回归损失函数简介:SmoothL1/IoU/GIoU/DIoU/CIoU Loss

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 来源:极市平台 目标检测任务的损失函数由Classificitio ...

  7. 目标检测分类损失函数——Cross entropy、Focal loss

    一.Cross Entropy Loss 交叉熵是用来判定实际的输出与期望的输出的接近程度,刻画的是实际输出与期望输出的距离,也就是交叉熵的值越小,两个概率分布就越接近. 1. CE Loss的定义 ...

  8. 目标检测回归损失函数:SmoothL1/IoU/GIoU/DIoU/CIoU Loss

    文章目录 1. Smooth L1 Loss 1.1 假设x为预测框和真实框之间的数值差异,常用的L1和L2 Loss定义为: 1.2 上述的3个损失函数对x的导数分别为: 1.3 实际目标检测框回归 ...

  9. 【目标检测实战】目标检测实战之一--手把手教你LMDB格式数据集制作!

    文章目录 1 目标检测简介 2 lmdb数据制作 2.1 VOC数据制作 2.2 lmdb文件生成 lmdb格式的数据是在使用caffe进行目标检测或分类时,使用的一种数据格式.这里我主要以目标检测为 ...

最新文章

  1. 学猫叫用计算机歌词,我们一起学猫叫什么歌歌词是什么意思
  2. html css3d效果,html,css的3D变形
  3. 对hash签名失败_vue项目中微信jssdk在ios签名失败
  4. 【Nacos】Nacos MySQL 配置后无法登录 愚蠢的问题
  5. 关于各种无法解析的外部符号问题的相应解决方案【转】
  6. junit5和junit4_JUnit声明异常– JUnit 5和JUnit 4
  7. ubuntu 1804.1 升级失败:Hash Sum mismatch
  8. tftp怎么给服务器传文件,(tftp) - 在本机和tftp服务器之间使用TFTP协议传输文件...
  9. ios开发快速入门教程
  10. 锂离子电池电压与容量的关系及容量计算方法
  11. 高性价比降噪耳机推荐,2023年降噪耳机排行榜推荐
  12. 让我们来认识一下信号与系统的关系
  13. 通过拼多多根据ID获取商品详情数据简易操作
  14. 【Power BI+Excel+Python】2019年4月全国数据分析招聘岗位可视化分析
  15. 计算机组成原理---32位的CPU64位CPU与32位os64os的区别与联系
  16. office2016
  17. Android AccountManager帐号管理(二)
  18. 阿里CEO张勇解读入股高鑫零售:婚后怎么过日子已经谈得很好了
  19. 数字系统实验:三位数码管
  20. android 卷轴动画,原来这种画卷展开的效果这么简单!三步即可做出来!太惊艳了...

热门文章

  1. C#实现UTC时间与Datetime转换
  2. 代码大全 MSIL语言程序设计
  3. C# 数据库连接字符串集合
  4. 数据库-Oracle【Oracle数据库设置默认表空间问题及Oracle,SQL,MySQL的自增变量设置】...
  5. 268 missing number
  6. mysql数据库的各种锁_关于MySQL各类锁的总结
  7. 封包时发现的关于QIODevice类write函数的坑
  8. awr报告分析 mysql_AWR报告的生成和简单分析方法
  9. html页面 wordpress,WordPress纯代码实现前端页面HTML完美压缩
  10. sql backup database备份d盘_ClickHouse 备份与恢复