在目标检测当中,有一个重要的概念就是 IOU。一般指代模型预测的 bbox 和 Groud Truth 之间的交并比。

何为交并比呢?

I O U = A ∩ B A ∪ B IOU = \frac{A\cap B}{A\cup B} IOU=A∪BA∩B​

集合 A 和集合 B 的并集包括了上面 3 种颜色区域。

集合 C 是集合 A 与集合 B 的交集。

在目标检测当中,IOU 就是上面两种集合的比值。

A ∪ B A \cup B A∪B 其实就是 A + B − C A + B - C A+B−C。

那么公式可以转变为:
I O U = A ∩ B A + B − ( A ∩ B ) IOU = \frac{A \cap B}{A + B - (A \cap B)} IOU=A+B−(A∩B)A∩B​

IOU 衡量两个集合的重叠程度。

  • IOU 为 0 时,两个框不重叠,没有交集。
  • IOU 为 1 时,两个框完全重叠。
  • IOU 取值为 0 ~ 1 之间的值时,代表了两个框的重叠程度,数值越高,重叠程度越高。

在 2D 目标检测当中,因为 bbox 是矩形,所以很容易求得 IOU。

方框 A 和 B 相交,典型的情况如下:


A 和 B 的面积容易求得,C 的面积稍微繁琐一点,但耐心细致的话可以求得。

如果利用数学思维,细心整理,可以发现面积 C 只需要求得边长的乘积就好,即使 A 和 B 的位置是相对的,但稍加变换也能够求出。

如果以 W 代表 A 和 B 的交集 C 的 x 轴方向上的边长,那么有

W = m i n ( A . x 1 , B . x 1 ) − m a x ( A . x 0 , B . x 0 ) W = min(A.x_{1},B.x_{1}) - max(A.x_{0},B.x_{0}) W=min(A.x1​,B.x1​)−max(A.x0​,B.x0​)

同理,

H = m i n ( A . y 1 , B . y 1 ) − m a x ( A . y 0 , B . y 0 ) H = min(A.y_{1},B.y_{1}) - max(A.y_{0},B.y_{0}) H=min(A.y1​,B.y1​)−max(A.y0​,B.y0​)

大家仔细观察上面的对应关系,可以发现公式是成立的。这个公式的推导并不难,无非是 4 个顶点的坐标的相对位置变换,大家可以自行琢磨。

如果 A 与 B 根本就不相交。

这个时候可以发现 W <= 0 或 H <= 0.

下面是 Python 代码。

class BBox:def __init__(self,x,y,w,h):self.x = xself.y = yself.w = wself.h = hdef iou(a,b):assert isinstance(a,BBox)assert isinstance(b,BBox)area_a = a.w * a.harea_b = b.w * b.hw = min(b.x+b.w,a.x+a.w) - max(a.x,b.x)h = min(b.y+b.h,a.y+a.h) - max(a.y,b.y)if w <= 0 or h <= 0:return 0area_c = w * hreturn area_c / (area_a + area_b - area_c)if __name__ == '__main__':a = BBox(1,1,4,5)b1 = BBox(1,1,4,5)b2 = BBox(5,1,4,5)b3 = BBox(3,2,3,6)print("iou ",iou(a,b1))print("iou ",iou(a,b2))print("iou ",iou(a,b3))

运行结果如下:

iou  1.0
iou  0
iou  0.26666666666666666

【深度学习】目标检测中 IOU 的概念及计算相关推荐

  1. 谈谈深度学习目标检测中的遮挡问题

    引自:"别挡我,我要C位出道!"谈谈深度学习目标检测中的遮挡问题 - Naiyan Wang的文章 - 知乎 https://zhuanlan.zhihu.com/p/436559 ...

  2. 知识图谱在深度学习目标检测中的应用

    知识图谱是什么?深度学习的目标检测怎么和它相结合?我将带大家一起来解读其中奥秘--阿波,2020.4.16 检索摘要 写在前面 知识图谱 Abstract Introduction Base Dete ...

  3. 深度学习目标检测中计算目标的AP(average precision)平均精度、有什么用?

    AP衡量的是学出来的模型在每个类别上的好坏,mAP衡量的是学出的模型在所有类别上的好坏,得到AP后mAP的计算就变得很简单了,就是取所有AP的平均值. 参考文章:深度学习-目标检测评估指标P-R曲线. ...

  4. 深度学习目标检测指南:如何过滤不感兴趣的分类及添加新分类?

    编译 | 庞佳 责编 | Leo 出品 | AI 科技大本营(公众号ID:rgznai100) AI 科技大本营按:本文编译自 Adrian Rosebrock 发表在 PyImageSearch 上 ...

  5. 深度学习目标检测详细解析以及Mask R-CNN示例

    深度学习目标检测详细解析以及Mask R-CNN示例 本文详细介绍了R-CNN走到端到端模型的Faster R-CNN的进化流程,以及典型的示例算法Mask R-CNN模型.算法如何变得更快,更强! ...

  6. 动手学深度学习——目标检测 SSD R-CNN Fast R-CNN Faster R-CNN Mask R-CNN

    来源:13.4. 锚框 - 动手学深度学习 2.0.0-beta1 documentation 目标检测:锚框算法原理与实现.SSD.R-CNN_神洛华的博客 目录 目标检测简介 目标检测模型 ​编辑 ...

  7. 深度学习目标检测方法综述

    参考:https://blog.csdn.net/Standing_On_Giant/article/details/60333329 参考:https://blog.csdn.net/xiaohu2 ...

  8. 深度学习目标检测之RCNN、SPP-net、Fast RCNN、Faster RCNN

    一.目标检测介绍 目标检测(目标提取)是一种基于目标几何和统计特征的图像分割,将目标的分割和识别合二为一,主要是明确从图中看到了什么物体.它们分别在什么位置.传统的目标检测方法一般分为三个阶段:首先在 ...

  9. 值得收藏!基于激光雷达数据的深度学习目标检测方法大合集(下)

    作者 | 黄浴 来源 | 转载自知乎专栏自动驾驶的挑战和发展 [导读]在近日发布的<值得收藏!基于激光雷达数据的深度学习目标检测方法大合集(上)>一文中,作者介绍了一部分各大公司和机构基于 ...

最新文章

  1. java 理论与实践,Java 理论与实践: 正确使用 Volatile 变量
  2. 阿里高级技术专家:如何结构化地思考、做事、成长?
  3. 一篇万字长文读懂微软PDB、SourceLink——.net core之nuget 包调试
  4. 第十三题:子类要调用继承自父类的方法,必须使用super关键字。
  5. 华为鸿蒙系统学习笔记4-方舟编译器源码下载及安装
  6. 多个java文件编译并打成jar包经典方法
  7. 在vue项目中 如何定义全局变量 全局函数
  8. Linux命令格式及目录与文件常用命令
  9. java教程配置通达信,通达信公式转换JAVA,通达信20个经典公式
  10. layoutit+Bootstrap html页面布局+CSS
  11. 【项目经验】——vs2012程序打包部署下载InstallShield2015LimitedEdition的两种解决方案
  12. 深度:老年消费品细分领域潜藏爆品机会,老花镜市场6000万风险投资揭示老年消费升级背后的创新机会!
  13. PID为0的系统空闲进程连接状态为TIME_WAIT
  14. self的用法与意义(一)
  15. 要成为游戏开发人员需要有以下书籍(二)
  16. Android--微信支付
  17. JavaScript数字运算必备库——big.js源码解析
  18. 我的世界服务器怎么解压文件,我的世界整合包压缩包解压及使用
  19. c++内存释放的几种方法
  20. Android 时间转换

热门文章

  1. 每日新闻 | 苹果信用卡Apple Card今日推出!部分用户已收到邀请
  2. 0001.Latex中中文双引号和单引号的写法
  3. 汽车百科系列之(六): 鲜为人知的自动挡驾驶误区
  4. 天津理工大学计算机答辩,2017年研究生论文答辩工作安排
  5. 多项式函数曲线拟合——最小二乘法
  6. @Scheduled中fixedDelay、fixedRate、initialDelay 和cron表达式的解析及区别
  7. mDNS__2018.07.30
  8. 26岁才学java_26岁学java编程晚不晚
  9. 虹软人脸识别iOS SDK2.0
  10. 在python领域有名的培训机构排名出炉