这篇博客主要讲解为什么可以用线性模型去做Bounding Box Regression,在讲解之前先明确几个先决条件:
(1)Bounding Box由包含四个参数的坐标组成,即

其中Gx,Gy表示Bounding Box的中心点横纵坐标,Gw,Gh分别表示Bounding Box的宽与高。
(2)回归过程涉及到三个坐标
    I. ground-truth bounding box G.
    II. predicted ground-truth box G.
    III. proposal P bounding box.

1. Original Paper

2. Bounding Box Regression

如Sec. 1.中提到的,we only learn from a proposal P if it is nearby at least one ground-truth box. 如果不是正例标注框附近的region proposal,那么这样的边界框映射是没有必要的,而附近这个近的程度作者是用IoU定义的。
下面以一个具体的图体会一下:

绿框代表Ground-truth box,红框代表Region Proposal。Bounding Box Regression的目的是让红框 P 进行一定的变换尽量靠近绿框G,用尽量一词是因为不可能实现完全重合,所以只能得到一个靠近的结果G,但相比于P肯定是更准确的。设想一下,笨笨的算法看到红框就想往绿框变换,显然将上图中dog1的红框朝着dog2的绿框去变换是没有道理的,所以作者通过IoU限制了这个笨笨的想法。


那么为什么可以用线性回归模型实现这种变换呢?

从上图可以发现最完美的变换应该是右边的t*,这个变换使得G 与G重合,即完全正确定位,但显然这是小概率事件,因此我们需要一个优化目标。
定义一个对P的变换为:

我们优化的目标就是希望这个定义的变换与完美变换t* 尽量相近,于是得出优化目标:

其中,式子第二部分表示模型复杂度正则,作者在论文中也对此作了说明。
tx, ty对P是线性变换可以理解,但 tw, th明明是log变换,为什么也可以进行线性变换呢?

有人说,根据从上面分析只要保证Region Proposal和Ground Truth的宽高相差不多就能满足回归条件,对x,y位置倒没有太多限制。但我认为这个说法不对,就像上面说的,你得通过x,y位置确定对应的是同一个object。这也是论文在这设置IoU的原因。

Bounding Box Regression相关推荐

  1. Bounding box regression详解

    Bounding box regression详解 转载 http://blog.csdn.net/u011534057/article/details/51235964 Reference link ...

  2. 感知算法论文(八):Generalized Intersection over Union:A Metric and A Loss for Bounding Box Regression(2019)

    文章目录 摘要 引言 2. 相关工作 3. Generalized Intersection over Union 3.1 GIoU as Loss for Bounding Box Regressi ...

  3. softer-nms论文学习详解(Bounding Box Regression with Uncertainty for Accurate Object Detection)

    <Bounding Box Regression with Uncertainty for Accurate Object Detection> 论文地址: https://arxiv.o ...

  4. 论文阅读:Softer-NMS: Rethinking Bounding Box Regression for Accurate Object Detection

    Softer-NMS 文章   和之前同样出自Megvii的一篇论文IoU-Net一样,这篇论文的出发点也是,two-stage detector进行NMS时用到的score仅仅是classifica ...

  5. Bounding box regression RCNN我的理解

    0. bounding-box regression bouding-box regression 在R-CNN论文附录C中有详细的介绍,在后续的论文Fast-RCNN.Faster-RCNN.Mas ...

  6. Bounding box regression RCNN系列网络中矩形框的计算

    0. bounding-box regression bouding-box regression 在R-CNN论文附录C中有详细的介绍,在后续的论文Fast-RCNN.Faster-RCNN.Mas ...

  7. MNS、IOU、bounding box regression详解

    IOU 非极大值抑制(MNS) 边框回归(bounding box regression)

  8. 边框回归(Bounding Box Regression)算法解释

    文章目录 一.为什么需要边框回归 二.边框回归的调整策略 三.论文里怎么说 3.1 平移量与缩放量定义 3.2 损失函数 3.3 为什么是线性回归 四.论文中为什么这样定义平移量和缩放量 4.1 平移 ...

  9. 【目标检测】Bounding Box Regression

    Bounding Box是目标检测中一个重要概念.常见格式是边界框左上角坐标.右下角坐标,即[xmin,ymin,xmax,ymax]:或者边界框中心坐标,宽高,即[x_center,y_center ...

  10. 目标检测中的Bounding Box Regression Loss

    目标检测中的Bounding Box Regression Loss PyTorch: https://github.com/shanglianlm0525/CvPytorch 目标检测中的Bound ...

最新文章

  1. php5.5 mysql网站空间_PHP环境配置IIS5.0+PHP5.23+MYSQL5+phpMyAdmin
  2. Android代码入侵原理解析(一)
  3. 拆分SharePoint 2013 中CreatedModifiedInfo 的时间
  4. ByteBuffer分散和聚集的应用场景
  5. android 禁用和开启四大组件的方法(setComponentEnabledSetting )
  6. JS前端怎样通过程序来获取当前浏览器是什么版本的浏览器(或者判断当前浏览器是否为IE8及以下浏览器)
  7. linux fcitx-rime导入搜狗词库
  8. 邮件服务器潜在漏洞的保护方法
  9. PMP学习系列1:PMP考试介绍
  10. 虚拟机(VMWARE)安装的系统如何访问本地磁盘
  11. 国自然的技术路线图?用PPT试试
  12. C++ MFC控件重影-编辑框重影
  13. phpcms v9给栏目添加自定义英文栏目名称字段图文教程
  14. 关于小米手机用微信会重启的问题
  15. sap scc4 客户端设置(设置生产机不可更改代码)
  16. Excel实现行列转换的三种方式
  17. Axure RP 9.0 Enterprise 原型设计
  18. 关于Autosar中的NM模块的理解
  19. MySQL中建表时的int(m)中的m代表什么意思?
  20. Mac系统恢复以及Mac键盘快捷键 官方方法

热门文章

  1. 机器学习系列 五 Classification 分类
  2. Vue3系列(三)之CDN引入依赖包优化打包速率
  3. 全媒体运营师胡耀文:社群出货5000加?3个实战经验起盘社群团购
  4. PhotoShop-001-使用图像布尔运算画出太极图
  5. ACL‘22杰出论文:Prompt范式有bug!
  6. Linux常用命令笔记与Windows部分命令
  7. 【京东流量渠道整理】京东商智渠道来源所有指标最详细解析
  8. 9家在iOS平台上收入最高的中国公司
  9. 构造形式化证明,解决智能合约安全问题——你的合约亟待证明
  10. 局域网计算机可以ping通不能访问共享,局域网可以ping通为什么打不开共享文件夹...