Bounding Box Regression
这篇博客主要讲解为什么可以用线性模型去做Bounding Box Regression,在讲解之前先明确几个先决条件:
(1)Bounding Box由包含四个参数的坐标组成,即
其中Gx,Gy表示Bounding Box的中心点横纵坐标,Gw,Gh分别表示Bounding Box的宽与高。
(2)回归过程涉及到三个坐标
I. ground-truth bounding box G.
II. predicted ground-truth box G’.
III. proposal P bounding box.
1. Original Paper
2. Bounding Box Regression
如Sec. 1.中提到的,we only learn from a proposal P if it is nearby at least one ground-truth box. 如果不是正例标注框附近的region proposal,那么这样的边界框映射是没有必要的,而附近这个近的程度作者是用IoU定义的。
下面以一个具体的图体会一下:
绿框代表Ground-truth box,红框代表Region Proposal。Bounding Box Regression的目的是让红框 P 进行一定的变换尽量靠近绿框G,用尽量一词是因为不可能实现完全重合,所以只能得到一个靠近的结果G’,但相比于P肯定是更准确的。设想一下,笨笨的算法看到红框就想往绿框变换,显然将上图中dog1的红框朝着dog2的绿框去变换是没有道理的,所以作者通过IoU限制了这个笨笨的想法。
那么为什么可以用线性回归模型实现这种变换呢?
从上图可以发现最完美的变换应该是右边的t*,这个变换使得G’ 与G重合,即完全正确定位,但显然这是小概率事件,因此我们需要一个优化目标。
定义一个对P的变换为:
我们优化的目标就是希望这个定义的变换与完美变换t* 尽量相近,于是得出优化目标:
其中,式子第二部分表示模型复杂度正则,作者在论文中也对此作了说明。
tx, ty对P是线性变换可以理解,但 tw, th明明是log变换,为什么也可以进行线性变换呢?
有人说,根据从上面分析只要保证Region Proposal和Ground Truth的宽高相差不多就能满足回归条件,对x,y位置倒没有太多限制。但我认为这个说法不对,就像上面说的,你得通过x,y位置确定对应的是同一个object。这也是论文在这设置IoU的原因。
Bounding Box Regression相关推荐
- Bounding box regression详解
Bounding box regression详解 转载 http://blog.csdn.net/u011534057/article/details/51235964 Reference link ...
- 感知算法论文(八):Generalized Intersection over Union:A Metric and A Loss for Bounding Box Regression(2019)
文章目录 摘要 引言 2. 相关工作 3. Generalized Intersection over Union 3.1 GIoU as Loss for Bounding Box Regressi ...
- softer-nms论文学习详解(Bounding Box Regression with Uncertainty for Accurate Object Detection)
<Bounding Box Regression with Uncertainty for Accurate Object Detection> 论文地址: https://arxiv.o ...
- 论文阅读:Softer-NMS: Rethinking Bounding Box Regression for Accurate Object Detection
Softer-NMS 文章 和之前同样出自Megvii的一篇论文IoU-Net一样,这篇论文的出发点也是,two-stage detector进行NMS时用到的score仅仅是classifica ...
- Bounding box regression RCNN我的理解
0. bounding-box regression bouding-box regression 在R-CNN论文附录C中有详细的介绍,在后续的论文Fast-RCNN.Faster-RCNN.Mas ...
- Bounding box regression RCNN系列网络中矩形框的计算
0. bounding-box regression bouding-box regression 在R-CNN论文附录C中有详细的介绍,在后续的论文Fast-RCNN.Faster-RCNN.Mas ...
- MNS、IOU、bounding box regression详解
IOU 非极大值抑制(MNS) 边框回归(bounding box regression)
- 边框回归(Bounding Box Regression)算法解释
文章目录 一.为什么需要边框回归 二.边框回归的调整策略 三.论文里怎么说 3.1 平移量与缩放量定义 3.2 损失函数 3.3 为什么是线性回归 四.论文中为什么这样定义平移量和缩放量 4.1 平移 ...
- 【目标检测】Bounding Box Regression
Bounding Box是目标检测中一个重要概念.常见格式是边界框左上角坐标.右下角坐标,即[xmin,ymin,xmax,ymax]:或者边界框中心坐标,宽高,即[x_center,y_center ...
- 目标检测中的Bounding Box Regression Loss
目标检测中的Bounding Box Regression Loss PyTorch: https://github.com/shanglianlm0525/CvPytorch 目标检测中的Bound ...
最新文章
- php5.5 mysql网站空间_PHP环境配置IIS5.0+PHP5.23+MYSQL5+phpMyAdmin
- Android代码入侵原理解析(一)
- 拆分SharePoint 2013 中CreatedModifiedInfo 的时间
- ByteBuffer分散和聚集的应用场景
- android 禁用和开启四大组件的方法(setComponentEnabledSetting )
- JS前端怎样通过程序来获取当前浏览器是什么版本的浏览器(或者判断当前浏览器是否为IE8及以下浏览器)
- linux fcitx-rime导入搜狗词库
- 邮件服务器潜在漏洞的保护方法
- PMP学习系列1:PMP考试介绍
- 虚拟机(VMWARE)安装的系统如何访问本地磁盘
- 国自然的技术路线图?用PPT试试
- C++ MFC控件重影-编辑框重影
- phpcms v9给栏目添加自定义英文栏目名称字段图文教程
- 关于小米手机用微信会重启的问题
- sap scc4 客户端设置(设置生产机不可更改代码)
- Excel实现行列转换的三种方式
- Axure RP 9.0 Enterprise 原型设计
- 关于Autosar中的NM模块的理解
- MySQL中建表时的int(m)中的m代表什么意思?
- Mac系统恢复以及Mac键盘快捷键 官方方法
热门文章
- 机器学习系列 五 Classification 分类
- Vue3系列(三)之CDN引入依赖包优化打包速率
- 全媒体运营师胡耀文:社群出货5000加?3个实战经验起盘社群团购
- PhotoShop-001-使用图像布尔运算画出太极图
- ACL‘22杰出论文:Prompt范式有bug!
- Linux常用命令笔记与Windows部分命令
- 【京东流量渠道整理】京东商智渠道来源所有指标最详细解析
- 9家在iOS平台上收入最高的中国公司
- 构造形式化证明,解决智能合约安全问题——你的合约亟待证明
- 局域网计算机可以ping通不能访问共享,局域网可以ping通为什么打不开共享文件夹...