faster rcnn结构
rpn-data层输入的是data即整张图片,然后是根据映射生成roi框
rpn-loss-bbox输入的才是整个网络预测的roi框
bbox_transform在rpn-data层使用,把生成的achor,并不是把预测的roi框回归
rpn_loss_bbox,论文中定义输入是ti和ti*,ti和ti*是4维向量,但ti和ti*并不是预测框坐标和gt框坐标(即左上右下)。ti应该是论文中的tx、ty、tw、th组成的向量,即(x-xa)/wa、(y-ya)/ha、 log(w/wa)、 log(h/ha),也即是预测框和anchor的四个偏移值——中心点x偏移了多少、中心点y偏移了多少、宽度(比例)差了多少、高度(比例)差了多少。ti*是论文中的tx*、ty*、tw*、th*组成的向量,即(x*-xa)/wa、(y*-ya)/ha、 log(w*/wa)、log(h*/ha),也即是gt框和anchor四个偏移值——中心点x偏移了多少、中心点y偏移了多少、宽度(比例)差了多少、高度(比例)差了多少。所以说,直接训练的并不是坐标值,而是偏移值。
stage1和stage2的第二部分都是由rpn生成roi,在这一阶段会增加一个proposal_layer层,这一层是把这些偏移值转换为roi框的坐标。
faster rcnn结构相关推荐
- 目标检测系列(五)——Faster R-CNN译文
文章目录 摘要 引言 2. 相关工作 3. Faster R-CNN 3.1 区域提议网络 3.1.1 anchor 3.1.2 损失函数 3.1.3 训练RPNs 3.2 RPN和Fast R-CN ...
- faster rcnn中rpn的anchor,sliding windows,proposals的理解
一直对faster rcnn里的rpn以及下图中的上面的那部分的区别不太理解,今天看到了知乎里面的回答,感觉有点明白了,特此记录 作者:马塔 链接:https://www.zhihu.com/ques ...
- 目标检测——Faster R-CNN论文阅读
论文阅读--Faster R-CNN:Towards Real-Time Object Detection with Region Proposal Networks 文章目录 论文阅读--Faste ...
- 目标检测算法Faster R-CNN简介
在博文https://blog.csdn.net/fengbingchun/article/details/87091740 中对Fast R-CNN进行了简单介绍,这里在Fast R-CNN的基础上 ...
- 里程碑式成果Faster RCNN复现难?我们试了一下 | 附完整代码
作者 | 已退逼乎 来源 | 知乎 [导读]2019年以来,除各AI 大厂私有网络范围外,MaskRCNN,CascadeRCNN 成为了支撑很多业务得以开展的基础,而以 Faster RCNN 为基 ...
- 完整代码+实操!手把手教你操作Faster R-CNN和Mask R-CNN
点击上方↑↑↑蓝字关注我们~ 「2019 Python开发者日」全日程揭晓,请扫码咨询 ↑↑↑ 机器视觉领域的核心问题之一就是目标检测(Object Detection),它的任务是找出图像当中所有感 ...
- 你真的理解Faster RCNN吗?捋一捋Pytorch官方Faster RCNN代码
作者丨白裳@知乎 来源丨https://zhuanlan.zhihu.com/p/145842317 编辑丨极市平台 目前 pytorch 已经在 torchvision 模块集成了 FasterRC ...
- ResNet、Faster RCNN、Mask RCNN是专利算法吗?盘点何恺明参与发明的专利
点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 前段时间OpenCV正式将SIFT算法的实现从Non-free模块移到主库,因SIFT专利到期了(专利 ...
- 一文读懂Faster RCNN
来源:信息网络工程研究中心本文约7500字,建议阅读10+分钟 本文从四个切入点为你介绍Faster R-CNN网络. 经过R-CNN和Fast RCNN的积淀,Ross B. Girshick在20 ...
最新文章
- python与人工智能编程-五大人工智能流行编程语言对比,只要学会一种绝对不亏!...
- Java黑皮书课后题第5章:*5.15(显示ASCII码字符表)编写一个程序,打印ASCII字符表从‘!‘到‘~‘的字符。每行打印10个字符。ASCII码表如附录B所示。数字之间用一个空格字符隔开
- Vue项目中Table设置 render 函数
- input子系统基础之按键3——input子系统架构总览
- 黑马day16 jqueryamp;属性过滤选择器
- 正在爆发的互联网革命
- 软件测试——测试用例设计测试分类详解
- AutoCAD实用功能之查看xdata扩展属性
- numpy返回上下三角矩阵
- 学习Struts2框架笔记-第2天
- IO多路复用select,poll epoll以及区别
- linux5关闭apic服务,阐述Linux内核里面的APIC编程
- 马斯洛的需要层次理论
- MySQL(管理)01 -- 用户User和权限Privileges<B.用户管理权限设置>
- 用python做一个自动签到程序
- 吉利金刚汽车音响升级牧童Vaquero
- ethtool如何让接口闪灯_ethtool工具使用
- 5G一周热闻:华为夺联通5G大单,首张5G电话卡发放
- Infernet服务器为空怎么办,电脑internet页面空白怎么办?
- TrustNote web-wallet钱包使用教程
热门文章
- Solaris 10 x86 上折腾Mono
- 一个.java源文件中是否可以包括多个类
- findHomography(src_points, dst_points, CV_RANSAC)
- Android wechat 分享
- Linq to XML 基本类
- 登陆窗体显示动态效果
- Javascript简明教程四 作用域
- Jsoup:用Java也可以爬虫,怎么使用Java进行爬虫,用Java爬取网页数据,使用Jsoup爬取数据,爬虫举例:京东搜索
- python防反编译_Python - 浅谈Python的编译与反编译
- 申请鸿蒙选择应用程序是什么,申请鸿蒙系统有一个应用选择怎么选择呢