rpn-data层输入的是data即整张图片,然后是根据映射生成roi框

rpn-loss-bbox输入的才是整个网络预测的roi框

bbox_transform在rpn-data层使用,把生成的achor,并不是把预测的roi框回归

rpn_loss_bbox,论文中定义输入是ti和ti*,ti和ti*是4维向量,但ti和ti*并不是预测框坐标和gt框坐标(即左上右下)。ti应该是论文中的tx、ty、tw、th组成的向量,即(x-xa)/wa、(y-ya)/ha、 log(w/wa)、 log(h/ha),也即是预测框和anchor的四个偏移值——中心点x偏移了多少、中心点y偏移了多少、宽度(比例)差了多少、高度(比例)差了多少。ti*是论文中的tx*、ty*、tw*、th*组成的向量,即(x*-xa)/wa、(y*-ya)/ha、 log(w*/wa)、log(h*/ha),也即是gt框和anchor四个偏移值——中心点x偏移了多少、中心点y偏移了多少、宽度(比例)差了多少、高度(比例)差了多少。所以说,直接训练的并不是坐标值,而是偏移值。

stage1和stage2的第二部分都是由rpn生成roi,在这一阶段会增加一个proposal_layer层,这一层是把这些偏移值转换为roi框的坐标。

faster rcnn结构相关推荐

  1. 目标检测系列(五)——Faster R-CNN译文

    文章目录 摘要 引言 2. 相关工作 3. Faster R-CNN 3.1 区域提议网络 3.1.1 anchor 3.1.2 损失函数 3.1.3 训练RPNs 3.2 RPN和Fast R-CN ...

  2. faster rcnn中rpn的anchor,sliding windows,proposals的理解

    一直对faster rcnn里的rpn以及下图中的上面的那部分的区别不太理解,今天看到了知乎里面的回答,感觉有点明白了,特此记录 作者:马塔 链接:https://www.zhihu.com/ques ...

  3. 目标检测——Faster R-CNN论文阅读

    论文阅读--Faster R-CNN:Towards Real-Time Object Detection with Region Proposal Networks 文章目录 论文阅读--Faste ...

  4. 目标检测算法Faster R-CNN简介

    在博文https://blog.csdn.net/fengbingchun/article/details/87091740 中对Fast R-CNN进行了简单介绍,这里在Fast R-CNN的基础上 ...

  5. 里程碑式成果Faster RCNN复现难?我们试了一下 | 附完整代码

    作者 | 已退逼乎 来源 | 知乎 [导读]2019年以来,除各AI 大厂私有网络范围外,MaskRCNN,CascadeRCNN 成为了支撑很多业务得以开展的基础,而以 Faster RCNN 为基 ...

  6. 完整代码+实操!手把手教你操作Faster R-CNN和Mask R-CNN

    点击上方↑↑↑蓝字关注我们~ 「2019 Python开发者日」全日程揭晓,请扫码咨询 ↑↑↑ 机器视觉领域的核心问题之一就是目标检测(Object Detection),它的任务是找出图像当中所有感 ...

  7. 你真的理解Faster RCNN吗?捋一捋Pytorch官方Faster RCNN代码

    作者丨白裳@知乎 来源丨https://zhuanlan.zhihu.com/p/145842317 编辑丨极市平台 目前 pytorch 已经在 torchvision 模块集成了 FasterRC ...

  8. ResNet、Faster RCNN、Mask RCNN是专利算法吗?盘点何恺明参与发明的专利

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 前段时间OpenCV正式将SIFT算法的实现从Non-free模块移到主库,因SIFT专利到期了(专利 ...

  9. 一文读懂Faster RCNN

    来源:信息网络工程研究中心本文约7500字,建议阅读10+分钟 本文从四个切入点为你介绍Faster R-CNN网络. 经过R-CNN和Fast RCNN的积淀,Ross B. Girshick在20 ...

最新文章

  1. python与人工智能编程-五大人工智能流行编程语言对比,只要学会一种绝对不亏!...
  2. Java黑皮书课后题第5章:*5.15(显示ASCII码字符表)编写一个程序,打印ASCII字符表从‘!‘到‘~‘的字符。每行打印10个字符。ASCII码表如附录B所示。数字之间用一个空格字符隔开
  3. Vue项目中Table设置 render 函数
  4. input子系统基础之按键3——input子系统架构总览
  5. 黑马day16 jqueryamp;属性过滤选择器
  6. 正在爆发的互联网革命
  7. 软件测试——测试用例设计测试分类详解
  8. AutoCAD实用功能之查看xdata扩展属性
  9. numpy返回上下三角矩阵
  10. 学习Struts2框架笔记-第2天
  11. IO多路复用select,poll epoll以及区别
  12. linux5关闭apic服务,阐述Linux内核里面的APIC编程
  13. 马斯洛的需要层次理论
  14. MySQL(管理)01 -- 用户User和权限Privileges<B.用户管理权限设置>
  15. 用python做一个自动签到程序
  16. 吉利金刚汽车音响升级牧童Vaquero
  17. ethtool如何让接口闪灯_ethtool工具使用
  18. 5G一周热闻:华为夺联通5G大单,首张5G电话卡发放
  19. Infernet服务器为空怎么办,电脑internet页面空白怎么办?
  20. TrustNote web-wallet钱包使用教程

热门文章

  1. Solaris 10 x86 上折腾Mono
  2. 一个.java源文件中是否可以包括多个类
  3. findHomography(src_points, dst_points, CV_RANSAC)
  4. Android wechat 分享
  5. Linq to XML 基本类
  6. 登陆窗体显示动态效果
  7. Javascript简明教程四 作用域
  8. Jsoup:用Java也可以爬虫,怎么使用Java进行爬虫,用Java爬取网页数据,使用Jsoup爬取数据,爬虫举例:京东搜索
  9. python防反编译_Python - 浅谈Python的编译与反编译
  10. 申请鸿蒙选择应用程序是什么,申请鸿蒙系统有一个应用选择怎么选择呢