GitHub: neural-motifs


1. 得到fmap

feature_map
Image
fmap

图片x经过feature_map()操作得到大小为[batch_size, rpn_input_dim=512, IM_SIZE/4, IM_SIZE/4]的公共特征映射fmap (RPN与RoIAlign操作共享)。


2. 得到rois

rpn_head
roi_proposal
fmap
rpn_feats
rois
  1. fmap经过rpn_head()操作得到大小为[batch_size, IM_SIZE/16, IM_SIZE/16, 9, 6]的rpn_feats。其中 9=3*3为anchor的个数,6=分数2个+位置4个,具体请参照RPN解析。
  2. rpn_feats经过rpn_head.roi_proposals()得到大小为[num_rois, 5] of [img_num, x0, y0, x1, y1]的rois
    1. rpn_feats前2/6 => class_fmap,经过softmax得到class_preds
    2. rpn_feats后4/6 => box_fmap,经过bbox_preds得到box_preds
    3. box_preds经过后处理(如nms)得到rois,该过程需要class_preds

3. 得到od_obj_dists 及其他

obj_feature_map
score_fc
fmap
rois
obj_fmap
od_obj_dists
  1. 使用 第1步得到的fmap 及 第2步用fmap得到的rois 经过obj_feature_map()操作得到output_dim=4096维的obj_fmap

    1. RoIAlign:pooling_size=7, pooling_size=7, spatial_scale=1/16
    2. roi_fmap:vgg_model.classifier
  2. obj_fmap经过score_fc()线性变化至num_classes维的物体类别分布od_obj_dists

Neural-Motifs 源码解读(1):ObjectDetector类相关推荐

  1. 源码解读之zrender-ZRender 类(3)

    00 小结 当我们在 zrender.init(document.getElementById("canvas"))时,首先实例化了一个 ZRender 实例,在这个实例化过程中, ...

  2. ORB SLAM2源码解读(三):Frame类

    文章目录 前言 构造函数 双目相机 RGBD相机 单目相机 ExtractORB:提取特征点 ComputeBoW:计算词袋数据 SetPose:设置相机外参 isInFrustum:判断一个MapP ...

  3. datax(10): 源码解读Communication(Datax通讯类)

    前面看了datax的通讯机制,继续看源码-具体的通讯类 Communication.根据datax的运行模式的区别, 数据的收集会有些区别,这篇文章都是讲的在standalone模式下. 一.comm ...

  4. Bert系列(三)——源码解读之Pre-train

    https://www.jianshu.com/p/22e462f01d8c pre-train是迁移学习的基础,虽然Google已经发布了各种预训练好的模型,而且因为资源消耗巨大,自己再预训练也不现 ...

  5. PyTorch 源码解读之即时编译篇

    点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达 作者丨OpenMMLab 来源丨https://zhuanlan.zhihu.com/ ...

  6. Alamofire源码解读系列(九)之响应封装(Response)

    本篇主要带来Alamofire中Response的解读 前言 在每篇文章的前言部分,我都会把我认为的本篇最重要的内容提前讲一下.我更想同大家分享这些顶级框架在设计和编码层次究竟有哪些过人的地方?当然, ...

  7. Feflow 源码解读

    Feflow 源码解读 Feflow(Front-end flow)是腾讯IVWEB团队的前端工程化解决方案,致力于改善多类型项目的开发流程中的规范和非业务相关的问题,可以让开发者将绝大部分精力集中在 ...

  8. php service locator,Yii源码解读-服务定位器(ServiceLocator)

    SL的目的也是解耦,并且非常适合基于服务和组件的应用. Service Locator充当了一个运行时的链接器的角色,可以在运行时动态地修改一个类所要选用的服务, 而不必对类作任何的修改. 一个类可以 ...

  9. AFNetworking 3.0 源码解读(一)之 AFNetworkReachabilityManager

    做ios开发,AFNetworking 这个网络框架肯定都非常熟悉,也许我们平时只使用了它的部分功能,而且我们对它的实现原理并不是很清楚,就好像总是有一团迷雾在眼前一样. 接下来我们就非常详细的来读一 ...

  10. 源码解读Mybatis List列表In查询实现的注意事项

    http://www.blogjava.net/xmatthew/archive/2011/08/31/355879.html 在SQL开发过程中,动态构建In集合条件查询是比较常见的用法,在Myba ...

最新文章

  1. 在linux中如何高效的使用帮助
  2. 认识zookeeper
  3. simulink学习仿真(微分模块、传递函数模块使用、波特图频率特性)day3
  4. USACO详细介绍 全球中小学生均可参加
  5. 第三次握手为什么没有序列号_“三次握手,四次挥手”你真的懂吗?
  6. Cookie使用基础
  7. 容器技术Docker K8s 19 容器服务ACK基础与进阶-容器网络管理
  8. python中的stopwords_中文分词停止词stopwords词典,可下载
  9. k60单片机全称 恩智浦_k60 飞思卡尔k60芯片的串口查询接收例子源程序,曾用于 比赛 SCM 单片机开发 240万源代码下载- www.pudn.com...
  10. 显示upnp服务器 sonos,四步解决UPNP功能被阻塞的问题
  11. RuntimeError: cuda runtime error (999)
  12. linux垃圾文件清理,请问 如何linux 垃圾文件清理、
  13. Windows10息屏快的问题解决办法(在更改屏幕和睡眠时间无效的情况下)
  14. Python办公自动化word 中插入图片和表格
  15. Android接入微信分享视频和图片
  16. 用JavaScript获取一年的天数
  17. 概念模型(conceptualDataModel)
  18. 医疗卫生信息化领域的一些术语和标准
  19. 软考成绩什么时候出?
  20. java的OpenGL学习资料

热门文章

  1. 宠物连连看3.1优化版(单机绿色免安装)
  2. SpringCloud微架构-李兴华-专题视频课程
  3. Ubuntu里wine使用fcitx输入法
  4. MAC解决VirtualBox打不开报错问题
  5. 《中国棒球》:国家女子棒球队·一棒成名
  6. cmder 常用配置(包括默认管理员运行和解决中文乱码)
  7. gif文件在linux下怎么打开,gif文件扩展名,gif文件怎么打开?
  8. unix环境高级编程-4.9-chmod,fchmod函数和粘住位
  9. 国内值得关注的官方API集合
  10. 主流邮件服务器pop3和smtp配置