CNN高层特征具有丰富的语义信息,低层特征具有较高空间分辨率,研究如何融合不同层之间的特征,是物体检测领域热门的方向。近期很多工作通过融合多层来提升检测和分割的性能,按照融合与预测的先后顺序,分类为早融合(Early fusion)和晚融合(Late fusion)。
    早融合: 先融合多层的特征,然后在融合后的特征上训练预测器。这类方法也被称为skip connection。
这里面的代表是ION和HyperNet。本文主要介绍 Inside-Outside Net(ION)的思想细节。

转载请注明文章出处: 多尺度R-CNN论文笔记(2): Inside-Outside Net: Detecting Objects in Context with Skip Pooling and Recurrent Neural Networks http://blog.csdn.net/solomon1558/article/details/72824370

1. Abstract

上下文信息和多尺度表征(Contextual and multi-scale representations)对于提高视觉识别任务非常关键。Inside-Outside Net(ION)利用RoI内部(Inside)和外部(Outside)的信息改进检测性能。使用空间递归数据网络(spatial recurrent neural networks)集成RoI外部的contextual信息;使用skip-connection提取多尺度特征。
     ION将PASCAL VOC 2012 object detection的mAP从 73.9% 提升到 76.4% mAP。在MS COCO dataset上,ION将mAP从 19.7% 提升到33.1%。这篇文章是Cornell大学PhD Sean Bell 2015年的工作,论文发表在CVPR2016上。该算法获得了 MS COCO 2015 Detection 的 Best Student Entry 和 3rd place in total,同年比赛第一由何恺明的ResNet赢得。

2. Methods

ION是在Fast R-CNN检测模型的基础上改进的,主要有两个创新点:(1) Inside:通过skip pooling提取RoI在不同尺度不同抽象层次的特征;(2) Outside : 通过spatial recurrent neural network(IRNN)提取RoI外部的contextual信息。
    这个工作认为,理解一幅图片,RoI inside 的 image/object information 和 outside 的 global contextual information 同样重要,都不可以丢失。所以作者提出了同时利用这两方面的信息——构造了 Inside-Outside Net(ION)。
    如图-1所示,ION特征/Context融合的阶段是在proposal提取过程之后Fast R-CNN阶段

图-1 Inside-Outside Net(ION)
    其中,inside 部分它们的思想依然是 multi-scale representation,用 conv3, conv4, conv5 等层级 stacked 抽取 features,因为这样对于 small objects 就不会丢失 lower-level layer 的 high resolution information。另一方面,它们在 outside 部分的工作则更 special 一点。它们使用的是 multi-dimensional IRNN,其中 multi-dimensional 的意思是,我们常见的 RNN 最多就是 bi-directional,双向的;但是在一幅平面图里,我们有横纵两个大方向,则一共有4个小方向;而 IRNN 则是用 identity matrix 进行初始化的基于 ReLU activation 的 RNN 的别称。
图-2 Four-directional IRNN architecture
(skip pooling:对proposals在多层特征上做ROI pooling,L2归一化后拼接起来,然后再利用 1x1Conv layer将feature maps resize到512x7x7的大小。
context features with IRNNs:对于一个feature maps,有四个独立的RNN对其进行上下左右四个方向的移动。

总结:

(1) paper 使用了multi-scale 进行object detection,在浅层Conv层对其feature maps进行roi-pooling, 增强了对small object的detect能力。
    (2)使用了RNN对RoI周围的context的信息建模,增强feature信息,促进后续的分类和回归性能。

Reference

程序媛的日常. girlswhocode. 干货 | MSCOCO 2015 Detection 前三名

多尺度R-CNN(2): Inside-Outside Net: Detecting Objects in Context with Skip Pooling and Recurrent Neural相关推荐

  1. Faster R CNN

    Faster R CNN 3 FASTER R-CNN 我们的Faster R CNN 由两个模块组成,第一个模块是 proposes regions 的全卷积网络,第二个是使用 proposed r ...

  2. Recurrent Neural Network(3):LSTM Basics and 《Inside Out》

    下图是Naive RNN的Recurrent Unit示意图,可以看到,在每个时间点t,Recurrent Unit会输出一个隐藏状态ht,对ht加工提取后将产生t时刻的输出yt.而在下一个时间节点t ...

  3. R语言报错记录The following objects are masked from ‘package:stats’:decompose, spectrum

    报错记录

  4. Faster R-CNN改进篇(一): ION ● HyperNet ● MS CNN

    版权声明:本文为博主原创文章,未经博主允许不得转载. https://blog.csdn.net/linolzhang/article/details/74159463 一. 源起于Faster 深度 ...

  5. 1612第三周学习笔记

    基于视觉的目标检测与跟踪综述 1 目标检测 1.1 背景建模 Sobral等基于Opencv搭建的背景减除方法通用框架(Background Substraction Library, BGSLibr ...

  6. 【文献阅读10】Scale-Aware Trident Networks for Object Detection-用于目标检测的尺度感知三叉戟网络

    [文献阅读10]Scale-Aware Trident Networks for Object Detection-用于目标检测的尺度感知三叉戟网络 Abstract 1. Introduction ...

  7. CVPR 2016 摘要阅读

    为了说明看过CVPR2016全部文章的摘要,总结一下,摘要只保留了创新点部分. ORAL SESSION Image Captioning and Question Answering Monday, ...

  8. 2021年小目标检测最新研究综述 很全面值得收藏

    摘要 小目标检测长期以来是计算机视觉中的一个难点和研究热点.在深度学习的驱动下,小目标检测已取得了重大突破,并成功应用于国防安全.智能交通和工业自动化等领域.为了进一步促进小目标检测的发展,本文对小目 ...

  9. CVPR 2016 全部文章摘要阅读

    为了说明看过CVPR2016全部文章的摘要,总结一下,摘要只保留了创新点部分. ORAL SESSION Image Captioning and Question Answering Monday, ...

最新文章

  1. 字节月薪6万招 kubernetes 开发,看到要求我傻眼了……
  2. java Socket通信(一)
  3. es6 Object.is()方法
  4. 高效向前“零延迟” 数据中心IT自动化势在必行
  5. Codeforces Round #417 (Div. 2) B. Sagheer, the Hausmeister
  6. BZOJ3517 翻硬币
  7. android 技能 英文,讯飞输入法Android7.0.4050搭载音标输入神技能
  8. 源码:Qt开发的离线软件注册机 适用于工业设备。
  9. 计算机中的根源证书是什么,安全证书过期怎么办
  10. 微软自带dns服务器,win10微软设置哪个DNS服务器地址最快
  11. 电脑格式化恢复|电脑格式化数据如何恢复?
  12. C语言加油站程序,计算机学院“0101”计划名师导航篇“C语言加油站”第一讲如期开讲...
  13. 6-3 读文章(*)
  14. 商业智能BI全解析,探寻BI本质与发展趋势
  15. oracle parallel_max_servers,PARALLEL_MAX_SERVERS参数
  16. Virtual host / experienced an error on node rabbit@XX and may be inaccessible
  17. 《南瓜书pumpkin-book》项目链接
  18. 计算机维修工试题及答案,计算机维修工初级工试题和参考答案
  19. Linux建立软链接、硬链接
  20. 安全管家安卓_手机丢失后可能背负巨额债务,腾讯手机管家提醒注意手机安全防护 -...

热门文章

  1. JAVA实验二:设计一个教师类Teacher(属于cn.net.sdkd包)实现接口进行排序等
  2. 创意图形的绘制 会转的风车
  3. DVD刻录缓慢的原因及方法
  4. 布局 flex让元素一个靠左一个靠右
  5. 怎样设计才能让文字排版更好看(一)
  6. 比太阳还要明亮!天文学家发现使上最亮星体
  7. 英特尔 超核芯显卡 620mac_显卡性能翻倍,AI能力加持:英特尔发布10代酷睿处理器...
  8. 微信奇销36计 赖老师
  9. Revit开发之载入族的创建小技巧
  10. 2.3.2 实体完整性约束