多尺度R-CNN(2): Inside-Outside Net: Detecting Objects in Context with Skip Pooling and Recurrent Neural
CNN高层特征具有丰富的语义信息,低层特征具有较高空间分辨率,研究如何融合不同层之间的特征,是物体检测领域热门的方向。近期很多工作通过融合多层来提升检测和分割的性能,按照融合与预测的先后顺序,分类为早融合(Early fusion)和晚融合(Late fusion)。
早融合: 先融合多层的特征,然后在融合后的特征上训练预测器。这类方法也被称为skip connection。
这里面的代表是ION和HyperNet。本文主要介绍 Inside-Outside Net(ION)的思想细节。
转载请注明文章出处: 多尺度R-CNN论文笔记(2): Inside-Outside Net: Detecting Objects in Context with Skip Pooling and Recurrent Neural Networks http://blog.csdn.net/solomon1558/article/details/72824370
1. Abstract
上下文信息和多尺度表征(Contextual and multi-scale representations)对于提高视觉识别任务非常关键。Inside-Outside Net(ION)利用RoI内部(Inside)和外部(Outside)的信息改进检测性能。使用空间递归数据网络(spatial recurrent neural networks)集成RoI外部的contextual信息;使用skip-connection提取多尺度特征。
ION将PASCAL VOC 2012 object detection的mAP从 73.9% 提升到 76.4% mAP。在MS COCO dataset上,ION将mAP从 19.7% 提升到33.1%。这篇文章是Cornell大学PhD Sean Bell 2015年的工作,论文发表在CVPR2016上。该算法获得了 MS COCO 2015 Detection 的 Best Student Entry 和 3rd place in total,同年比赛第一由何恺明的ResNet赢得。
2. Methods
ION是在Fast R-CNN检测模型的基础上改进的,主要有两个创新点:(1) Inside:通过skip pooling提取RoI在不同尺度不同抽象层次的特征;(2) Outside : 通过spatial recurrent neural network(IRNN)提取RoI外部的contextual信息。
这个工作认为,理解一幅图片,RoI inside 的 image/object information 和 outside 的 global contextual information 同样重要,都不可以丢失。所以作者提出了同时利用这两方面的信息——构造了 Inside-Outside Net(ION)。
如图-1所示,ION特征/Context融合的阶段是在proposal提取过程之后的Fast R-CNN阶段。
图-1 Inside-Outside Net(ION)
其中,inside 部分它们的思想依然是 multi-scale representation,用 conv3, conv4, conv5 等层级 stacked 抽取 features,因为这样对于 small objects 就不会丢失 lower-level layer 的 high resolution information。另一方面,它们在 outside 部分的工作则更 special 一点。它们使用的是 multi-dimensional IRNN,其中 multi-dimensional 的意思是,我们常见的 RNN 最多就是 bi-directional,双向的;但是在一幅平面图里,我们有横纵两个大方向,则一共有4个小方向;而 IRNN 则是用 identity matrix 进行初始化的基于 ReLU activation 的 RNN 的别称。
图-2 Four-directional IRNN architecture
(skip pooling:对proposals在多层特征上做ROI pooling,L2归一化后拼接起来,然后再利用 1x1Conv layer将feature maps resize到512x7x7的大小。
context features with IRNNs:对于一个feature maps,有四个独立的RNN对其进行上下左右四个方向的移动。
总结:
(1) paper 使用了multi-scale 进行object detection,在浅层Conv层对其feature maps进行roi-pooling, 增强了对small object的detect能力。
(2)使用了RNN对RoI周围的context的信息建模,增强feature信息,促进后续的分类和回归性能。
Reference
程序媛的日常. girlswhocode. 干货 | MSCOCO 2015 Detection 前三名
多尺度R-CNN(2): Inside-Outside Net: Detecting Objects in Context with Skip Pooling and Recurrent Neural相关推荐
- Faster R CNN
Faster R CNN 3 FASTER R-CNN 我们的Faster R CNN 由两个模块组成,第一个模块是 proposes regions 的全卷积网络,第二个是使用 proposed r ...
- Recurrent Neural Network(3):LSTM Basics and 《Inside Out》
下图是Naive RNN的Recurrent Unit示意图,可以看到,在每个时间点t,Recurrent Unit会输出一个隐藏状态ht,对ht加工提取后将产生t时刻的输出yt.而在下一个时间节点t ...
- R语言报错记录The following objects are masked from ‘package:stats’:decompose, spectrum
报错记录
- Faster R-CNN改进篇(一): ION ● HyperNet ● MS CNN
版权声明:本文为博主原创文章,未经博主允许不得转载. https://blog.csdn.net/linolzhang/article/details/74159463 一. 源起于Faster 深度 ...
- 1612第三周学习笔记
基于视觉的目标检测与跟踪综述 1 目标检测 1.1 背景建模 Sobral等基于Opencv搭建的背景减除方法通用框架(Background Substraction Library, BGSLibr ...
- 【文献阅读10】Scale-Aware Trident Networks for Object Detection-用于目标检测的尺度感知三叉戟网络
[文献阅读10]Scale-Aware Trident Networks for Object Detection-用于目标检测的尺度感知三叉戟网络 Abstract 1. Introduction ...
- CVPR 2016 摘要阅读
为了说明看过CVPR2016全部文章的摘要,总结一下,摘要只保留了创新点部分. ORAL SESSION Image Captioning and Question Answering Monday, ...
- 2021年小目标检测最新研究综述 很全面值得收藏
摘要 小目标检测长期以来是计算机视觉中的一个难点和研究热点.在深度学习的驱动下,小目标检测已取得了重大突破,并成功应用于国防安全.智能交通和工业自动化等领域.为了进一步促进小目标检测的发展,本文对小目 ...
- CVPR 2016 全部文章摘要阅读
为了说明看过CVPR2016全部文章的摘要,总结一下,摘要只保留了创新点部分. ORAL SESSION Image Captioning and Question Answering Monday, ...
最新文章
- 字节月薪6万招 kubernetes 开发,看到要求我傻眼了……
- java Socket通信(一)
- es6 Object.is()方法
- 高效向前“零延迟” 数据中心IT自动化势在必行
- Codeforces Round #417 (Div. 2) B. Sagheer, the Hausmeister
- BZOJ3517 翻硬币
- android 技能 英文,讯飞输入法Android7.0.4050搭载音标输入神技能
- 源码:Qt开发的离线软件注册机 适用于工业设备。
- 计算机中的根源证书是什么,安全证书过期怎么办
- 微软自带dns服务器,win10微软设置哪个DNS服务器地址最快
- 电脑格式化恢复|电脑格式化数据如何恢复?
- C语言加油站程序,计算机学院“0101”计划名师导航篇“C语言加油站”第一讲如期开讲...
- 6-3 读文章(*)
- 商业智能BI全解析,探寻BI本质与发展趋势
- oracle parallel_max_servers,PARALLEL_MAX_SERVERS参数
- Virtual host / experienced an error on node rabbit@XX and may be inaccessible
- 《南瓜书pumpkin-book》项目链接
- 计算机维修工试题及答案,计算机维修工初级工试题和参考答案
- Linux建立软链接、硬链接
- 安全管家安卓_手机丢失后可能背负巨额债务,腾讯手机管家提醒注意手机安全防护 -...