Inside-Outside Net
算法背景
图像的上下文信息在人类和计算机视觉中起重要的作用,为了收集上下文信息,论文使用RNN来在水平和垂直方向传递空间变化的上下文信息,并且使用了跨层连接,绕过中间层,将不同层的特征进行组合。

网络结构
在这里插入图片描述
每次传播,VGG16会从图片中提取特征图并且生成2000个Region proposal。对于每个Region proposal,网络使用ROI pooling提取固定尺寸,每个特征经过L2归一化,concatenate, 缩放和降维(1x1卷积)之后产生一个512x7x7的矩阵,经过两个全链接层之后输出一个目标分类预测结果和边界框调整结果。
为了检测目标,一个单独的深层卷积神经网络处理一幅图像并保留每层的卷积特征图,在网络顶部,一个2倍堆叠的4方向的IRNN计算图像的全局和局部的上下文特征,上下文特征图大小与conv5相同,这是一张图的流程,除此之外,我们还有几千个roi Region,对于每个Region,我们从几个层提取固定长度的特征描述符(conv3,conv4,conv5,上下文特征),描述符进行L2归一化、concatenate、重缩放,降维之后生成一个softmax之后的分类预测结果,和一个边界框回归预测结果。

多尺度池化
比较成功的检测网络像Fast RCNN,Faster RCNN等都是从VGG16的最后一个卷积层(conv5_3)进行池化,因为我们想使用训练好的VGG16网络,所以保留现在的层的形状是非常重要的,因此如果我们想对更多层进行池化,最终的特征图需要保持到512x7x7的形状,以便于输入fc6时的形状是正确的。为了匹配512x7x7的形状,我们concatenate没一个池化之后的特征图,并使用1x1卷积减少维度。

使用IRNN结合上下文特征
在这里插入图片描述
上图展示了ION中计算上下文特性的结构,在最后一层卷积层(conv5)的顶部,我们使用rnn在图像上横向移动。传统来说,RNN沿着序列从左到右移动,移动一步消耗一个输入,更新隐藏层的状态,并产生一个输出,我们沿着图像的每一行每一列放置RNN,将其扩展到二维,所以总共有4个RNN:上,下,左,右。RNN在conv5上方,并产生于Conv5相同的形状的输出。
本文使用的是ReLU组成的RNN,Le等人称为IRNN。

【每日一网】Day16:Inside-Outside Net(ION)讲解相关推荐

  1. XMind与MindManager哪个好(网易云课堂老师:Array老师讲解稿)

    XMind与MindManager哪个好 作者:网易云课堂老师:Array老师讲解稿 思维导图是一种将放射性思考具体化的方法,可以将人们的创造性思维及时捕捉并呈现,深受商业人士的喜爱.目前,XMind ...

  2. QT每日一练day16:QMessageBox消息对话框

    一.运行结果(GIF动图): 二.附代码 day16.pro QT += core guigreaterThan(QT_MAJOR_VERSION, 4): QT += widgetsCONFIG + ...

  3. 【每日一网】Day20:A MultiPath Network for Object Detection(MPN)简单理解

    A MultiPath Network for Object Detection 算法背景 作者改进了目标检测的方法,相比ss算法的fast RCNN,将实验效果进一步提升了66%,在小物体上提高了4 ...

  4. 【每日一网】Day30:DSSD(Deconvolutional Single Shot Detector)简单理解

    DSSD:Deconvolutional Single Shot Detector 算法背景 本文的主要贡献在于将上下文索引和残差网络加到了SSD算法中,然后在反卷积层上增加SSD和residual- ...

  5. 最大扇入数怎么判断_淘宝店铺装修,淘宝网店怎么样装修简单?讲解快速装修漂亮店铺的步骤...

    大家好,我是感恩.淘宝店铺装修,淘宝新店为何每日访客才三到五个人,有听众私信给我啊,说刚刚开的淘宝店啊没有访客是什么情况啊?今天我就来跟大家说一说,新店遇到这种问题,我们应该怎么去分析解决问题.店铺没 ...

  6. 百度网盘扩容两种技术讲解!真的有永久扩容吗?【粉丝福利】

    今天给大家讲讲扩容,我要把百度网盘扩容讲干讲明白,讲的所有人都能看懂. 今天主要是1T以下只有105G的百度网盘扩容介绍和永久扩容的意思. 百度网盘扩容有两种扩容技术. 大于等于1T的网盘扩容技术 这 ...

  7. 网红是完全从草根中产 的一群明星

    互联网大会进入第三天,上午,阿里CEO张勇在大会的分论坛上为今年淘宝出现的"网红经济"代言,盛赞网红经济为"新的经济现象"."全球范围内独一无二&qu ...

  8. 柚!音乐小程序 ---借鉴网易云APP设计(运用网易云真实Api)

    参考小破站小程序教程 通过点击每日推荐可以进行音乐播放,上一首下一首切换(前提要进行登录)(最近可能登陆会有一些问题,运气好就登录进去了,服务器的问题), 主要实现功能(点击每日推荐,会展示30首每日 ...

  9. android incide_《inside》安卓怎么下载 inside安卓版本什么时候出

    导 读 inside怎么才能下载到最新的安卓版本呢?安卓版本什么时候出呢?想要比别人前线体验到游戏的操作快感,那么提前下载到游戏是关键,不过有玩家说在下载的时候找不到最新版本,也不知道下载地址,其实很 ...

最新文章

  1. JQuery中的事件和选择器
  2. Centos Openldap服务器数据库主备(二)
  3. ​​​​​​​DL之ResNeXt:ResNeXt算法的架构详解
  4. onsrcoll和scrollTop兼容与实现
  5. boost::fusion::make_unfused用法的测试程序
  6. AjaxPro新发现-错误处理
  7. java调用Linux mahout,Mahout算法调用展示平台2.1
  8. 如果你是壁纸控,高清图片这里找!
  9. java 批量替换字符串_# Java 一步一步实现高逼格的字符串替换工具(二)
  10. android imageview 等比例放大缩小,imageView的使用(进行原样的保持和按照比例的缩放:)...
  11. ios隐藏导航栏底线条和导航、状态栏浙变色
  12. creator找不到编译器 qt_Qt与Web混合开发(一)--简单使用
  13. /etc/resolv.conf
  14. Atitit prj tek dfkt 项目常见技术难点目录第一章 开发效率 2第一节 更加简单的语言 2第二节 简单
  15. 用74l138实现一个一位全减器_用react实现一个仿ionic button组件
  16. OPPO R9S线刷
  17. 26岁考计算机研究生,26岁考研究生好还是考公务员好?总结得太精辟了
  18. 【WiFi 6E】WiFi 6E信道分布
  19. 网站点击弹窗微信二维码功能纯CSS
  20. 【备战春招/秋招系列】程序员的简历就该这样写

热门文章

  1. GitHub上如何删除fork别人的repository
  2. Python变量、脚本名称、函数命名规范
  3. 计算机学院迎新活动总结,大学迎新活动总结
  4. python接收易语言dll消息_易语言[项目开发]-插件信息提取程序源码,易语言获取DLL文件信息...
  5. Sublime text 2按Ctrl+`无法调出console的可能问题
  6. vc6下usb编程_5款免费的C/C++语言编程器
  7. 升级浏览器_升级Unity 8,优化系统组件,添加键盘手势,升级浏览器,UbuntuTouch最大的一次更新
  8. iphone字体_朋友圈换个花样字体,发个朋友圈也高级过人
  9. python构建指数平滑预测模型_python/scikit/numpy中r指数平滑状态空间模型的替代方案...
  10. 基于redis购物车java代码_基于redis实现购物车基本功能