关键:根据提议的ROI在每层特征图上都裁剪相应区域的特征,然后池化为指定大小,然后用max将特征融合。使用融合后的特征做预测

Abstract:

神经网络中信息的流通路径很重要。我们提出PANet,通过增加从最底层到最上层的信息传输路径,加强了特征金字塔。并且提出了不同层的特征图通过自适应池化后融合在一起,然后统一做预测。

1. Introduction

(1)设计网络的一些原则

通过残差和密集连接,缩短信息传播所要的路径;加宽网络,使用并行路径,增加网络传输灵活性和专一性等。

There have been several principles proposed for designing networks in image classification that are also effective for object recognition. For example, shortening information path and easing information propagation by clean residual connection [23, 24] and dense connection [26] are useful. Increasing the flexibility and diversity of information paths by creating parallel paths following the splittransform-merge strategy [61, 6] is also beneficial

(2)我们发现:底层特征信息在目标定位时很有用,但是信息从底层特征图到高层特征图上的传递路径很长,细节信息从底层传到高层困难。只从一张特征图上获得的信息不够全面。

Specifically, features in low levels are helpful for large instance identification. But there is a long path from low-level structure to topmost features, increasing difficulty to access accurate localization information。Further, each proposal is predicted based on feature grids pooled from one feature level, which is assigned heuristically. This process can be updated since information discarded in other levels may be helpful for final prediction.

(3)我们的贡献:bottom-up path augmentation is created;to recover broken information path between each proposal and all feature levels, we develop adaptive feature pooling。Finally, to capture different views of each proposal, we augment mask prediction with tiny fully-connected (fc) layers,

2.相关工作

(1)实例分割主要有两种办法:proposal-based;segmentationbased.

(2)不同的层的特征的混合:

(3)更大的上下文区域(Larger Context Region):Features pooled from a larger region provide surrounding context. Global pooling was used in PSPNet [67] and ParseNet [43] to greatly improve quality of semantic segmentation. Similar trend was observed by Peng et al. [47] where global convolutionals were utilized

3. Framework

网络结构:

3个点:Bottom-up Path Augmentation,Adaptive Feature Pooling,Fully-connected Fusion

3.1. Bottom-up Path Augmentation

高层特征含有语义信息,而低层特征包含细节信息的更具体的描述:高层的神经元是对一大片区域做出响应,相当于对一块区域的语义信息响应;而低层的神经元是对局部细节信息做出响应。随着特征图变高,感受野变大,那么该神经元就负责对更大的区域的特征做出响应。

我们增加了上图中的绿色虚线连接,这样细节信息传递到上层只经过了小于10个conv layers,而作为对比,原来的FPN中,细节信息传递到最上面的层则经历了很多个卷积层。

从底向上的连接(Augmented Bottom-up Structure):如下面两图所示

3.2. Adaptive Feature Pooling

(1)在FPN中,根据proposals的大小,分配该proposals从哪一个特征层中提取特征,这并不是一个最佳选择;而且,各层在目标识别时都有一定的重要性,无论大的proposals还是小的proposals,都需要不同层的特征.因此,我们提出adaptive feature pooling,从所有的层中提取特征并且将他们fusing在一起。

我们将不同层提取的特征通过pooling池化为同一大小,然后用max操作融合在一起。下图表示了各层特征在识别不同大小的目标时都有其作用:

我们在做特征融合时,将各层池化的特征,先经过一个参数层(比如全连接层,或者卷积层,来做特征选择等),然后再将特征融合在一起。比如FPN中有两个卷积层,池化的特征->第一个全连接层->特征融合->第二个全连接层。 Mask RCNN中有两个卷积层,池化的特征->第一个卷积层->特征融合->第二个卷积层。

In following sub-networks, pooled feature grids go through one parameter layer independently, which is followed by the fusion operation, to enable network to adapt features. For example, there are two fc layers in the box branch in FPN. We apply the fusion operation after the first layer. Since four consecutive convolutional layers are used in mask prediction branch in Mask R-CNN, we place fusion operation between the first and second convolutional layers.

3.3. Fully-connected Fusion

全连接层fc和全卷积层FCN的特性是不同的:FCN会给出每个像素的预测结果,参数在不同的空间位置是共享的。而全连接层则是位置敏感的(lcaotion sensitive),不同空间位置上用不同的参数做预测。

基于fc和FCN预测结果的差异,我们将两个不同类型的预测结果融合:

4. Experiments

消融实验:

5.代码:

PANet(2018)相关推荐

  1. 71页《乌镇智库:全球人工智能发展报告(2018)》PDF下载

    来源:专知 [导读]人工智能热潮之下,斯坦福.阿里等纷纷出台人工智能报告.乌镇智库已连续发布三年<全球人工智能发展报告>,以宏观视角纵览全球人工智能发展,从产业.融资.技术.教育和应用等多 ...

  2. 工业互联网平台创新发展白皮书(2018)

    来源:走向智能论坛 摘要:近日,在"2018年产业互联网与数据经济大会--首届工业互联网平台创新发展暨两化融合推进会"上,国家工业信息安全发展研究中心尹丽波主任发布并解读了< ...

  3. 业界 | 清华发布《人工智能芯片技术白皮书(2018)》

    来源:大数据文摘 12月11日,在第三届未来芯片论坛上,清华大学联合北京未来芯片技术高精尖创新中心发布<人工智能芯片技术白皮书(2018)>. 整个<白皮书>总共分为10个章节 ...

  4. 中国机器人产业发展报告(2018)正式发布!

    来源:机器人创新生态 摘要:2018年8月16日,<中国机器人产业发展报告(2018)>于2018世界机器人大会主论坛上正式发布,该报告为工信部2016-2018年专项<建立我国机器 ...

  5. 《中国人工智能开源软件发展白皮书(2018)》(附下载及解读PPT)

    来源:走向智能论坛 摘要:近日,中国人工智能开源软件发展联盟召集中国电子技术标准化研究院等企事业单位,编撰并正式发布<中国人工智能开源软件发展白皮书(2018)>,白皮书研究梳理人工智能开 ...

  6. 我刊成功承办第二届数据科学家大会(2018)

    9月20日至21日,第二届数据科学家大会(2018)在桂林大公馆隆重召开,本次大会由桂林市工业和信息化委员会指导,上海市数据科学重点实验室.桂林理工大学.人民邮电出版社联合主办,信通传媒有限责任公司. ...

  7. 软件工程(2018)第3次团队作业

    软件工程(2018)第3次团队作业 题目要求 参考发到群里的<软件需求规格说明书>范本,撰写本团队的软件需求规格说明书 不要照抄范本的内容,请参考它的形式,紧密结合本团队项目实质展开 使用 ...

  8. 软件工程(2018)结对编程第一次作业

    软件工程(2018)结对编程第一次作业 本次作业要求对结对编程队友进行一次代码审查. 代码审查表如下 功能模块名称 图的邻接矩阵输出 审查人 李宗健 审查日期 2018/4/6 代码名称 图的邻接矩阵 ...

  9. 中国首部《多发性硬化患者生存报告(2018)》发布

    多发性硬化患者确诊周期长.难度大,38%患者被误诊为其他疾病 多发性硬化患者平均至少有一个神经功能残疾,而标准治疗药物使用率仅10% 多发性硬化患者疾病负担大,25%丧失工作能力,13%有自杀倾向 亟 ...

最新文章

  1. 前端入门(加载特效,css)
  2. vm虚拟机中 Kali更新后 不能自动适应窗口
  3. 深入理解DOM事件机制
  4. mysql级联复制转换成一主两从_一主两从转级联复制
  5. 番茄花园win11 32位专业版镜像v2021.08
  6. Docker学习总结(41)——Docker Compose 的两种安装方式总结
  7. PAT1023. 组个最小数
  8. 使用 PowerShell 自动登录 Azure
  9. PythonWEB框架之Tornado
  10. Django新手图文教程
  11. 浏览器端精准打印或套打组件
  12. 〖Python零基础入门篇(62)〗- Python 中的魔法函数
  13. 员工管理系统-SpringBoot+Vue入门小项目实战
  14. 使用freessl免费证书
  15. android平板投屏,安卓手机投屏到平板
  16. openssl rand
  17. 改进YOLOv5系列:首发结合最新CSPNeXt主干结构,高性能,低延时的单阶段目标检测器主干,通过COCO数据集验证高效涨点
  18. 戴尔服务器加装固态硬盘吗,戴尔如何加装固态硬盘_戴尔电脑增加固态硬盘教程...
  19. camera-radar fusinon paper 速递
  20. “大学教育的目的”-- 芝加哥大学Andrew Abbott教授的演讲

热门文章

  1. verilog读取bmp格式图片
  2. y160.第九章 GitOps从入门到精通 -- Tekton Trigger(九)
  3. java路径是什么_什么是java路径?
  4. 红黑树 原理和算法详细介绍(Java)
  5. warmup_csaw_2016
  6. 异常-Exception
  7. CFileDialog控件ID值
  8. strncpy和strcpy和memcpy
  9. 微信小程序云开发之cms开发
  10. must be of typexxx解决方法