作者丨孙明珊

学校丨哈尔滨工业大学(深圳)硕士生

研究方向丨目标检测

研究动机

当前目标检测网络中采用特征金字塔网络(FPN)结构解决多尺度的问题,但是这些 FPN 都是人工事先设计,并不一定是最优的结构。为了更灵活地获得更优的 FPN 结构,该文章首创性地提出了采用神经架构搜索(NAS)的方式定制化地构建 FPN,该结构又称 NAS-FPN。

设计 FPN 结构的最大困难在于它巨大的设计空间,在不同尺度上融合特征的组合数会随着网络层数的增长而增大。由此该文先设计了一个能覆盖所有跨尺度连接产生多尺度特征的搜索空间,然后采用强化学习训练一个 RNN 控制器来选出最优的 FPN 结构。该方法采用 RetinaNet 的框架,其结构如下图所示:

研究方法

搜索空间 

FPN 的众多跨连接构成了很大的搜索空间。在搜索空间中,一个 FPN 由很多 merging cells 组成,然后合并一些来自不同层融合的特征表示。一个 merging cell 将两个来自不同特征层的特征连接融合产生一个特征输出,这样的单元结构就构成了 FPN 的元结构,同时所有的可能的特征层组合由 merging cells 组建化的表示,这也就构成了我们的搜索空间(模块化)。一个 merging cell 的结构如下:

构建 merging cell 是由控制器 RNN 来做决定,它不仅要决定选取哪两个特征层,还要决定采用那种特征融合方式?

每个 merging cell 有 4 个预测步骤:首先选一个特征层,然后再选一个特征层,随后决定输出特征的维度,最后决定采用何种特征融合方式将两个特征层合并到特定尺度。这里的特征融合方式分为两种 sum 和 global pooling。

NAS-FPN 的优势之一是搜索空间的设计,覆盖所有可能的跨尺度连接,用来生成多尺度特征表示。在搜索过程中,研究者的目标是发现具有相同输入和输出特征级别并且可以被重复应用的微粒架构。模块化搜索空间使得搜索金字塔架构变得易于管理。

模块化金字塔架构的另一个好处是可以随时检测目标,虽然这种方法已出现,但手动设计这种架构依旧相当困难。固定分类和回归的网络进行深度监督训练。搜索的终止并不是非要全部搜索完,随时都可以退出。因为分辨率不变,所以 FPN 可以随意扩展。

模型搜索

NAS 利用强化学习训练控制器在给定的搜索空间中选择最优的模型架构。控制器利用子模型在搜索空间中的准确度作为奖励信号来更新参数。因此,通过反复试验,控制器逐渐学会了如何生成更好的架构。由于不知道 FPN 的跨连接情况,NAS-FPN 采用 RNN 作为控制器,使用该控制器来产生一串信息,用于构建不同的连接。其宏观结构如下图所示:

其搜索得到的最优 FPN 结构如下图,其控制器收敛得到的最终 FPN 结构如 (f) 所示,并且其精度最高。从中可得训练时间越长其轨迹越曲折混乱:其搜索得到的最优 FPN 结构如下图,其控制器收敛得到的最终 FPN 结构如 (f) 所示,并且其精度最高。从中可得训练时间越长其轨迹越曲折混乱:

每个点代表一个特征层。同一行的特征层具有相同的分辨率。分辨率在自底向上下降。箭头表示内部层之间的连接。图中左侧是输入层。金字塔网络的输入用绿色圆圈标记,输出用红色圆圈标记。

最终收敛的 FPN 网络结构如下图:

实验内容及分析

实验中使用了 RetinaNet 的开源实现。模型在 COCO train2017 上训练,大部分实验采用 COCO val2017 进行评估。结果如下:

总体对比结果如下表所示:

总结

本文提出利用神经架构搜索进一步优化用于目标检测的特征金字塔网络的设计过程。在 COCO 数据集上的实验表明,神经结构搜索发现的架构,名为 NAS-FPN,具有良好的灵活性和高性能,可用于构建精确的检测模型。在广泛的精度和速度权衡方面,NAS-FPN 在许多检测任务的主干架构上产生了显著改进。

点击以下标题查看更多往期内容:

  • 最新Anchor-Free目标检测模型—FoveaBox

  • 论文盘点:CVPR 2019 - 文本检测专题

  • 近期值得读的10篇GAN进展论文

  • 天秤座R-CNN:全面平衡的目标检测器

  • 万字综述之生成对抗网络(GAN)

  • CVPR 2019 | 基于高清表示网络的人体姿态估计

  • PoolNet:基于池化技术的显著性目标检测

  • 全新缺失图像数据插补框架—CollaGAN

#投 稿 通 道#

 让你的论文被更多人看到 

如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。


总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。

PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学习心得技术干货。我们的目的只有一个,让知识真正流动起来。

来稿标准:

• 稿件确系个人原创作品,来稿需注明作者个人信息(姓名+学校/工作单位+学历/职位+研究方向)

• 如果文章并非首发,请在投稿时提醒并附上所有已发布链接

• PaperWeekly 默认每篇文章都是首发,均会添加“原创”标志


? 投稿邮箱:

• 投稿邮箱:hr@paperweekly.site

• 所有文章配图,请单独在附件中发送

• 请留下即时联系方式(微信或手机),以便我们在编辑发布时和作者沟通

?

现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

关于PaperWeekly

PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。

▽ 点击 | 阅读原文 | 下载论文 & 源码

CVPR 2019 | NAS-FPN:基于自动架构搜索的特征金字塔网络相关推荐

  1. 【CV】FPN:用于目标检测的特征金字塔网络

    论文名称:Feature Pyramid Networks for Object Detection 论文下载:https://arxiv.org/abs/1612.03144 论文年份:2016 论 ...

  2. CVPR 2019 开源论文 | 基于空间自适应归一化的图像语义合成

    作者丨武广 学校丨合肥工业大学硕士生 研究方向丨图像生成 深度学习在算力的推动下不断的发展,随着卷积层的堆叠,模型的层数是越来越深,理论上神经网络中的参数越多这样对数据的拟合和分布描述就能越细致.然而 ...

  3. 深度学习阅读导航 | 04 FPN:基于特征金字塔网络的目标检测

    写在前面:大家好!我是[AI 菌],一枚爱弹吉他的程序员.我热爱AI.热爱分享.热爱开源! 这博客是我对学习的一点总结与记录.如果您也对 深度学习.机器视觉.算法.Python.C++ 感兴趣,可以关 ...

  4. 【人工智能】基于蒙特卡洛树搜索和策略价值网络的AI五子棋算法设计

    基于蒙特卡洛树搜索和策略价值网络的AI五子棋算法设计 摘要 蒙特卡洛树搜索算法 五子棋博弈的状态价值函数 附1:详细论文说明下载: 附2:实现代码下载(2022.10更新后代码): 摘要 随着人工智能 ...

  5. 计算机视觉FPN: 特征金字塔网络

    向AI转型的程序员都关注了这个号???????????? 机器学习AI算法工程   公众号:datayx FPN:feature pyramid networks for object detecti ...

  6. 性能超FPN!北大、阿里等提多层特征金字塔网络

    作者 | Qijie Zhao等 编译 | 李杰 出品 | AI科技大本营(ID:rgznai100) 特征金字塔网络具有处理不同物体尺度变化的能力,因此被广泛应用到one-stage目标检测网络(如 ...

  7. FPN 特征金字塔网络

    FPN(feature pyramid networks) 特征金字塔是多尺度目标检测系统中的一个基本组成部分.近年来深度学习目标检测却有意回避这一技巧,部分原因是特征金字塔在计算量和用时上很敏感(一 ...

  8. CVPR 2019 | PoolNet:基于池化技术的显著性目标检测

    作者丨文永亮 学校丨哈尔滨工业大学(深圳) 研究方向丨目标检测.GAN 研究动机 这是一篇发表于 CVPR 2019 的关于显著性目标检测的 paper,在 U 型结构的特征网络中,高层富含语义特征捕 ...

  9. CVPR 2019开源论文 | 基于“解构-重构”的图像分类学习框架

    作者丨白亚龙 单位丨京东AI研究院研究员 研究方向丨表示学习.图像识别 基于深度卷积图像识别的相关技术主要专注于高层次图像特征的理解,而对于相似物体之间的细节差异和具有判别意义的区域(discrimi ...

最新文章

  1. yum报错Error: Cannot retrieve repository metadata (repomd.xml) for repository: rhel-source
  2. java snack_JSONPath小试牛刀之Snack3
  3. DL:深度学习算法(神经网络模型集合)概览之《THE NEURAL NETWORK ZOO》的中文解释和感悟(六)
  4. 数据库工程开发秘籍之TSQL 存储过程user stored procedure的概念与案例实战
  5. 《鬼泣V》:旧时代的标杆在新时代的窘境
  6. rxjs里combineLatest operators的用法
  7. 行、重复-SAP HANA 集合操作 UNION/Union all/INTERSECT/EXCEPT (SAP HANA Set Operations)-by小雨...
  8. C/C++ getopt()函数的介绍及使用
  9. python optimize_SciPy优化optimize模块用法
  10. 批处理向FTP上传指定属性的文件 批处理增量备份的例子
  11. IPFS矿机托管的优势与劣势
  12. 书还没出,已经在chinapub被虐了
  13. (152)IES光源概述文件
  14. gdb插件peda、gef、Pwndbg安装
  15. 让Google搜索结果居中显示
  16. cas 部署过程中遇到的一些问题(持续更新)
  17. (旧)2- 大家一起学:Flask构建弹幕微电影网站-前端首页搭建-0
  18. 第一章:深度学习引言
  19. JAVA面试潜规则大公开,能帮你多拿5k薪资!
  20. 零基础学习Python 作业 第28章

热门文章

  1. 计算机设备维修税率是多少,设备维修税率是多少
  2. android添加动画文件,Android开发之图形图像与动画(五)LayoutAnimationController详解
  3. java集群_身为Java程序员的你知道分布式与集群的联系及区别吗?
  4. python用电度数设计_Python时间序列预测实战(电力负荷预测)
  5. python与数据库交互的模块pymysql
  6. HTTP、TCP、UDP,Socket,HTTPS
  7. 学习总结:CSS(一)定义方式、选择器、选择器权重
  8. 虚拟机centos 上安装svn
  9. I2C驱动程序框架probe道路
  10. 广告影响网站打开速度解决方案