这篇论文来自preligens,同时采用了分割和检测算法来实现遥感影像飞机的检测和识别,创造性的将分割和检测两类算法进行了融合,提高了检测识别的精度和效率。

一、引言

  • 介绍背景、CNN的发展和作用、分割网络和检测网络的代表性类型;
  • 本文中,作者试图找到一种高效且鲁棒的能够解决飞机检测识别问题的方法。因此,作者提出了一个基于不同CNN模型的混合方法:一个基于U-Net的分割网络,用于更高效的检测(better detection rate);一个基于RetinaNet的检测模型,用于识别并提高精度(identifying and improving the precision)。

二、方法

混合模型各部分选择的前提:(1)改变训练模式会引起模型内部特征提取方式的改变;(2)分割模型非常有效,但是在目标的分割和识别中效果较差;(3)在高分辨率的卫星影像中,飞机的尺寸是有限的。

1. 分割的CNN网络

分割网络实现的目标:(1)检测飞机(无需识别);(2)获得高的recall(尤其是在位置信息上);(3)鲁棒性强。

本研究的模型基于U-Net架构进行了部分改进:

  • 卷积层被替换为残差结构
  • 最大池化层用步长为2的卷积层代替
  • 网络的宽度和深度根据应用场景设定。

2. 检测的CNN网络

检测网络实现的目标:(1)分离检测到的目标;(2)正确识别目标。

本研究的模型基于RetinaNet进行了部分改进:

  • 在特征金字塔上增加了一层,以检测小目标;
  • RetinaNet提取特征的骨干网络为ResNet101;
  • 采用NMS移除多余的边界框。

此外,模型还结合了focal loss解决样本不平衡的问题。

3. 网络融合

分割模型提取的特征在定位方面表现优异,但难以分割或识别目标;

检测模型提取的特征在识别上效果很好,但是recall高precision低。

模型执行的步骤:

  • 采用分割模型提取影像中每个像元的预测值。这是定位的过程。
  • 将目标检测器应用在定位获得的正值区域。考虑到目标检测模型的位移不变性,这个过程是可迭代的:(1)应用检测模型;(2)从分割图中移除检测到的目标。
  • (可选) 研究预测图中剩余的正值区域以提高recall;考虑到被检测飞机的大小或距离,将目标添加到检测列表中。

三、 实验

1. 数据信息

三级数据标签表示法:类型(飞机)——功能(轰炸机、运输机等)——类别(F-16、Tu-95等)。

分辨率30-50cm,切片512×512(128的重叠)。

2. 模型参数信息

分割模型采用的是类别加权交叉熵;

检测器训练时,采用focal loss进行分类,smooth L1 loss进行回归;

增加了分类的权重(回归权重的1.5倍),NMS的阈值为0.35;

两个模型都可以通过改变预测阈值(prediction threshold)和最小尺寸(minimum size)来进行recall和precision平衡模式的调整。

【论文】Concurrent Segmentation and Object Detection CNNs for Aircraft Detection and Identification相关推荐

  1. 论文阅读 (88):Adversarial Examples for Semantic Segmentation and Object Detection

    文章目录 1. 概述 2 算法 2.1 稠密对抗生成 2.2 选择用于检测的输入提案 1. 概述 题目:用于语义分割和目标检测的对抗样本 核心点:将对抗性样本的概念扩展到语义分割和对象检测,并提出稠密 ...

  2. 论文阅读:Volumetric and Multi-View CNNs for Object Classification on 3D Data

    Preface   最近由于要做正颌手术中术后变形预测的问题,要处理三维数据,所以在研究三维卷积,三维分类的问题.   今天阅读一篇CVPR2016的论文:<Volumetric and Mul ...

  3. CVPR2020论文解读:3D Object Detection三维目标检测

    CVPR2020论文解读:3D Object Detection三维目标检测 PV-RCNN:Point-Voxel Feature Se tAbstraction for 3D Object Det ...

  4. 论文阅读:Salient Object Detection: A Benchmark

    论文阅读:Salient Object Detection: A Benchmark 南开大学的显著性检测benchmark 链接:http://mmcheng.net/zh/salobjbenchm ...

  5. 论文翻译《Salient object detection: A survey》

    传统的方法: 可大致分为三类:基于block和intrinsic cues的模型.基于region和intrinsic cues的模型.基于extrinsic cues的模型(包括block和regi ...

  6. ICCV2019论文点评:3D Object Detect疏密度点云三维目标检测

    ICCV2019论文点评:3D Object Detect疏密度点云三维目标检测 STD: Sparse-to-Dense 3D Object Detector for Point Cloud 论文链 ...

  7. [初窥目标检测]——《目标检测学习笔记(2):浅析Selective Search论文——“Selective Search for object recognition”》

    [初窥目标检测]--<目标检测学习笔记(2):浅析Selective Search论文--Selective Search for object recognition> 本文介绍 前文我 ...

  8. 深度学习论文: PaDiM: a Patch Distribution Modeling Framework for Anomaly Detection and Localization

    深度学习论文: PaDiM: a Patch Distribution Modeling Framework for Anomaly Detection and Localization PaDiM: ...

  9. 【论文笔记】A Transformer-based Siamese network for change detection

    论文 论文题目:A TRANSFORMER-BASED SIAMESE NETWORK FOR CHANGE DETECTION 收录:IGARSS 2022 论文地址:https://arxiv.o ...

最新文章

  1. DPI — 深度数据报文解析
  2. c++学习笔记之友元函数
  3. 商汤科技实习生招募专场 | 与大咖畅聊AI拿OFFER,赢商汤年会入场券
  4. 用redis+jwt保存在线用户和获得在线用户列表、踢出用户示例
  5. boost::coroutine2模块实现解析器的测试程序
  6. java 程序的初始化顺序是怎样的?
  7. 选择排序----详细算法分析
  8. vc++树状控件(TreeCtrl)用法
  9. 2021总结-》2022年
  10. JavaScript的String对象使用
  11. python安装pyserial模块_Python使用pip安装pySerial串口通讯模块
  12. 基于神经网络的目标检测论文之绪论:研究背景和国内外发展现状
  13. 两个非常不错的在线pdf转epub的网站,没有上传大小限制
  14. 股票账户各权限开通条件总结【干活总结】
  15. 贝尔链CEO Vincent:让游戏玩家从趣味消费到价值收益
  16. 与亚马逊Amazon Device EDI进行测试都有哪些场景?
  17. Driller工具分析
  18. Word交叉输入汉字和英文间距变大
  19. github有什么作用_什么是GitHub?它的用途是什么?
  20. 微软云 (Microsoft Cloud) 技术概述

热门文章

  1. 2022-2027年中国训练健身器材行业发展监测及投资战略研究报告
  2. 响应式重工业钢铁机械类网站pbootcms模板,html5工业设备网站源码下载
  3. 苹果电容笔值得买吗?性价比高的电容笔排行榜
  4. 【MATALB】 输入一个百分制成绩的不同输出
  5. 窗口置顶函数SetWindowPos——在winUser.h中
  6. Sicily1176
  7. 【cocos2d-x从c++到js】注册函数
  8. 如何使用ISE高效开发Verilog项目(新手)
  9. 详解YOLOv5中的Bottleneck
  10. android 系统源码介绍