【论文】Concurrent Segmentation and Object Detection CNNs for Aircraft Detection and Identification
这篇论文来自preligens,同时采用了分割和检测算法来实现遥感影像飞机的检测和识别,创造性的将分割和检测两类算法进行了融合,提高了检测识别的精度和效率。
一、引言
- 介绍背景、CNN的发展和作用、分割网络和检测网络的代表性类型;
- 本文中,作者试图找到一种高效且鲁棒的能够解决飞机检测识别问题的方法。因此,作者提出了一个基于不同CNN模型的混合方法:一个基于U-Net的分割网络,用于更高效的检测(better detection rate);一个基于RetinaNet的检测模型,用于识别并提高精度(identifying and improving the precision)。
二、方法
混合模型各部分选择的前提:(1)改变训练模式会引起模型内部特征提取方式的改变;(2)分割模型非常有效,但是在目标的分割和识别中效果较差;(3)在高分辨率的卫星影像中,飞机的尺寸是有限的。
1. 分割的CNN网络
分割网络实现的目标:(1)检测飞机(无需识别);(2)获得高的recall(尤其是在位置信息上);(3)鲁棒性强。
本研究的模型基于U-Net架构进行了部分改进:
- 卷积层被替换为残差结构;
- 最大池化层用步长为2的卷积层代替;
- 网络的宽度和深度根据应用场景设定。
2. 检测的CNN网络
检测网络实现的目标:(1)分离检测到的目标;(2)正确识别目标。
本研究的模型基于RetinaNet进行了部分改进:
- 在特征金字塔上增加了一层,以检测小目标;
- RetinaNet提取特征的骨干网络为ResNet101;
- 采用NMS移除多余的边界框。
此外,模型还结合了focal loss解决样本不平衡的问题。
3. 网络融合
分割模型提取的特征在定位方面表现优异,但难以分割或识别目标;
检测模型提取的特征在识别上效果很好,但是recall高precision低。
模型执行的步骤:
- 采用分割模型提取影像中每个像元的预测值。这是定位的过程。
- 将目标检测器应用在定位获得的正值区域。考虑到目标检测模型的位移不变性,这个过程是可迭代的:(1)应用检测模型;(2)从分割图中移除检测到的目标。
- (可选) 研究预测图中剩余的正值区域以提高recall;考虑到被检测飞机的大小或距离,将目标添加到检测列表中。
三、 实验
1. 数据信息
三级数据标签表示法:类型(飞机)——功能(轰炸机、运输机等)——类别(F-16、Tu-95等)。
分辨率30-50cm,切片512×512(128的重叠)。
2. 模型参数信息
分割模型采用的是类别加权交叉熵;
检测器训练时,采用focal loss进行分类,smooth L1 loss进行回归;
增加了分类的权重(回归权重的1.5倍),NMS的阈值为0.35;
两个模型都可以通过改变预测阈值(prediction threshold)和最小尺寸(minimum size)来进行recall和precision平衡模式的调整。
【论文】Concurrent Segmentation and Object Detection CNNs for Aircraft Detection and Identification相关推荐
- 论文阅读 (88):Adversarial Examples for Semantic Segmentation and Object Detection
文章目录 1. 概述 2 算法 2.1 稠密对抗生成 2.2 选择用于检测的输入提案 1. 概述 题目:用于语义分割和目标检测的对抗样本 核心点:将对抗性样本的概念扩展到语义分割和对象检测,并提出稠密 ...
- 论文阅读:Volumetric and Multi-View CNNs for Object Classification on 3D Data
Preface 最近由于要做正颌手术中术后变形预测的问题,要处理三维数据,所以在研究三维卷积,三维分类的问题. 今天阅读一篇CVPR2016的论文:<Volumetric and Mul ...
- CVPR2020论文解读:3D Object Detection三维目标检测
CVPR2020论文解读:3D Object Detection三维目标检测 PV-RCNN:Point-Voxel Feature Se tAbstraction for 3D Object Det ...
- 论文阅读:Salient Object Detection: A Benchmark
论文阅读:Salient Object Detection: A Benchmark 南开大学的显著性检测benchmark 链接:http://mmcheng.net/zh/salobjbenchm ...
- 论文翻译《Salient object detection: A survey》
传统的方法: 可大致分为三类:基于block和intrinsic cues的模型.基于region和intrinsic cues的模型.基于extrinsic cues的模型(包括block和regi ...
- ICCV2019论文点评:3D Object Detect疏密度点云三维目标检测
ICCV2019论文点评:3D Object Detect疏密度点云三维目标检测 STD: Sparse-to-Dense 3D Object Detector for Point Cloud 论文链 ...
- [初窥目标检测]——《目标检测学习笔记(2):浅析Selective Search论文——“Selective Search for object recognition”》
[初窥目标检测]--<目标检测学习笔记(2):浅析Selective Search论文--Selective Search for object recognition> 本文介绍 前文我 ...
- 深度学习论文: PaDiM: a Patch Distribution Modeling Framework for Anomaly Detection and Localization
深度学习论文: PaDiM: a Patch Distribution Modeling Framework for Anomaly Detection and Localization PaDiM: ...
- 【论文笔记】A Transformer-based Siamese network for change detection
论文 论文题目:A TRANSFORMER-BASED SIAMESE NETWORK FOR CHANGE DETECTION 收录:IGARSS 2022 论文地址:https://arxiv.o ...
最新文章
- DPI — 深度数据报文解析
- c++学习笔记之友元函数
- 商汤科技实习生招募专场 | 与大咖畅聊AI拿OFFER,赢商汤年会入场券
- 用redis+jwt保存在线用户和获得在线用户列表、踢出用户示例
- boost::coroutine2模块实现解析器的测试程序
- java 程序的初始化顺序是怎样的?
- 选择排序----详细算法分析
- vc++树状控件(TreeCtrl)用法
- 2021总结-》2022年
- JavaScript的String对象使用
- python安装pyserial模块_Python使用pip安装pySerial串口通讯模块
- 基于神经网络的目标检测论文之绪论:研究背景和国内外发展现状
- 两个非常不错的在线pdf转epub的网站,没有上传大小限制
- 股票账户各权限开通条件总结【干活总结】
- 贝尔链CEO Vincent:让游戏玩家从趣味消费到价值收益
- 与亚马逊Amazon Device EDI进行测试都有哪些场景?
- Driller工具分析
- Word交叉输入汉字和英文间距变大
- github有什么作用_什么是GitHub?它的用途是什么?
- 微软云 (Microsoft Cloud) 技术概述