Dense Nested Attention Network for Infrared Small Target Detection

  • 1.红外小目标的特点与本文的贡献
    • 红外小目标检测的特点
    • 本文的几个贡献
  • 2.网络结构解析
    • DNANet整体网络结构
    • 特征提取模块
    • 特征金字塔融合模块
    • 八连通邻居聚类模块
  • 3.损失计算
  • 4.评价指标
  • 5.论文信息

Target Detection)

1.红外小目标的特点与本文的贡献

红外小目标检测的特点

  1. 目标很小
    由于成像距离长,红外目标一般都很小,在图像中从一个像素到几十个像素不等。

  2. 昏暗
    红外目标通常信杂比较低,容易陷入强噪声和杂波背景中。

  3. 无形状
    红外小目标形状特征有限。

  4. 可变
    不同场景下红外目标的大小和形状变化很大。

  5. 不能使用为通用对象设计的网络
    由于红外小目标的尺寸比一般目标小得多,直接应用这些方法进行SIRST检测容易导致深层小目标的丢失。

本文的几个贡献

  1. 提出了一个DNANet来维护深层的小目标。通过反复的特征融合和增强,可以很好地融合和充分利用小目标的背景信息。
  2. 提出了密集嵌套交互模块和通道-空间注意模块,实现了逐级特征融合和自适应特征增强。
  3. 开发了一个红外小目标数据集(即,NUDT-SIRST)。
  4. 在公共数据集和NUDT数据集上的实验都证明了本论文的方法的优越性能。与现有方法相比,本论文的方法对杂波背景、目标大小和目标形状的变化具有更强的鲁棒性。

2.网络结构解析

DNANet整体网络结构

DNANet的整体网络结构如下图所示。(a)特征提取模块。首先将输入图像送入密集嵌套交互模块(DNIM),实现逐级特征融合。然后,利用通道与空间注意模块(CSAM)对不同语义层次的特征进行自适应增强。(b)特征金字塔融合模块(FPFM)。对增强后的特征进行上采样和拼接,实现多层输出融合。©八连通邻域聚类算法。对分割图进行聚类,最终确定每个目标区域的质心

特征提取模块

作者从U-Net中得到启发,以U-Net作为基本网络结构,不断增加其网络的层次,以获得更深层的语义信息,获得更大的感受野。考虑到红外小目标的小的特性,作者设计了一个专门的模块来提取深层特征的同时维护深层小目标的表示。

DNIM – The Dense Nested Interactive Module
作者基于上面的思路设计了DNIM模块。作者将多个U型结构堆叠在一起,并在网络中设置了多个节点,将所有节点连接在一起,每个节点可以从自己和相邻层接收特征,实现重复的多层的特征融合。这样可以在深层保持小目标的表示

这里设 I 为DNIM层。取ithi^{th}ith(i = 0, 1, 2, …, I)。Li,j表示节点Li,j的输出。其中 i 为沿编码器的第 I 个下采样层,j 为沿平原跳跃路径的稠密块的第 j 个卷积层。当 j = 0时,每个节点只接收到来自密集素跳连接的特征。

其中F表示多个级联卷积层,Pmax 表示最大池化层。当 j > 0 时,每个节点接收到三个方向的输出,即

U(·) 表示上采样层

CSAM – Channel and Spatial Attention Module
在DNIM的多层特征融合阶段,采用CSAM进行自适应特征增强,减小语义差距。如下图所示。

由上图,CSAM由通道注意力和空间注意力这两个级联注意单元组成。节点Li,jL^{i,j}Li,j依次由一维通道注意力图 Mc∈RCi×1×1\R^{Ci×1×1}RCi×1×1 和二维空间注意力图 Ms∈R1×Hi×Wi\R^{1×Hi×Wi}R1×Hi×Wi 进行处理

通道注意力

  • 特征图分别经过MaxPool和AvgPool,形成两个[ C , 1 , 1 ]的权重向量
  • 两个权重向量分别经过同一个MLP网络(由于是同一个网络,因此也可看作是网络参数共享的MLP),映射成每个通道的权重
  • 将映射后的权重相加,后接Sigmoid输出
  • 将得到的通道权重[ C , 1 , 1 ] 与原特征图[ C , H , W ] 按通道相乘

空间注意力

  • 特征图分别经过MaxPool和AvgPool,形成两个[ 1 , H , W ]的权重向量,即按通道最大池化和平均池化。通道数从[ C , H , W ] 变为[ 1 , H , W ] ,对同一特征点的所有通道池化。
  • 得到的两张特征图进行堆叠,形成[ 2 , H , W ]的特征图空间权重
  • 经过一层7×7的卷积层,特征图维度从[ 2 , H , W ]变为[ 1 , H , W ] ,这[ 1 , H , W ] 的特征图表征了特征图上的每个点的重要程度,数值大的更重要
  • 将得到的空间权重[ 1 , H , W ] 与原特征图[ C , H , W ] 相乘,即特征图上[ H , W ]的每一个点都赋予了权重

我们可以看成大小为[ H , W ]的特征图,在每一个点( x , y ) , x ∈ ( 0 , H ) , y ∈ ( 0 , W ) 上,都有C个数值,数值表征了特征图该点的重要程度,通过感受野反推回原图像,即表示了该区域的重要程度。我们需要让网络自适应关注需要关注的地方(数值大的地方更易受到关注)

特征金字塔融合模块

对增强后的特征进行上采样和拼接,实现多层输出融合,将包含丰富空间和剖面信息的浅层特征和包含丰富语义信息的深层特征深化连接起来,生成全局鲁棒特征图。

就是将 L4,0L^{4,0}L4,0、L3,1L^{3,1}L3,1、L2,2L^{2,2}L2,2、L1,3L^{1,3}L1,3、L0,4L^{0,4}L0,4 上采样至 [ Ci,jC^{i,j}Ci,j, H0,4H^{0,4}H0,4, W0,4W^{0,4}W0,4 ],再按通道拼接,最后经过一个残差块得到 [ C0,4C^{0,4}C0,4, H0,4H^{0,4}H0,4, W0,4W^{0,4}W0,4 ] 的输出

八连通邻居聚类模块

在特征金字塔融合模块之后,引入八连通邻域聚类模块对所有像素点进行杂波处理,并计算每个目标的质心。如果特征图g中任意两个像素g(m0,n0), g(m1,n1)在它们的八个邻域内(如公式8)有交集区域,且具有相同的值(0或1)(如公式9),则认为这两个像素处于连通区域。连接区域中的像素属于相同的目标。一旦图像中所有目标确定,质心作为它们的坐标计算。

3.损失计算

这里的网络是使用Soft-IoU loss进行训练的。与AGPCNet一致。
关于Soft-IoU loss在AGPCNet有过讲解
https://blog.csdn.net/weixin_33538887/article/details/126401466

4.评价指标

在评价指标方面,这里主要列举了两种常用指标:检测率 Pd 和 虚警率 Fa

检测率 Pd 一个目标级的评估指标。它度量正确预测的目标数比所有目标数的比率。定义如下:

其中,TcorrectTAll 分别表示正确预测目标的数量和所有正确目标的数量。如果目标的质心导数小于最大允许导数,则认为这些目标是正确预测的目标。本文设最大质心导数为3。

虚警率Fa 是另一个目标级评估指标。它用于测量错误预测像素占所有图像像素的比例。定义如下:

其中,其中 PfalsePAll 分别表示错误预测像素的个数和所有图像像素的个数。

ROC曲线用来描述检测概率(Pd)在不同误报率(Fa)下的变化趋势。
以虚警率为横轴,检测率为纵轴作图,就能够得到一个序列的ROC曲线。ROC序列越凸,代表该检测方法对序列的检测效果越好,即曲线与横轴所围成的面积越大,则检测性能越佳。

5.论文信息

论文下载地址:https://arxiv.org/pdf/2106.00487v3.pdf
论文源码(PyTorch实现): https://github.com/YeRen123455/Infrared-Small-Target-Detection
附有数据集

红外小目标:DNANet网络结构与模型搭建相关推荐

  1. YOLOV5 模型和代码修改——针对小目标识别(红外小目标)

    一.简述 最近忙于各种奇奇怪怪的杂事,仔细一看居然有四个月没有写微博了,罪恶-- 这次主要是针对航拍的红外图像做定向识别,项目实际识别目标由于保密的原因不能展示,博客里面仅用车辆和行人进行说明. 红外 ...

  2. ALCNet——红外小目标检测网络论文阅读

    论文链接:Attentional Local Contrast Networks for Infrared Small Target Detection | IEEE Journals & M ...

  3. 我们是如何改进YOLOv3进行红外小目标检测的?

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 [导语]本文将介绍BBuf.小武和笔者一起在过年期间完成的一个目标检测项目,将描述我们模型改进的思路. ...

  4. 关于如何改进YOLOv3进行红外小目标检测的?

    关于如何改进YOLOv3进行红外小目标检测? 对于提高效果可以做出努力的方向 1. 对数据集进行统计 2.修改anchor 3. 构建Baseline 4.数据集部分改进 ①过采样 ②在图片中任意位置 ...

  5. 2021-03-29 单帧红外小目标数据集 | SIRST

    目录 单帧红外小目标数据集 | Single-frame InfraRed Small Target (SIRST) Benchmark 1 数据集描述 SIRST 数据集统计性质 新的评价指标nIo ...

  6. 红外小目标检测的非对称上下文调制

    摘要 因为缺乏固有的目标特征,并且缺乏一个公共的数据集,单帧红外小目标检测依然是一个挑战.在本文中,我们首先提供了一个带有高质量标注的开放数据集,以推进这一领域的研究.我们还提出了一种专门为检测红外小 ...

  7. 红外小目标检测之DANNet

    Dense Nested Attention Network for Infrared Small Target Detection 文章亮点: 1.提出一种密集嵌套交互模块和通道-空间注意力模块,实 ...

  8. 哈尔滨工业大学提出 RISTDnet:强鲁棒性的红外小目标检测网络

    哈工大提出***RISTDnet***:强鲁棒性的红外小目标检测网络 RISTDnet: Robust Infrared Small Target Detection Network 作者单位:哈尔滨 ...

  9. 红外小目标:简单笔记

    红外小目标检测 应用背景 解决难点 现有方法 传统方法 深度学习的方法 数据集 评价指标 应用背景 红外小目标检测是红外搜索和跟着的关键技术之一,在海上监控系统,预警系统应用广泛, 解决难点 红外小目 ...

最新文章

  1. 清华大学施路平:发展人工通用智能最好的时机到了!
  2. linux 启动流程图
  3. 爬虫进阶教程:极验(GEETEST)验证码破解教程
  4. php中的foreach如何使用?
  5. Cypress 启动本地浏览器的学习笔记
  6. 计算机新入学教案,计算机应用 新教案(1-6周).doc
  7. 10.14. Network
  8. 寻找圣杯 In Search of the Holy Grail
  9. Redhat下7-Zip的安装和使用
  10. 关于影视后期制作的就业市场调查报告
  11. 干货技巧:pdf文件怎么转换成jpg图片?
  12. 什么是AWS认证,有什么用?
  13. 点击子元素却也触发父元素的点击事件
  14. Mina MEID/GSM Activator 1.0 三网信号激活,支持iOS12.0~14.8.1
  15. Turtlebot3-burger入门教程#foxy版#-树莓派4安装
  16. 阿里王坚:别把智慧城市做成怪物
  17. java 设计模式之设计原则篇
  18. VBA 32位代码适配64位
  19. jQuery 选择器 选取第一个 p 元素
  20. Windows 批处理(bat) if条件判断语句使用教程

热门文章

  1. vue里的axios获取本地的json数据
  2. html表白earth,浪漫表白的英文句子大全
  3. ESD静电二极管|静电保护器件
  4. 大数据(一)数据采集 3
  5. IDEA安装vue开发插件
  6. 自签名SSL证书的安全隐患和风险
  7. oracle默认导出dmp路径_Oracle导入导出dmp文件
  8. itools 2014(苹果同步软件) v2.0.3.8 官方免费版
  9. 真我手机可以装鸿蒙系统,华为Mate40/P40两大旗舰用户已提前享用鸿蒙手机系统...
  10. 【技术美术图形部分】图形渲染管线2.0-GPU管线概述几何阶段