写在前面

论文:

Z. Zhong, J. Li, Z. Luo and M. Chapman, “Spectral–Spatial Residual Network for Hyperspectral Image Classification: A 3-D Deep Learning Framework,” in IEEE Transactions on Geoscience and Remote Sensing, vol. 56, no. 2, pp. 847-858, Feb. 2018, doi: 10.1109/TGRS.2017.2755542.

代码:

https://github.com/zilongzhong/SSRN

本文整理的论文SSRN(光谱-空间残差网络)发表于2018年2月份,是基于CNN的HSI分类中一篇比较经典的论文。

⭐️ 出发点:在当时前人提出的基于三维卷积分类模型的基础上,引入了残差网络的skip connection的思想⇒\Rightarrow⇒好处则是可以使用更深层的神经网络,提升分类性能。

⭐️ 思路:针对输入的三维立方体高光谱数据邻域块,设计单独的光谱残差块和空间残差以提取丰富的光谱和空间特征;而且网络组织顺序为:首层卷积→\rightarrow→光谱残差块→\rightarrow→空间残差块→\rightarrow→线性层,这种结构被SSRN后续很多论文参考借鉴。

⭐️ 论文写作:使用图片、文字和公式很清晰地描述了三维卷积、BatchNormalization、Residual Connection的计算过程,整体网络结构介绍得也很清晰,这一点我非常喜欢。

⭐️ 实验组织:由于作者设计了两种残差块,在实验的过程中,分别验证了这两种残差的作用(去掉任何一个,网络性能都会下降)

1 Introduction

这部分主要是介绍前人的工作:基于特征工程的分类模型和基于深度学习的分类模型。

通过这部分,可以看出作者的研究思路:当时已经有基于三维卷积神经网络的HSI分类模型,残差网络的设计思想也得到了大家的认可,所以结合二者提出SSRN。

2 数据划分

这部分内容比较容易理解,数据划分就是将整个数据集划分为:训练集、验证集和测试集,分别用于更新模型的参数、验证中间模型的分类准确率和度量模型的泛化能力。

3 SSRN结构细节

3.1 整体网络基于三维卷积运算,同时在每层三维卷积后设置了BN层:

HSI是三维数据,记三个维度为:宽度、高度、深度;那么三维卷积与二维卷积相比,增加了一个维度,意味着卷积核不仅要在输入特征图的宽度和高度方向移动计算卷积值,还要在深度方向移动。

3.2 光谱残差块–>提取光谱特征:

设计细节:

  • 每层的基本运算:3.1节中介绍的三维卷积→\rightarrow→Batch Normalization;
  • 卷积核:1∗1∗m1*1*m1∗1∗m→\rightarrow→宽度和高度方向卷积核尺寸为1,光谱维度方向卷积核尺寸为m;好处是既可以提取光谱特征,也可以避免三维卷积参数的急剧增长;
  • 残差连接:在每两个三维卷积层之间使用残差连接;
  • padding:卷积计算时,设置padding,确保输出的特征图尺寸相同,方便残差连接时对应的值相加;

3.3 空间残差块–>提取空间特征:

设计细节:

  • 卷积核:a∗a∗da*a*da∗a∗d→\rightarrow→卷积核光谱维度尺寸d与空间残差块输入特征图的光谱维度尺寸d相同;
  • 这里的图有一点小问题:w×w×dw \times w \times dw×w×d的输入与nnn个a×a×da \times a \times da×a×d的卷积核进行卷积运算(加padding),得到的输出特征图应该是w×w×nw \times w \times nw×w×n。但影响不大,因为具体在实现时,作者设置了d=nd=nd=n;

3.4 整体结构
以IndiaPines数据集为例,展示了整体的网络结构:


 

设计细节:

  • 在光谱特征学习部分:最后一层卷积卷积核的光谱维度大小等于输入特征图光谱维度大小;在图中,最后一层卷积输入为7×7×977 \times 7 \times 977×7×97,卷积核尺寸为1×1×971 \times 1 \times 971×1×97;
  • 图中的一个小问题:

4 实验设计

4.1 参数设置

  • 除了基本的超参数设置外,作者还考虑到了影响模型容量的卷积核数量,即残差块中每层卷积的卷积核个数(kernel_number)。
  • 数据预处理:在送入网络之前,进行了减去均值除以方差的预处理。

4.2 对比实验

  • 一方面是与其他已有分类模型进行对比,对比OA、AA和Kappa这三个定量指标;
  • 另一方面考虑不同的输入大小、不同的训练样本数量、不同残差块的数量对结果的影响,以充分验证设计的模型具有良好的泛化能力;
  • 此外对比训练和测试时间,基于残差连接的网络确实需要比较长的训练时间。

5 小结

  1. 这篇论文其实看得很早,是我入门HSI时学习的论文,当时由于相关的英文单词都看不懂,忽略了很多细节:比如数据的预处理(减去均值除以方差)、比如光谱学习块和空间学习块连接处的卷积和尺寸设计;在经历了自己设计网络和调参后,发现细节真的很重要!
  2. 要敢于质疑:以前看到感觉有点不对的地方,总是怀疑是不是自己想错了;有时候论文不可能完美地毫无瑕疵,出现一些小问题也很正常,自己要敢于质疑!保持好奇~

小插曲:分享此刻听到的音乐~

回首望 路遥遥 多少脚印深深 ~
抬头看 路漫漫 理想依然在召唤 ~

[HSI论文阅读] | SSRN:Spectral-Spatial residual network for HSI classification相关推荐

  1. 【论文阅读+翻译】Context-Aware Residual Module for Image Classification

    如有侵权,联系删除 [2021ICPR] Context-Aware Residual Module for Image Classification 用于图像分类的上下文感知残差模块 论文链接:ht ...

  2. 论文阅读:Saliency-Guided Region Proposal Network for CNN Based Object Detection

    论文阅读:Saliency-Guided Region Proposal Network for CNN Based Object Detection (1)Author (2)Abstract (3 ...

  3. 论文阅读11——《Mutual Boost Network for Attributed Graph Clustering》

    是聚类让我们"聚类",我整理了部分深度图聚类代码,希望大家多多支持(GitHub代码):A-Unified-Framework-for-Deep-Attribute-Graph-C ...

  4. 论文阅读:Spectral Networks and Deep Locally Connected Networks on Graphs

    论文阅读:Spectral Networks and Deep Locally Connected Networks on Graphs 目录 Abstract 1 Introduction 1.1 ...

  5. 高光谱HSI论文阅读——A Superpixel-Correlation-Based Multiview Approach for HSIC

    高光谱HSI论文阅读--A Superpixel-Correlation-Based Multiview Approach for HSIC 一种基于超像素-相关性的多视角的高光谱图像分类方法 论文来 ...

  6. 论文阅读Batch Normalization: Accelerating Deep Network Training byReducing Internal Covariate Shift

    论文阅读Batch Normalization: Accelerating Deep Network Training byReducing Internal Covariate Shift 全文翻译 ...

  7. [HSI论文阅读] | HybridSN: Exploring 3-D–2-D CNN Feature Hierarchy for Hyperspectral Image Classification

    仅整理个人和组里对下文引用的论文(HybridSN)的学习所获,如有错误,感谢指正~ 更新记录 ⭐️ 2021.3.6 -- 关于本文2.2.2节卷积层参数的计算 ⭐️ 2021.3.8 -- Hyb ...

  8. 【论文阅读】Gait Quality Aware Network: Toward the Interpretability of Silhouette-Based Gait Recognition

    Gait Quality Aware Network: Toward the Interpretability of Silhouette-Based Gait Recognition 摘要 Intr ...

  9. 论文阅读——CcNet:A cross-connected convolutional network for segmenting retinal vessels using multi-scale

    论文阅读:CcNet:A cross-connected convolutional network for segmenting retinal vessels using multi-scale ...

最新文章

  1. AFNetworking 3.0 断点续传 使用记录
  2. elasticsearch 5.x Delete By Query API(根据条件删除)
  3. python如何创建模块教程_Python创建模块及模块导入的方法
  4. linux中的shell脚本case,【shell】Linux shell 之 case 详解
  5. geek_How-To Geek正在寻找安全作家
  6. git 提交文件_git原理与实战
  7. RIP,EIGRP,OSPF融合网络互通实验(原创)
  8. 【Android开发—智能家居系列】(二):用手机对WIFI模块进行配置
  9. 物联网正在面临的 9 大安全挑战!
  10. (5)【整合】基于机器学习的酒店评论文本倾向性分析
  11. [Bzoj1597][Usaco2008 Mar]土地购买(斜率优化)
  12. STC学习:振动传感器
  13. 批量WORD转换为PDF
  14. pkg打包node项目
  15. 用TreeWalk提高网速及其在vista中的安装方法
  16. Ubuntu赋予root权限
  17. 什么是天使轮、A轮、B轮、C轮、D轮融资
  18. redisTemplate乱码问题
  19. 二进制漏洞挖掘之angr‘s Reaching Definition Analysis(一)
  20. 海洋cms播放器html,海洋cms升级新播放器后播放不了如何解决?

热门文章

  1. MLY -- 11.When to change dev/test sets and metrics
  2. centos 安装yapi 详细教程
  3. 国内洗地机品牌排行榜前十名有哪些?洗地机十大品牌排行榜介绍
  4. 美国洛杉矶时间转 格林威治时间
  5. 米家APP获取小米、绿米网关key的方法(5.6.81版本)(2020_05_15)
  6. ECCVW 2022 | 第二届城市规模点云语义理解挑战赛
  7. elasti 时间范围查询
  8. Linux笔记之Debian 11(bullseye) 配置国内源
  9. Antlr4 区分“减号”运算符和负号
  10. Linux下Navicat premium 12 免费亲测可用