本文是论文《Change Detection Based on Deep Siamese Convolutional Network for Optical Aerial Images》的阅读笔记。

一、相关工作

根据网络的结构,现在变化检测的模型主要有三类,一是基于孪生神经网络的,二是基于伪孪生神经网络的,三是基于两通道的,孪生神经网络的两个分支是共享参数的,而伪孪生神经网络的两个分支是不共享参数的,两通道的是先把图像在通道维度concatenate起来,然后进行处理。在特征提取任务中,孪生神经网络更好有更好的解释性,因为两个分支共享参数,这意味着它们使用相同的方法从两张图像中提取特征,而由于变化检测中的两张图像是同源、具有相同属性的,所以通过相同方式提取特征更为自然。

二、方法和网络结构

文章贡献有:使用孪生神经网络来提取特征,使用加权对比损失来减少样本的不平衡,即不仅未变化的像素,而且变化的像素也被充分考虑到目标函数中。加权对比损失的优点是变化像素对的特征向量会远离彼此,而未变化像素对的特征向量会靠近彼此。

设计的孪生神经网络的具体结构如上。

1. 标记

  • XXX:输入图像

  • x(i,j)x(i,j)x(i,j):输入图像在(i,j)(i,j)(i,j)位置处的灰度值向量

  • Gw(X)G_w(X)Gw​(X):输出特征向量

  • Dw(X1,X2)D_w(X_1,X_2)Dw​(X1​,X2​):两张输入图像之间的距离图

  • Dw(X1,X2)i,jD_w(X_1,X_2)_{i,j}Dw​(X1​,X2​)i,j​:像素x1(i,j)x_1(i,j)x1​(i,j)和x2(i,j)x_2(i,j)x2​(i,j)之间参数化的距离函数(欧氏距离),简写为Di,jD_{i,j}Di,j​,其公式如下:
    Dw(X1,X2)i,j=∥Gw(X1)i,j−Gw(X2)i,j∥2D_{w}\left(X_{1}, X_{2}\right)_{i, j}=\left\|G_{w}\left(X_{1}\right)_{i, j}-G_{w}\left(X_{2}\right)_{i, j}\right\|_{2} Dw​(X1​,X2​)i,j​=∥∥∥​Gw​(X1​)i,j​−Gw​(X2​)i,j​∥∥∥​2​

  • YYY:二值GT图,y(i,j)=0y(i,j)=0y(i,j)=0表示相关图像对未变化,y(i,j)=1y(i,j)=1y(i,j)=1表示变化

  • (Y,X1,X2)k(Y,X_1,X_2)^k(Y,X1​,X2​)k:第kkk个标记的训练样本对

  • LU,LCL_U,L_CLU​,LC​:分别表示为未变化像素对和变化像素对的损失函数

  • PPP:训练样本对的个数

  • mmm:margin,边际

2. 损失函数

损失函数定义如下:
ℓ(W)=∑k=1PL(W,(Y,X1,X2)k)=∑k=1P∑i,j(1−yi,jk)LU(Di,jk)+yi,jkLC(Di,jk)\begin{aligned}\ell(W) &=\sum_{k=1}^{P} L\left(W,\left(Y, X_{1}, X_{2}\right)^{k}\right) \\&=\sum_{k=1}^{P} \sum_{i, j}\left(1-y_{i, j}^{k}\right) L_{U}\left(D_{i, j}^{k}\right)+y_{i, j}^{k} L_{C}\left(D_{i, j}^{k}\right)\end{aligned} ℓ(W)​=k=1∑P​L(W,(Y,X1​,X2​)k)=k=1∑P​i,j∑​(1−yi,jk​)LU​(Di,jk​)+yi,jk​LC​(Di,jk​)​
LU,LCL_U,L_CLU​,LC​定义如下:
LU(Di,jk)=12(Di,jk)2LC(Di,jk)=12{max⁡(0,m−Di,jk)2}\begin{aligned}L_{U}\left(D_{i, j}^{k}\right) &=\frac{1}{2}\left(D_{i, j}^{k}\right)^{2} \\L_{C}\left(D_{i, j}^{k}\right) &=\frac{1}{2}\left\{\max \left(0, m-D_{i, j}^{k}\right)^{2}\right\}\end{aligned} LU​(Di,jk​)LC​(Di,jk​)​=21​(Di,jk​)2=21​{max(0,m−Di,jk​)2}​
对变化检测来说,变化像素对和未变化像素对的个数变化非常大,所以需要根据实际情况对损失函数进行加权,所以最终的损失函数如下:
L(W,(Y,X1,X2)k)=∑i,j(1−yi,jk)12(Di,jk)2wU+yi,jk12{max⁡(0,m−Di,jk)2}wC\begin{aligned}L\left(W,\left(Y, X_{1}, X_{2}\right)^{k}\right)=& \sum_{i, j}\left(1-y_{i, j}^{k}\right) \frac{1}{2}\left(D_{i, j}^{k}\right)^{2} w_{U} \\&+y_{i, j}^{k} \frac{1}{2}\left\{\max \left(0, m-D_{i, j}^{k}\right)^{2}\right\} w_{C}\end{aligned} L(W,(Y,X1​,X2​)k)=​i,j∑​(1−yi,jk​)21​(Di,jk​)2wU​+yi,jk​21​{max(0,m−Di,jk​)2}wC​​
其中,wU,wCw_U,w_CwU​,wC​是权重系数,使用平均频率平衡,其公式如下:
wU=favg fUwC=favg fC\begin{array}{l}w_{U}=\frac{f_{\text {avg }}}{f_{U}} \\w_{C}=\frac{f_{\text {avg }}}{f_{C}}\end{array} wU​=fU​favg ​​wC​=fC​favg ​​​
其中,fU,fCf_U,f_CfU​,fC​是未变化和变化的像素对的频率,favgf_{avg}favg​是平均类频率,实际上平均类频率为0.5,因为只有未变化和变化两类。

上图是不加权损失、加权损失、有KNN的加权损失的对比。

3、处理流程

网络的整体模型如上。

整个模型的处理流程如下:

  • 使用直方图匹配进行辐射校正
  • 图像X1,X2X_1,X_2X1​,X2​被输入到孪生神经网络中,然后产生两个特征向量Gw(X1),Gw(X2)G_w(X_1),G_w(X_2)Gw​(X1​),Gw​(X2​),记为F1,F2F_1,F_2F1​,F2​
  • 根据公式获得距离图Dw(X1,X2)D_w(X_1,X_2)Dw​(X1​,X2​),记为DDD,其中值越大相关像素对改变的可能性越大
  • 初试变化图TTT同简单的阈值分割法获得
  • 使用KNN算法对TTT进行提升,得到最终的变化图MMM

三、实验

使用的数据集是SZTAKI AirChange Benchmark Set数据集,其包括三个已经配准的光学航空图像数据集:SZADA, TISZADOB和ARCHIEVE,其中SZADA 和TISZADOB被用作训练和测试。使用的baseline为CXM和SCCN,使用的评价指标有正确率Pr、召回率Rc和F值Fr。

不同方法在两个数据集上的结果对比。

a~f分别是两张输入图像、GT、CXM的结果、SCCN的结果、DSCN的结果。

【论文笔记】DSCN:基于深度孪生神经网络的光学航空图像变化检测模型相关推荐

  1. 论文翻译:基于深度卷积神经网络的肉鸡粪便识别与分类

    Recognition and Classification of Broiler Droppings Based on Deep Convolutional Neural Network 基于深度卷 ...

  2. 论文笔记:基于深度学习的遥感影像变化检测综述

    论文主要信息 本篇博文主要是对该论文进行总结和翻译,如有错漏,欢迎指出.(目前仅对有监督学习部分进行了整理) 标题:Deep learning for change detection in remo ...

  3. 【论文笔记】基于深度强化学习的机器人操作行为研究综述

    目录 摘要 关键词 1 引言 2 概念和术语 2.1 深度学习 2.2 强化学习 2.2.1 强化学习算法原理 2.2.2 强化学习算法分类 1. 无模型(model-free)算法和基于模型(mod ...

  4. 【论文笔记】基于深度学习的视觉检测及抓取方法

    目录 摘要 关键词 1 目标检测 1.1 YOLO-V3 模型 1.2 算法优化 2 抓取位姿估计 2.1 五维抓取框 2.2 抓取位姿估计模型 2.3 角度优化 3 实验结果与分析 3.1 目标检测 ...

  5. 【论文笔记】基于深度学习的机器人抓取虚拟仿真实验教学系统

    文章目录 摘要 关键词 0 引言 1 基于深度学习的机器人抓取实验原理 2 机器人抓取虚拟仿真实验设计方案 2.1 虚拟仿真实验系统总体设计 2.2 机器人抓取实验教学过程 3 实验教学考核与管理 4 ...

  6. 论文阅读:基于深度学习的肺癌放射基因组学图像生物标记和基因表达数据关联框架

    Topic: Image Bio-markers and Gene Expression Data Correlation Framework for Lung Cancer Radio-genomi ...

  7. 学习笔记之——基于深度学习的图像超分辨率重建

    最近开展图像超分辨率( Image Super Resolution)方面的研究,做了一些列的调研,并结合本人的理解总结成本博文~(本博文仅用于本人的学习笔记,不做商业用途) 本博文涉及的paper已 ...

  8. 基于深度卷积神经网络进行人脸识别的原理是什么?

    原文:https://www.zhihu.com/question/60759296 基于深度卷积神经网络进行人脸识别的原理是什么? 这里的人脸识别包括但不限于:人脸检测,人脸对齐,身份验证识别,和表 ...

  9. 孪生神经网络_驾驶习惯也能识人?基于时空孪生神经网络的轨迹识别

    ⬆⬆⬆ 点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! 前言: 给定一组单独的人员(例如行人,出租车司机)的历史轨迹以及由特定人员生成的一组新轨迹,轨迹识别问题旨在验证传入的轨迹是否是 ...

最新文章

  1. pageEncoding和ContextType区别
  2. 第二期安全狗讲坛3月11日开始
  3. HarmonyOS之深入解析设备标识符的功能和使用
  4. java在进行修改时报400_java开发注册群组报错400
  5. Android 上传图片实例,java上传图片接口
  6. linux命令——init 的使用用法
  7. linux删除目录下文件的几种方法
  8. Python抖音机器人制作!让你有看不完的小姐姐
  9. Windows Workflow RC HOL学习笔记(四):使用Listen,Delay和event-based自定义Activities
  10. 控制理论个人学习笔记-非线性系统理论
  11. krohne流量计接线图_科隆电磁流量计转换器操作说明
  12. pytest框架之fixture测试夹具详解
  13. There are 7 missing blocks. The following files may be corrupted
  14. linux mariadb 升级,Mariadb数据库更新
  15. matlab 求公因数,符号运算提取多项式系数和公因数
  16. RD Client远程控制PC
  17. PMSG类型究竟是什么意思?
  18. autocad.net 画多段线_AutoCAD2016绘制多段线图文教程
  19. [软件]Safe3 Web漏洞扫描系统企业版v10.1 破解版
  20. 东方标准讲师谈“JAVA之我注六经”(上)

热门文章

  1. 03-QNX Shell常用指令
  2. threejs-剖切
  3. android性能优化透明,Android性能优化-图片篇
  4. 个人信用卡融资你了解过吗?
  5. CLIP,GLIP论文解读,清晰明了
  6. QUANT[6] 量化交易常见概念解析
  7. 极客战记[森林]CHALLENGE:MAGIC EXAM
  8. 原生代码加载网络图片和Volley和Picasso的简单介绍和优缺点对比
  9. ​今年36岁,北邮硕士毕业,待过字节,阿里,最近被裁员,只能去外包。。。...
  10. 两种常用碱性磷酸酶化学发光底物APS-5/AMPPD(CAS:193884-53-6/122341-56-4)