论文阅读笔记|A view-free image stitching network based on global homography

  • 前言
  • VFISNet
    • Homography estimation stage
    • Structure stitching stage
    • Content revision stage
    • 损失函数
  • 数据集生成
  • 实验

前言

L. Nie, C. Lin, K. Liao, M. Liu, and Y. Zhao, “A view-free image stitching network based on global homography,” Journal of Visual Communication and Image Representation, p. 102950, 2020.
本文提出了一种基于全局单应性的视角自由的图像拼接网络,简称VFISNet,
源码地址
算法框架如图所示:

主要包括三个阶段:

  1. Homography Estimation
  2. Structure Stitching
  3. Content Revision

本文的主要贡献:

  1. 提出了一个视角自由的图像拼接网络
  2. 为了尽可能减轻伪影,设计了一个global correlation层和一个结构到内容逐渐拼接模块
  3. 构造了一个图像拼接合成数据集,图像之间的重叠区域更小

VFISNet

Homography estimation stage


单应性估计阶段就是基于先前的DHN方法,一个VGG风格的特征提取骨干网络。接着为了减小平均角点误差,提升单应性估计精度,从光流估计方法(PWC-Net、Flownet2等)得到启发,作者引入了一个Global Correlation层,然后接了三个卷积层和两个全连接层,输出是8个参数的fff,表示图像 IB 相对于图像 IA 四个顶点的偏移量。再通过DLT层计算出图像 IB 变换到图像 IA 的单应性矩阵H。

Structure stitching stage


结构拼接阶段是基于空间变换网络。对于IA,使用单位矩阵,变换为IAW;对于IB,使用单应性估计阶段得到的H,变换为IBW,IAW和IBW通过平均融合得到Structure Stitching Result。再将IAW、IBW、Structure Stitching Result连接得到一个9通道的图像。此时得到的是一个粗对齐拼接结果,因为单应性估计是从图像四个顶点的偏移量计算出,不会将每个像素对齐,一点预测误差就会导致整个拼接结果视觉上的模糊。

Content revision stage

内容修正阶段是一个UNet网络,输入是粗对齐拼接结果,输出是精确对齐拼接结果。

损失函数

对于单应性估计阶段,损失函数是预测偏移量和ground truth偏移量之间的MSE误差;
对于内容修正阶段,损失函数是预测拼接结果和ground truth label之间的L1误差,此外还加上了VGG19前4层提取特征图之间的L2误差。

数据集生成

如开头图所示
1.首先在COCO2014数据集的一张图片上随机裁剪出一个128×128的区域,如图中绿框所示,作为IA

2.接着在[-64, 64]范围内进行随机位移,得到图中蓝框;

3.然后在[-25, 25]范围内对图像四个顶点随机扰动,得到图中红框,红框相对于绿框四个顶点的偏移量就作为单应性估计阶段的ground truth偏移量,红框和绿框围成的像素内容作为内容修正阶段的Label;

4.将绿框到红框计算出的单应性矩阵逆变换应用到原图上,在蓝框位置处裁剪出IB
从而得到一组训练样本(IA,IB,f,Label)。

实验

训练:分两步,先训练Homography estimation stage,再训练后面Content revision stage。

评价:

  1. 与深度单应性估计方法比较
  2. 与现有拼接方法比较
  3. 消融实验

论文阅读笔记|A view-free image stitching network相关推荐

  1. 毫米波目标检测论文 阅读笔记 | Radar Transformer: An Object Classification Network Based on 4D MMW Imaging Radar

    毫米波目标检测论文 | Radar Transformer: An Object Classification Network Based on 4D MMW Imaging Radar Jie Ba ...

  2. 【论文阅读笔记|EMNLP2022】A Span-level Bidirectional Network for Aspect Sentiment Triplet Extraction

    论文题目:A Span-level Bidirectional Network for Aspect Sentiment Triplet Extraction 论文来源:EMNLP2022 论文链接: ...

  3. 论文阅读笔记《PoseCNN: A Convolutional Neural Network for 6D Object Pose Estimation in Cluttered Scenes》

    核心思想   本文提出一种基于卷积神经网络的物体分割与位姿估计的方法(PoseCNN).如下图所示,输入图像经过卷积层特征提取之后,分成三个任务分支:语义分割.平移矩阵预测和旋转矩阵(四元数)预测.最 ...

  4. 论文阅读笔记:CcNet: A cross-connected convolutional network for segmenting retinal vessels using 多尺度特征

    论文链接:CcNet: A cross-connected convolutional network for segmenting retinal vessels using multi-scale ...

  5. 【论文阅读笔记】Pyramid Real Image Denoising Network

    论文简介   本文是19年的论文,网络名为PRIDNet.代码地址为https://github.com/491506870/PRIDNet.在1080ti上,PRIDNet处理512x512图像需要 ...

  6. 论文阅读笔记《DPGN: Distribution Propagation Graph Network for Few-shot Learning》

    小样本学习&元学习经典论文整理||持续更新 核心思想   本文提出一种基于图神经网络的小样本学习算法(DPGN).先前基于图神经网络的小样本算法通常将每个样本当作一个结点,然后通过结点之间的关 ...

  7. DCP(Deep Closest Point)论文阅读笔记以及详析

    DCP论文阅读笔记 前言 本文中图片仓库位于github,所以如果阅读的时候发现图片加载困难.建议挂个梯子. 作者博客:https://codefmeister.github.io/ 转载前请联系作者 ...

  8. CVPR2019|Depth-Aware Video Frame Interpolation【论文阅读笔记】

    CVPR2019|Depth-Aware Video Frame Interpolation[论文阅读笔记] 作者 相关链接 1.前言 2.介绍 3.算法 4.实验 作者 Wenbo Bao, Wei ...

  9. 对抗训练-smart 论文阅读笔记

    对抗训练-smart 论文阅读笔记 SMART: Robust and Efficient Fine-Tuning for Pre-trained NaturalLanguage Models thr ...

  10. 【SOD论文阅读笔记】Visual Saliency Transformer

    [SOD论文阅读笔记]Visual Saliency Transformer 一.摘要 Motivation: Method: Experimental results 二.Introduction ...

最新文章

  1. php复选框关联数据库字段,通过php将复选框中的多个值插入数据库
  2. python 下载大文件
  3. android开发系列之多线程
  4. libevent源码学习-----event_base事件循环
  5. 数据采集提升性能篇-使用Mybatis的批量操作api导入数据
  6. JQuery 函数 操作
  7. python多线程教程_Python多线程编程教程【2小时学会】
  8. ubuntu 下更新pip后发生 ImportError: cannot import name 'main'的问题解决
  9. android window设置动画,android - 具有动画的Windowmanager
  10. nodejs生成UID(唯一标识符)——node-uuid模块
  11. WinAPI: SetRectEmpty、IsRectEmpty
  12. 大魔王覃超解说 2017 Google I/O丨今晚直播!
  13. UVA - 1588 Kickdown
  14. 使用双向链表构建二叉树_LeetCode-109 有序链表转换二叉搜索树
  15. jsp+ssm+mysql实现图书馆预约占座管理系统 代码+数据库脚本+论文+答辩稿+开题报告+任务书
  16. 无线测温系统在高低压开关柜内的运行---安科瑞 顾城
  17. 新浪产品管培生的结构化面试
  18. 惠普电脑打开BIOS的方法
  19. 家用服务器 无线路由器,评测六款热门家用Wi-Fi 6路由器
  20. 汇编语言与微机原理(1)基础知识

热门文章

  1. oracle加密表空间
  2. 微信公众平台 客服接口-发消息
  3. React Native重启APP
  4. 模拟退火算法的原理+应用
  5. SQL考点之存储过程、存储函数、游标
  6. Element-UI + Vue,java面试官常用问题
  7. 【问题】eletron引入flash显示“无法加载插件”
  8. 梦工厂将在红帽峰会畅谈云计算心得
  9. 黑客进行攻击中最重要的环节“信息收集”
  10. 关于Python中的编程,这篇阅读量预算10万+的文章可能是你见过的最完整的讲解