Introduction

单应矩阵估计方法(传统+deep learning)

本文的工作

auxiliary loss function: compares the dynamic mask from the ground-truth dynamics map that is estimated from the training data.

Related Work

1.Pixel-based approaches

直接搜索使得两张图片对齐误差最小的单应矩阵

已有的误差度量和参数搜索算法(层次估计、傅立叶对齐)能够使得这些方法强大高效。

适用情况: 对缺乏纹理的图像具有鲁棒性,但难以处理 较大运动

2.Feature-based approaches
  1. 使用算法(eg.SIFT and SURF)估计局部特征点
  2. 在两张图片间匹配特征点
  3. 对于一对匹配点,可基于 p1=Hp2p_1=Hp_2p1​=Hp2​ 求解最小二乘问题来获得最佳单应矩阵

注意: 特征匹配时可能会产生错误,特征点可能会来自移动的对象,因此常使用RANSAC和Magsac等鲁棒估计算法来去除异常值。

适用情况: 该方法的性能取决于局部特征的检测和匹配,不太适用于模糊和缺乏纹理的图像

3.Deep learning approaches

以上方法 仅基于静态场景下取得成功,没有考虑动态场景

4.本文 multi-scale neural network 的改进
  1. 相较于之前的hierarchical neural network的工作,我们的method从输入图像的低分辨率版本开始,逐渐增加输入图像的大小,而非在每个阶段都以原始输入图像作为input,这使得我们的方法相对于大运动更加稳健。
  2. 相较于之前的Lucas_Kanade layer的工作,我们的method使用前一阶段估计的单应矩阵将输入图像预先对齐到下一阶段,以最小化全局运动。这有助于后期网络解决全局运动
  3. 加入a dynamics mask network来处理动态场景。<之前的neural network-based未考虑的>

Experiments

评估指标:the mean corner error

ec=14∑j=14∣∣cj−cj^∣∣2e_c=\frac{1}{4}\sum_{j=1}^{4}||c_j-\hat{c_j}||_2ec​=41​j=1∑4​∣∣cj​−cj​^​∣∣2​

其中,cjc_jcj​ 是 cornerjcorner\ jcorner j 通过estimated homography变换得到的,cj^\hat{c_j}cj​^​ 是 cornerjcorner\ jcorner j 通过 ground-truth homography得到的。

训练集的影响

我们分别在动态场景的静态版本和动态版本上训练了homography network

动态区域大小的影响

Discussions

Scale selection

An important hyper-parameter of our multi-scale neural network:number of scales

Real-World videos

  1. 我们使用合成数据集进行训练,并在NUS stabilization benchmark的video进行了测试
  2. 实验结果显示我们的网络可以很好的应用于真实视频,并且可以通过检查dynamics masks来识别动态内容
Parallx

视差的简单解释:把手指放在据眼睛较近的地方,分别用左右两只眼睛看手指,会发现他们的位置不一样,用数学方式把这个差距计算出来,就是视差。

在上述真实世界的视频中我们发现我们的网络也可以处理视差。

我们在optical flow benchmarks的数据集 Middlebury和Sintel 上进行测试:

  1. 使用我们的method来估计两个帧之间的homography
  2. 使用计算出的homography将这两个帧对齐
  3. 计算两个对齐的帧之间的光流

光流法(optical flow)简介


(c)中对齐后背景中几乎没有运动,而靠近相机的物体没有对齐,这表明,当我们把foreground objects也当作异常值(像dynamic object一样)去除之后,就能够找到一个homography来处理在尽可能大的区域里的运动。

我们的method就是通过检测 foreground objects 并也把它视作outliers进行处理。

Conclusion

1.收集了一个动态场景的大型视频数据集,并建造了合成数据集
2.开发了一个multi-scale,multi-stage deep neural network
3.用静态的MS-COCO数据集进行训练和测试,可以处理大型全局运动并获得最新的单应矩阵估计结果
4.用我们建造的dynamic-scene dataset训练网络,在一定程度上可以处理动态场景
5.我们的deep homography neural networks可以处理 动态场景、模糊场景、缺乏纹理 等图像。

Deep Homography Estimation for Dynamic Scenes 论文笔记相关推荐

  1. Deep Anomaly Detection with Deviation Networks 论文笔记

    Deep Anomaly Detection with Deviation Networks 论文笔记(自己回顾用) 问题描述 算法框架 伪代码 总结&个人计划 问题描述 论文利用少部分有标签 ...

  2. Unsupervised Monocular Depth Estimation With Left-Right Consistency 论文笔记

    文 | 陈十三 公众号首发 | 一只在路上的哈士奇 公众号ID | super_Mrchen 关注可了解更多.问题或建议,请公众号留言 0x00 补充知识 1.视差:左右双目图像中,两个匹配块中心像素 ...

  3. Deep Learning on Graphs: A Survey论文笔记

    Deep Learning on Graphs: A Survey 问题 术语表示 词汇说明 摘要信息 文章框架 主要内容 读出操作 什么是读出操作(readout operation) 读出操作要求 ...

  4. A Survey on Deep Learning for Named Entity Recognition论文笔记

    前言:研究课题定为特定领域的命名实体识别,所以先阅读一篇综述,在此简单记录阅读过程. 摘要 在文章中,首先介绍现有的NER资源,包括标记的NER语料库及现成的NER工具,然后对现有的工作进行了分类:输 ...

  5. DynaSLAM论文笔记

    DynaSLAM: Tracking, Mapping and Inpainting in Dynamic Scenes 论文笔记 +++ 这是一种建立在ORB-SLAM2上的视觉SLAM系统,同时增 ...

  6. MCAN论文进阶——MoVie: Revisting Modulated Convolutions for Visual Counting and Beyond 论文笔记

    MCAN论文进阶--MoVie: Revisting Modulated Convolutions for Visual Counting and Beyond 论文笔记 一.Abstract 二.引 ...

  7. 论文笔记(三):PoseCNN: A Convolutional Neural Network for 6D Object Pose Estimation in Cluttered Scenes

    PoseCNN: A Convolutional Neural Network for 6D Object Pose Estimation in Cluttered Scenes 文章概括 摘要 1. ...

  8. 论文解读:Deep High Dynamic Range Imaging of Dynamic Scenes

    Deep High Dynamic Range Imaging of Dynamic Scenes Abstract 这篇文章介绍了一种在动态场景中,如何将不同曝光的图像进行融合从而得到高动态图像的方 ...

  9. 论文笔记【A Comprehensive Study of Deep Video Action Recognition】

    论文链接:A Comprehensive Study of Deep Video Action Recognition 目录 A Comprehensive Study of Deep Video A ...

  10. ISP图像对齐(二):Deep Image Homography Estimation

    提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言 一.4-点式建模与其利弊 二.原理过程 三.训练与效果 总结 前言 ISP 图像对齐笔记(二):Deep Image ...

最新文章

  1. TensorFlow中的random_normal()函数
  2. keepalived mysql集群_keepalived + Mysql(主主)实现高可用集群
  3. python 统计2^2^2^2^2的各数字出现次数
  4. 最小生成树与最短路径的区别以及实现方法
  5. MySQL面试题 数据库设计三范式
  6. centos6.x 安装php5.6 tar,CentOs6.x安装php5.6.x Web程序 - 贪吃蛇学院-专业IT技术平台
  7. 1 数列分块入门_线性代数入门——关于分块矩阵的典型证明题与综合题
  8. 从源码角度解释 fragment 坑(一)
  9. NodeJs——(14)express框架的send()方法简介
  10. Aspx页面内 成员变量丢失的问题
  11. POJ 2923 Relocation(状压DP)题解
  12. 实用干货!正交试验设计及极差分析步骤总结!
  13. po vo pojo domain 区别
  14. Qt开发技术:Qt的动态静态插件框架介绍和Demo
  15. Anaconda4.5.1+tensorflow2.1.0+keras2.3.1+theano+Mingw+python3.6安装总结
  16. Junit新语法assertThat
  17. 根据微信号,生成微信公众号二维码
  18. 河南理工大学2018暑假集训第二次积分赛 2018/07/29
  19. iMazing管理和下载应用程序
  20. 初探从C到Win32汇编之系列二

热门文章

  1. stc15f2k60s2单片机控制led流水灯
  2. 互联网人:最熟悉的陌生人
  3. 当初我要是这么学习操作系统就好了(附带思维导图)
  4. 学习如何搭建SpringBoot框架
  5. F28335的SCI模块
  6. dorado7 动态生成图片
  7. poi实现word转html并返回html内容(Java版)
  8. mysql 中文转拼音(简拼/全拼) 支持多音
  9. 哔哩哔哩服务器在哪个文件夹,哔哩哔哩在手机哪个文件夹
  10. python3爬虫爬取网页图片简单示例