Deep Homography Estimation for Dynamic Scenes 论文笔记
Introduction
单应矩阵估计方法(传统+deep learning)
本文的工作
auxiliary loss function:
compares the dynamic mask
from the ground-truth dynamics map that is estimated from the training data.
Related Work
1.Pixel-based approaches
直接搜索使得两张图片对齐误差
最小的单应矩阵
已有的误差度量和参数搜索算法(层次估计、傅立叶对齐)能够使得这些方法强大高效。
适用情况:
对缺乏纹理的图像具有鲁棒性,但难以处理 较大运动
2.Feature-based approaches
- 使用算法(eg.SIFT and SURF)估计局部特征点
- 在两张图片间匹配特征点
- 对于一对匹配点,可基于 p1=Hp2p_1=Hp_2p1=Hp2 求解最小二乘问题来获得最佳单应矩阵
注意:
特征匹配时可能会产生错误,特征点可能会来自移动的对象
,因此常使用RANSAC和Magsac等鲁棒估计算法来去除异常值。
适用情况:
该方法的性能取决于局部特征的检测和匹配
,不太适用于模糊和缺乏纹理的图像
3.Deep learning approaches
以上方法 仅基于静态场景下取得成功,没有考虑动态场景
4.本文 multi-scale neural network 的改进
- 相较于之前的
hierarchical neural network
的工作,我们的method从输入图像的低分辨率版本开始,逐渐增加输入图像的大小,而非在每个阶段都以原始输入图像作为input,这使得我们的方法相对于大运动更加稳健。 - 相较于之前的
Lucas_Kanade layer
的工作,我们的method使用前一阶段估计的单应矩阵将输入图像预先对齐到下一阶段,以最小化全局运动。这有助于后期网络解决全局运动 - 加入
a dynamics mask network
来处理动态场景。<之前的neural network-based未考虑的>
Experiments
评估指标:the mean corner error
ec=14∑j=14∣∣cj−cj^∣∣2e_c=\frac{1}{4}\sum_{j=1}^{4}||c_j-\hat{c_j}||_2ec=41j=1∑4∣∣cj−cj^∣∣2
其中,cjc_jcj 是 cornerjcorner\ jcorner j 通过estimated homography
变换得到的,cj^\hat{c_j}cj^ 是 cornerjcorner\ jcorner j 通过 ground-truth homography
得到的。
训练集的影响
我们分别在动态场景的静态版本和动态版本上训练了homography network
动态区域大小的影响
Discussions
Scale selection
An important hyper-parameter
of our multi-scale neural network:number of scales
Real-World videos
- 我们使用合成数据集进行训练,并在NUS stabilization benchmark的video进行了测试
- 实验结果显示我们的网络可以很好的应用于真实视频,并且可以通过检查dynamics masks来识别动态内容
Parallx
视差的简单解释:
把手指放在据眼睛较近的地方,分别用左右两只眼睛看手指,会发现他们的位置不一样,用数学方式把这个差距计算出来,就是视差。
在上述真实世界的视频中我们发现我们的网络也可以处理视差。
我们在optical flow benchmarks的数据集 Middlebury和Sintel 上进行测试:
- 使用我们的method来估计两个帧之间的homography
- 使用计算出的homography将这两个帧对齐
- 计算两个对齐的帧之间的光流
光流法(optical flow)简介
(c)中对齐后背景中几乎没有运动,而靠近相机的物体没有对齐,这表明,当我们把foreground objects也当作异常值(像dynamic object一样)去除之后,就能够找到一个homography来处理在尽可能大的区域里的运动。
我们的method就是通过检测 foreground objects 并也把它视作outliers进行处理。
Conclusion
1.收集了一个动态场景的大型视频数据集,并建造了合成数据集
2.开发了一个multi-scale,multi-stage deep neural network
3.用静态的MS-COCO数据集进行训练和测试,可以处理大型全局运动并获得最新的单应矩阵估计结果
4.用我们建造的dynamic-scene dataset
训练网络,在一定程度上可以处理动态场景
5.我们的deep homography neural networks
可以处理 动态场景、模糊场景、缺乏纹理 等图像。
Deep Homography Estimation for Dynamic Scenes 论文笔记相关推荐
- Deep Anomaly Detection with Deviation Networks 论文笔记
Deep Anomaly Detection with Deviation Networks 论文笔记(自己回顾用) 问题描述 算法框架 伪代码 总结&个人计划 问题描述 论文利用少部分有标签 ...
- Unsupervised Monocular Depth Estimation With Left-Right Consistency 论文笔记
文 | 陈十三 公众号首发 | 一只在路上的哈士奇 公众号ID | super_Mrchen 关注可了解更多.问题或建议,请公众号留言 0x00 补充知识 1.视差:左右双目图像中,两个匹配块中心像素 ...
- Deep Learning on Graphs: A Survey论文笔记
Deep Learning on Graphs: A Survey 问题 术语表示 词汇说明 摘要信息 文章框架 主要内容 读出操作 什么是读出操作(readout operation) 读出操作要求 ...
- A Survey on Deep Learning for Named Entity Recognition论文笔记
前言:研究课题定为特定领域的命名实体识别,所以先阅读一篇综述,在此简单记录阅读过程. 摘要 在文章中,首先介绍现有的NER资源,包括标记的NER语料库及现成的NER工具,然后对现有的工作进行了分类:输 ...
- DynaSLAM论文笔记
DynaSLAM: Tracking, Mapping and Inpainting in Dynamic Scenes 论文笔记 +++ 这是一种建立在ORB-SLAM2上的视觉SLAM系统,同时增 ...
- MCAN论文进阶——MoVie: Revisting Modulated Convolutions for Visual Counting and Beyond 论文笔记
MCAN论文进阶--MoVie: Revisting Modulated Convolutions for Visual Counting and Beyond 论文笔记 一.Abstract 二.引 ...
- 论文笔记(三):PoseCNN: A Convolutional Neural Network for 6D Object Pose Estimation in Cluttered Scenes
PoseCNN: A Convolutional Neural Network for 6D Object Pose Estimation in Cluttered Scenes 文章概括 摘要 1. ...
- 论文解读:Deep High Dynamic Range Imaging of Dynamic Scenes
Deep High Dynamic Range Imaging of Dynamic Scenes Abstract 这篇文章介绍了一种在动态场景中,如何将不同曝光的图像进行融合从而得到高动态图像的方 ...
- 论文笔记【A Comprehensive Study of Deep Video Action Recognition】
论文链接:A Comprehensive Study of Deep Video Action Recognition 目录 A Comprehensive Study of Deep Video A ...
- ISP图像对齐(二):Deep Image Homography Estimation
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言 一.4-点式建模与其利弊 二.原理过程 三.训练与效果 总结 前言 ISP 图像对齐笔记(二):Deep Image ...
最新文章
- TensorFlow中的random_normal()函数
- keepalived mysql集群_keepalived + Mysql(主主)实现高可用集群
- python 统计2^2^2^2^2的各数字出现次数
- 最小生成树与最短路径的区别以及实现方法
- MySQL面试题 数据库设计三范式
- centos6.x 安装php5.6 tar,CentOs6.x安装php5.6.x Web程序 - 贪吃蛇学院-专业IT技术平台
- 1 数列分块入门_线性代数入门——关于分块矩阵的典型证明题与综合题
- 从源码角度解释 fragment 坑(一)
- NodeJs——(14)express框架的send()方法简介
- Aspx页面内 成员变量丢失的问题
- POJ 2923 Relocation(状压DP)题解
- 实用干货!正交试验设计及极差分析步骤总结!
- po vo pojo domain 区别
- Qt开发技术:Qt的动态静态插件框架介绍和Demo
- Anaconda4.5.1+tensorflow2.1.0+keras2.3.1+theano+Mingw+python3.6安装总结
- Junit新语法assertThat
- 根据微信号,生成微信公众号二维码
- 河南理工大学2018暑假集训第二次积分赛 2018/07/29
- iMazing管理和下载应用程序
- 初探从C到Win32汇编之系列二