Deep Video Super-Resolution Network Using Dynamic Upsampling Filters Without Explicit Motion Compensation【隐式运动补偿的动态上采样滤波器的深度视频超分辨率网络】

  • 1. instroduction
  • 2. 相关工作
  • 3. 方法
    • 3.1 动态采样滤波器
    • 3.2 残差学习
    • 3.3 网络设计
    • 3.4 时间增长
  • 4. 实现
  • 5. 结果比较
  • 6. 网络训练

Dynamic Upsampling Filters Without Explicit Motion Compensation【隐式运动补偿的动态上采样滤波器的深度视频超分辨率网络】)

原文链接

1. instroduction

传统VSR:考虑多帧LR来得到一帧HR——运动估计和补偿,然后是上采样。
问题:结果严重依赖于运动估计的准确性;HR帧是通过CNN混合来自多个运动补偿输入LR帧,会导致HR模糊。

本文:运动信息用来隐式生成动态的上采样滤波器,对输入中心帧进行局部滤波直接构建HR帧。
优点:不依赖显式运动的计算和直接组合来自多个帧的值,可以获得更清晰和时间一致的HR视频

2. 相关工作

  • SISR:单图像的超分放大
  • VSR:视频超分放大
    ① BRCN:三种卷积——用于空间依赖性的前馈卷积,用于长期实践依赖性的循环卷积,用于长期的上下文信息的条件卷积;
    ② DECN:采用一个无迭代的框架来减少运动估计的计算量
    ③ VSRnet:手工设计的光流算法作为预处理来运动补偿,然后喂入一个深度SR网络
    ④ VESPCN: 在不同LR之间估计光流,通过一个学习过的CNN,通过空间变换器扭曲帧,最后通过深度网络生成HR
    ⑤ Liu et al. [24]: 时间自适应神经网络,得到不同的半径,自适应使用这个不同时间半径的运动信息
    ⑥ Tao et al. [34]:使用④VESPCN中的运动估计,然后提出一个亚像素的运动补偿层来同时运动补偿和上采样;对于之后的SR网络,编码-解码类型的网络,用来加速训练;ConvLSTM模型被使用,因为视频时序列数据(?)

以上端到端的CNN都是基于VSR方式,聚焦于准确的运动估计和补偿,这与本文的方法是不同的

3. 方法

N为时间半径,r为放大倍率
输入(2N+1)HWC
输出1
rHrWC


问题:如果是实时超分放大,应该无法获取到t到t+N帧,或者说这只是用来网络学习训练


图2:(3,3)像素,通过倍率=4放大后,产生在区域(12,12)-(15,15),通过16个生成滤波器来产生这16个像素

框架:输入中心帧首先通过Ft局部滤波,然后残差Rt被加到上采样结果Yt中

3.1 动态采样滤波器

传统的滤波器都是采样固定的滤波器组合,比如对于倍率=4的SR,就采用固定的16个固定内核,快但很难恢复锐利和有纹理的区域。

半径N=3,滤波器尺寸5*5,最后,每一个输出HR像素,都是LR的一个像素经过局部滤波得到:其中y,x为LR的坐标

v,u是r*r输出块的坐标

之前基于深度学习的SR:DL通过特征空间的一系列卷积来学习重建HR帧
本文:使用DL来学习最佳的上采样滤波器,并直接从LR得到HR
原理:动态滤波器是根据像素运动创建的,因为滤波器通过查看时间-空间的相邻像素生成,使我们能够避免显式运动补偿。

3.2 残差学习

滤波器仍然只是输入像素的加权求和,需要额外估计残差学习来增加高频细节。
[17]中是将残差加到双三次上采样基线来产生最终输出。但因为残差是多个输入帧得到而不是单个,本文使用动态上采样帧作为更好的基线。

3.3 网络设计

采用3D卷积代替2D卷积:在人类动作识别和视频数据上的通用时空特征提取中更加适合,

3.4 时间增长

训练和现实相应的数据(用来得到更多的数据):时间轴随机旋转反转,TA用来表示间隔采样(间隔太大,VSR性能会降低,因为位移变大)

4. 实现

  • 数据集
    351个视频:包含野生动物、活动和景观
    训练集:采样16000:144*144
    验证集:使用4个视频,Val4——Derf收藏的海岸警卫队、工头、花园和哈士奇
    测试集:vid4

  • 训练
    高斯滤波器+下采样(倍率r)得到LR视频(32*32)
    变量初始化参照==[8]==
    cost function:来收敛
    cost function和lost fuction的区别

5. 结果比较

  • 定量
    Ours-28L比Ours-16L多了0.2M参数量
  • 定性
    纹理和细节更加清楚

6. 网络训练

Code of Deep VSR Network

文献阅读2:Deep Video Super-Resolution Network相关推荐

  1. 图像超分辨率:小米低功耗超分,适用于移动端Extreme Low-Power Super Resolution Network For Mobile Devices

    4. ELSR: Extreme Low-Power Super Resolution Network For Mobile Devices 小米的论文,网络很简单很快,训练步骤比较多.

  2. [文献阅读]A deep neural network for unsupervised anomaly detection and diagnosis in MTSD

    A Deep Neural Network for Unsupervised Anomaly Detection and Diagnosis in Multivariate Time Series D ...

  3. 文献阅读三—Deep Text Classification Can be Fooled

    题目:Deep Text Classification Can be Fooled 作者:Bin Liang, Hongcheng Li, Miaoqiang Su, Pan Bian, Xirong ...

  4. 【FER文献阅读】Deep Facial Expression Recognition: A Survey (Shan Li and Weihong Deng)

    论文链接:https://arxiv.org/abs/1804.08348 参考文章:https://cloud.tencent.com/developer/news/231750 这篇是北京邮电大学 ...

  5. 【文献阅读】 Deep Learning-Based Channel Estimation in OFDM Systems

    2019 IEEE https://arxiv.org/abs/1810.05893 代码:https://gitee.com/joannne/ChannelNet Pilot Pattern Des ...

  6. [video super resolution] ESPCN论文笔记

    ESPCN是twitter2017年提出来的实时视频超分辨率的方法.下面记录下对论文的一些理解. 上面这张图就是整个网络的架构.输入t帧的相邻图像,t-1和t+1,在具体的网络中,有输入连续3张,5张 ...

  7. 文献阅读 2018 Deep Retinex Decomposition for low-light Enhancement

    一.名词解释   以下名词按照在论文中出现的先后顺序列出,如果不是,当我没说: CNN:Convolutional Neural Networks 卷积神经网络.An algorithm based ...

  8. 文献阅读总结:网络表示学习/图学习

    本文是对网络表示学习/图学习(Network Representation Learning / Graph Learning)领域已读文献的归纳总结,长期更新. 朋友们,我们在github创建了一个 ...

  9. DUF:Deep Video Super-Resolution Network Using Dynamic Upsampling Filters ...阅读笔记

    DUF:Deep Video Super-Resolution Network Using Dynamic Upsampling Filters Without Explicit Motion Com ...

最新文章

  1. python读取excel部分值存入另一个excel-python3读取excel文件只提取某些行某些列的值方法...
  2. 030_jQuery Ajax的get方法
  3. 全能系统监控工具dstat
  4. EOS 智能合约源代码解读 (6)合约之action
  5. sql注入-union select
  6. Microsoft Sync Framework 2.1 软件开发包 (SDK)
  7. Oracle 的学习方法
  8. Java从入门到精通——调错篇之SVN 出现 Loced错误
  9. CDH-5.7.0:基于Parcels方式离线安装配置
  10. (73)信号发生器DDS三角波设计(一)(第15天)
  11. mysql 修改字段长度_面试官:InnoDB记录存储结构都不知道,你敢说你懂MySQL?
  12. wpf menuitem 点击控件元素_一招教你如何在WPF界面开发时自定义外观,快来Get
  13. 学习参考《高性能MySQL(第3版)》中文PDF+英文PDF
  14. 海康设备如何接入萤石开放平台
  15. 网页文字提取插件-网页文字提取器
  16. 腾讯裁员范围扩大;研究称人类或能喝到月球冰火水;苹果考虑取消京东方3000万块屏幕订单;近视手术无法治愈近视
  17. 论坛数据库的几种建表----年度项目拙计有感(前半部分转)
  18. python入门教程陈孟林_适用于小白的 python 快速入门教程
  19. python span()函数_Python正则表达式六种函数实例讲解
  20. LinuxMint 桌面美化

热门文章

  1. zhs16gbk java_oracle11g 修改字符集 修改为ZHS16GBK
  2. 从ABC模式入手的合理情绪疗法
  3. 2021年中国伺服放大器市场趋势报告、技术动态创新及2027年市场预测
  4. 视频教程-2017年软上半年软考网络工程师级别考前冲刺之第四天-软考
  5. ADAMS中的常用问题精选(转载)
  6. 举例说明:学编程和培养编程思维有什么联系?
  7. Android自定义View,高仿QQ音乐歌词滚动控件!
  8. JavaScript之BOM和DOM入门
  9. 使用H-lua框架制作魔兽争霸地图(5-物编-单位篇)
  10. ui设计设计软件_60秒的UI设计