论文:https://arxiv.org/pdf/2103.15683.pdf

单位:武汉大学、哈尔滨工业大学、武汉工程大学

译者言:

本文可以看做是PFNL(同一作者)的续作。LOVSR是将PFNL和混合架构的结合,GOVSR是PFNL和双向混合架构的结合。虽然模型在Vid4上最高可以达到28.41dB,但是训练数据集与大众不同,虽然作者最后也在Vimeo-90K中进行了实验,但是并没有给出在Vid4等测试集上的测试结果,具体数据还得等代码开源后进行额外测试。

看点

滑动窗口方法(a)只能通过增加窗口大小来获得更多的相邻LR帧,而忽略了先前估计的SR输出。循环(b)和混合(c)框架只利用了以前的隐藏状态,不能利用后续帧来帮助恢复。

本文提出了一个全知框架(OVSR),不仅可以利用前面的SR输出,还可以利用现在和将来的SR输出。所提出的全知框架可以进一步分为两类:局部全知(LOVSR)(d)和全局全知(GOVSR)(e)。

局部全知框架单向处理视频帧,而全局全知框架双向处理视频帧。全局全知框架允许LR帧从同视频的所有帧中接收信息,但是它不适用于实时超分,而局部全知框架适合。

方法

OVSR overview

如(d)和(e)所示,OVSR框架主要包含两个子网络:前驱网络后继网络

首先通过LR帧生成帧和所有时间步长的隐藏状态,然后借助相应的LR帧和估计的隐藏状态重构所有帧。最后将前导和后继产生的SR帧进行细化,重建最终的SR输出。

LOVSR的和在同一个时间方向上处理视频,这意味着它只能利用过去和现在的信息,以及未来有限数量的帧。反转的方向来设计GOVSR,任何LR帧都可以访问同一视频序列中的所有帧。

网络结构

为了将PFRB与全知框架相结合,本文对PFRB进行了改进,使其包含3个通道,如下图所示:

首先采用一个卷积层来融合相应的LR帧和隐藏状态。途中3个特征通道分别包含了过去、现在和未来的信息。

然后,在残差块(作者自定义)中,分别提取这3个通道的特征并将其合并在一起。在网络的末端,来自这3个通道的特征被卷积层处理以获得隐藏状态。最后将放大到,和来自的SR帧相加以重构最终的SR输出。

其中,上采样模块由2个卷积层组成,每个卷积层后跟一个sub-pixel卷积操作。的结构与相差不大,具体如上图。的过程可以描述为:

注意,在GOVSR中为,而LOVSR应为。的过程可以描述为:

由于两个网络结构相似,本文人为的定义主要学习低频结构,主要学习帧内的高频细节。使用Charbonnier损失函数来进行制约:

α用来调整的权重。

实验

消融实验

不同权重α的消融实验:

不同残差块数量的消融实验:

量化评估

作者在MM522数据集上重新实现这些VSR方法,在Vid4上的量化评估:

使用Vimeo-90K数据集进行训练,然后在Vimeo-90K-T上的测试量化评估,低于BasicVSR

超分速度和参数量等实验如下图,本文提出的最轻量的模型可以在720P的视频中完成实时超分。

备注:超分辨率

超分辨率交流群

图像视频超分辨率,可见光、红外、遥感超分辨率等技术,

若已为CV君其他账号好友请直接私信。

我爱计算机视觉

微信号:aicvml

QQ群:805388940

微博知乎:@我爱计算机视觉

投稿:amos@52cv.net

网站:www.52cv.net

在看,让更多人看到  

720P实时超分和强悍的恢复效果:全知视频超分OVSR相关推荐

  1. 计算高效,时序一致,超清还原!清华NYU 提出 RRN:视频超分新型递归网络

    原文链接:https://bbs.cvmart.net/articles/3158 专注计算机视觉前沿资讯和技术干货 微信公众号:极市平台 官网:https://www.cvmart.net/ 本文为 ...

  2. 揭开“视频超分”黑科技的神秘面纱

    在看电影时,有一幕大家应该都非常熟悉,警察从证据图片中选取一块区域放大,再放大,直到一个很小的目标变得清晰可见,从而发现重要的线索.现实中是不是真的有这样的技术,可以把模糊的小图变得清晰?答案是,一定 ...

  3. NTIRE2021 视频超分竞赛简要回顾

    编辑:Happy 首发:AIWalker 本文对NTIRE2021视频超分竞赛进行了简单的介绍,总而言之一句话:BasicVSR是最大赢家. Dataset NTIRE2021的视频超分竞赛仍然延续N ...

  4. 综述丨视频超分辨率研究方法

    看点 近年来,深度学习在很多领域取得了进展,其中包括视频超分辨率任务.本文是第一个也是唯一一个视频超分方向的综述,主要看点如下: 1)回顾了基于深度学习的视频超分技术的研究进展: 2)提出了一种基于深 ...

  5. 26FPS在线输出720P视频的视频超分模型:DAP

    作者单位:苏黎世联邦理工.鲁汶大学.维尔兹堡大学 论文链接:https://arxiv.org/pdf/2202.01731v1.pdf 编者言:不同于现阶段VSR的两大热点研究方向:真实世界/盲VS ...

  6. 刷新视频超分新记录28.41dB!一种全局视频超分方案OVSR

    导读 本文是武汉大学&哈尔滨工业大学&武汉理工在视频超分领域的一次突破性的成果.在深入分析多帧超分.递归超分以及混合框架超分存在的问题之后,本文创造性的提出了同时利用过去和未来隐状态的 ...

  7. 26 fps 的视频超分辨率模型 DAP!在线输出720P视频

    关注公众号,发现CV技术之美 单位:苏黎世联邦理工.鲁汶大学.维尔兹堡大学 论文:https://arxiv.org/pdf/2202.01731v1.pdf 编者言:不同于现阶段VSR的两大热点研究 ...

  8. 在Vid4上突破28dB大关!视频超分新的里程碑:IconVSR

    BasicVSR:The Search for Essential Components in Video Super-Resolution and Beyond BasicVSR:在视频超分组件上的 ...

  9. 28.41dB,视频超分最新力作:PFNL+双向信息传播=OVSR

    paper:https://arxiv.org/abs/2103.15683 本文是武汉大学&哈尔滨工业大学&武汉理工在视频超分领域的一次突破性的成果.在深入分析多帧超分.递归超分以及 ...

最新文章

  1. 如何提高3D点云目标检测的难例精度?
  2. 用树莓派的方式打开小米手机:摇晃手机控制小车,前进后退加转弯,成本不到350元 | 开源...
  3. .net中的socket异步通信实现--客户端代码
  4. 考试系统(未完成的小程序)
  5. [iOS]应用内支付(内购)的个人开发过程及坑!
  6. 解决:Error response from daemon: Get https://index.docker.io/v1/search?q=openjdkn=25: dial tcp: looku
  7. C#获取文件(磁盘驱动器)的关联图标(使用API SHGetFileInfo)
  8. typedef四用途与两陷阱
  9. python io多路复用框架_python之IO多路复用
  10. EasyUI的组件加载两次的问题
  11. pic系列单片机c语言编程与应用实例,PIC系列单片机C语言编程与应用实例
  12. arcgis出界址点成果表_勘测定界界址点坐标成果表(TXT文件)
  13. 批量导入AD账户批量启用Exchange 账户步骤
  14. Qt-FFmpeg开发-保存视频流裸流(11)
  15. APS系统的现状以及与MES系统的关联
  16. 行深智能亮相乌镇互联网大会,荣获直通乌镇全球互联网大赛一等奖
  17. 使用AMCap调整相机参数
  18. linux中kvm配置文件,如何在linux中通过kvm安装虚拟机
  19. GridView ItemTemplate 格式
  20. matplotlib之2017各产业第一季度国民生产总值饼图

热门文章

  1. CSU 1573 最多的数字
  2. Linux学习笔记13
  3. ZZULIOJ21级新生周赛(1)——命题人:朱会东老师——2822: 探姬粉丝众多
  4. php要求输入是个数求平均值、_Excel表格技巧—如何在 Excel 中快速完成求和、平均值、百分比...
  5. java 线程参数 用final,JAVA 关于final修饰变量参数
  6. 如何用r语言搜集报表_基迪奥免费小课堂——如何用R语言绘制GSEA plot
  7. python rtsp转换为图片_化异为同,Python 在背后帮你做的转换
  8. SQL数据库不用SQL语句能显示全表的内容_2020别再说你了解数据库了,你搞清楚这些问题了吗?...
  9. 【tool】kali linux关于postgresql的使用
  10. 微信公众号sae服务器搭建,SAE 搭建微信公众平台