BasicVSR:The Search for Essential Components in Video Super-Resolution and Beyond

BasicVSR:在视频超分组件上的搜索和超越

论文:https://arxiv.org/pdf/2012.02181.pdf

作者单位:南洋理工大学、腾讯PCG应用研究中心、香港中文大学-商汤科技联合实验室

看点

本文把改进的双向循环神经网络加入进了超分架构,在Vid4测试集上突破了28dB,亮点如下:

1.本文把视频超分(VSR)看做由四个基本构件组成:传播、对齐、融合、上采样。通过对这些组件的重用和部分修改,构建了一个BasicVSR模型。

2.对BasicVSR进一步进行扩展,添加了一个信息再填充机制和一个耦合传播方案,实现了更好性能的IconVSR,达到了SOTA。



BasicVSR

BasicVSR采用经典的双向循环神经网络。上采样模块U包含卷积和Pixel-shuffle。S、W、R分别为流估计模块、空间扭曲模块和残差块。

传播

现有的传播可分为三大类:局部传播、单向传播和双向传播。

局部传播 :滑动窗口方法在局部窗口中使用LR进行局部信息恢复,由于忽略了远处的帧,从而限制了恢复效果。

上图中K表示将测试集分为几个单独的片段去供局部窗口处理,虚线为全局窗口,表明远距离帧有利于信息的恢复。

单向传播 :第一帧除了自身之外不从视频序列接收信息,而最后一帧从整个序列接收信息。这种不平衡的方法使得靠前的帧的重建效果不佳。

可以看出,更靠前的帧的重建效果越差。(但是对于最后高出虚线的那部分,本文没有给出解释)

双向传播:对比上述,BasicVSR采用双向传播的方式。双向循环网络的前后传播如下(双向传播就无法做到实时超分了,需要把所有的帧都输入才能开始输出,这是双向的弊端,本文未提)

对齐

主流的对齐可分为三大类:无对齐,图像对齐和特征对齐。

无对齐:在实验中去掉了BasicVSR中的空间对齐模块。在这种情况下,我们直接连接不对齐的特征进行恢复。接收场相对较小的卷积等局部操作在从相应位置聚集信息时效率低下。PSNR下降了1.19db。(RRN没有采用对齐,并且是单向传播,PSNR值只差了0.27dB,此处数据需要验证)

图像对齐:图像对齐通过计算光流和在恢复之前扭曲图像来执行对齐。我们在BasicVSR上比较了图像扭曲和特征扭曲。由于光流估计的不精确性,扭曲后的图像不可避免地会出现模糊和不正确的问题。PSNR下降了0.17db。

特征对齐:对比上述,Basic采用光流对特征进行扭曲配准,然后输入进多个残差块进行细化。

其中,R表示多个残差块。

聚合和上采样

采用多个卷积作为聚合模块,Pixel-shuffle作为上采样模块。

IconVSR

以BasicVSR为主干,引入了两个新的组件:信息再填充机制和耦合传播(IconVSR),以减少传播过程中的错误积累,促进信息聚合。

信息再填充

如上图(a)所示,使用额外的特征提取器从输入帧及其相邻帧的子集中提取深度特征。然后将提取的特征与对齐后的特征通过卷积进行融合

其中E和C分别对应特征提取器和卷积。表示所选关键帧的索引集。然后,细化的特征被传递到残差块进行进一步细化。

耦合传播

为了利用序列中的信息,提出了一种耦合传播方案,其中传播模块是相互连接的。如上图(b)所示,在耦合传播中,将后向传播的特征也作为正向传播模块的输入。

通过耦合传播,正向传播分支接收来自过去和未来帧的信息,从而获得更高质量的特性。

此外,由于耦合传播只需要改变分支连接,因此可以在不引入计算开销的情况下获得性能增益。(增加了input的chanel不增加计算开销吗?)

实验

数据集与设置

REDS的其中一部分作为测试集和验证集,其余和Vimeo-90K同时作为训练集。

对测试集使用BI和BD两种方式进行测试。使用预训练的SPyNet和EDVR-M作为流量估计模块和特征提取器。损失使用Charbonnier损失。

消融实验

对IconVSR两个提出的组件的消融实验

对 数量的实验

量化评估

END

备注:超分辨率

超分辨率交流群

图像视频超分辨率,可见光、红外、遥感超分辨率等技术,

若已为CV君其他账号好友请直接私信。

我爱计算机视觉

微信号:aicvml

QQ群:805388940

微博知乎:@我爱计算机视觉

投稿:amos@52cv.net

网站:www.52cv.net

在看,让更多人看到  

在Vid4上突破28dB大关!视频超分新的里程碑:IconVSR相关推荐

  1. 刷新视频超分新记录28.41dB!一种全局视频超分方案OVSR

    导读 本文是武汉大学&哈尔滨工业大学&武汉理工在视频超分领域的一次突破性的成果.在深入分析多帧超分.递归超分以及混合框架超分存在的问题之后,本文创造性的提出了同时利用过去和未来隐状态的 ...

  2. NTIRE2021 视频超分竞赛简要回顾

    编辑:Happy 首发:AIWalker 本文对NTIRE2021视频超分竞赛进行了简单的介绍,总而言之一句话:BasicVSR是最大赢家. Dataset NTIRE2021的视频超分竞赛仍然延续N ...

  3. 业内视频超分辨率新标杆!快手大连理工研究登上CVPR 2022

    来源:量子位 [导读]本文从一种新的视角统一了视频超分辨中的低分辨率和高分辨率的时序建模思路,提出了一种新的视频超分辨框架,以较小的计算代价,充分利用了低分辨和高分辨率下的时序互补信息.已在多个公开数 ...

  4. 28.41dB,视频超分最新力作:PFNL+双向信息传播=OVSR

    paper:https://arxiv.org/abs/2103.15683 本文是武汉大学&哈尔滨工业大学&武汉理工在视频超分领域的一次突破性的成果.在深入分析多帧超分.递归超分以及 ...

  5. 入选CVPR 2022!一举打败16个同类模型,视频超分比赛冠军算法!

    来源:量子位 如何让模糊的老片变高清? AI的答案是超分辨率算法: 现在,在视频超分领域,有一个强大的算法拿下了超分比赛NTIRE 2021三冠一亚的优异成绩,登上了CVPR 2022. 它的名字叫做 ...

  6. 一举打败16个同类模型,视频超分比赛冠军算法入选CVPR 2022,来自商汤南洋理工大学...

    丰色 发自 凹非寺 量子位 | 公众号 QbitAI 如何让模糊的老片变高清? AI的答案是超分辨率算法: 现在,在视频超分领域,有一个强大的算法拿下了超分比赛NTIRE 2021三冠一亚的优异成绩, ...

  7. 计算高效,时序一致,超清还原!清华NYU 提出 RRN:视频超分新型递归网络

    原文链接:https://bbs.cvmart.net/articles/3158 专注计算机视觉前沿资讯和技术干货 微信公众号:极市平台 官网:https://www.cvmart.net/ 本文为 ...

  8. 视频超分中的自监督适应方案

    关注公众号,发现CV技术之美 本文分享论文『Self-Supervised Adaptation for Video Super-Resolution』,通过采样半监督的方式训练VSR网络,并为知识蒸 ...

  9. 视频超分:TGA(Video Super-resolution with Temporal Group Attention)

    论文:视频超分与时域注意机制 文章检索出处:2020 CVPR 摘要和简介 提出了一种新颖的神经网络,通过帧速率组以分层的方式有效的融合了时空信息. 介绍了一种快速空间对齐方法去处理大规模运动的视频. ...

最新文章

  1. MAC OS X的ACL扩展权限设置
  2. Cell:康奈尔大学郭春君组开发针对非模式肠道细菌的基因编辑工具
  3. 安装配置mysql-proxy
  4. HDU 2079 选课时间
  5. a bytes-like object is required, not 'str' pickle.loads pickle.dumps
  6. 七日存留查询(MYSQL)
  7. linux 之 rpm 网站
  8. 基于Boost::beast模块的协程HTTP服务器
  9. 08产品经理要明白的人性思维-团队管理篇
  10. Python精通-Python列表操作
  11. springboot使用curator来实现leader选举
  12. 渴望整成“卡戴珊” 澳大利亚年轻女性以整容为荣
  13. CentOS下安装两个或多个Tomcat7
  14. Java学生成绩信息管理系统
  15. 机器学习—确定系数R2
  16. 量子计算机大致原理,通俗简介量子计算机原理
  17. 以自己的电脑作为服务器,搭建网站,外网可访问
  18. 认识USB Type-C Type-CB Type-A 接口
  19. 【荐号】有了它们,成功创业,成就事业巅峰,迎娶白富美,指日可待!
  20. 电容放电特性分析τ=RC的推导

热门文章

  1. FFmpeg--命令详解
  2. c语言终极面试宝典 pdf,C语言终极面试--编程
  3. 百练 04 简单的整数划分问题
  4. 腾讯云对象存储 python_GitHub - fushall1104/cos-python3-sdk: 腾讯云对象存储服务(cos)Python3.5版本SDK...
  5. C# 数组增加元素_C#的集合类型及使用技巧
  6. ai作文批改_好未来:AI智能批改中英文作文为老师“减负”
  7. python赋值浅拷贝和深拷贝的区别_浅拷贝、深拷贝和普通赋值操作有什么区别?...
  8. mysql limit 表的长度_mysql中的limit用法有哪些(推荐)
  9. 电脑html外链加密,WordPress 无需插件外链加密转内链
  10. matlab plot 多种颜色_Matlab画图,只需要这几步