近日,在NTIRE 2021比赛上,腾讯优图提出的LCVR-MQVI算法在Video Super-Resolution: Track 2 Spatial-Temporal赛道和Track 1 Spatial赛道上分别获得了冠军和亚军的成绩。

NTIRE比赛是图像与视频增强领域的权威比赛,由ETH Zurich(苏黎世联邦理工学院)的Computer Vision Laboratory组织,与CVPR2021共同举办。

这次腾讯优图同时参与了视频空间超分(video spatial super-resolution)和时空超分(video spatial-temporal super-resolution)两个赛道。其中,相比于传统的单图超分或者视频插帧,视频的时空超分可以同时提升视频的分辨率和帧率,带来更好的观看体验,因此也更具有实用价值,吸引了包括百度、字节跳动、旷视、华为等公司以及南洋理工、北大、上海交大、复旦等知名高校的参与。

针对本次比赛需要同时提升视频的分辨率和帧率的要求,通过大量的对比实验,最终我们确定了先超分后插帧的两阶段技术框架LCVR-MQVI。整体的框架如图1(d)所示,对于输入的低分辨率低帧率视频,我们首先通过提出的双向对齐超分网络LCVR进行超分,然后将超分后的图片送入改进的多尺度插帧网络MQVI进行插帧。下面我们分别对两部分的创新点进行介绍。

图1 LCVR-MQVI整体框架图

01

超分辨率框架LCVR

我们提出了一种新的超分辨率框架LCVR(Local to Context Video Super-Resolution),相比于其他单图超分以及视频超分框架,我们的LCVR可以更好地利用视频中的过去和未来的信息辅助当前帧的超分。具体来说,我们的方法有如下改进:

01

将多帧超分模型的local思想与视频超分模型中的context思想进行了结合,提出一种新的视频超分模型local to context;

02

在local部分,我们采用了EDVR模型,并进行了改进,例如将block替换为attention block等等。利用EDVR的DCN运动补偿,可以更好地利用前后帧LR输入的信息;

03

在context部分,我们在BasicVSR建模的基础上做了修改,我们将local的超分结果以及中间特征作为context的输入,优化local超分结果得到最终优化后的超分图像。另外在context的光流估计部分,我们使用PWCNet,通过计算前后local超分图像的光流信息,从而获得了更准确的光流结果。

02

插帧框架MQVI

我们提出了一种新的插帧框架MQVI(Multi-Level Quadratic Video Interpolation)。相比于大多数现有的基于线性假设估计中间帧光流状态的模型,我们的模型基于匀加速运动估计中间帧光流,因此可以更好地对真实世界中物体的运动进行拟合。同时,我们在QVI的基础上引入了coarse-to-fine的思想,通过多尺度网络对初识的预测结果进行不断的微调以实现更好的预测。具体来说,我们的MQVI相比于原始的QVI有以下的改进:

01

使用RAFT光流网络替换PWCNet以实现更精确的光流估计;

02

使用QVI的输出作为初始的中间帧,通过多尺度微调网络对初始中间帧进行不断的微调。多尺度微调网络的输入包括上一层网络的输出,当前尺度warp到中间帧的图像,输出则为对上一层输出结果进行微调的残差;

03

通过多尺度的输入训练策略使网络可以更好的适应不同程度的运动。

03

结果评估与可视化

图2 比赛结果

对于时空超分任务(track 2),我们提出的方法在比赛的测试集上取得了27.68dB的PSNR,领先第二名0.29dB,在空间超分任务上(track 1),我们提出的方法也取得了32.96dB的成绩,领先第三名0.29dB。

下面我们也对比赛测试集上的部分结果进行可视化,首先图3展示了LCVR的空间超分能力,其中左边为原始输入通过bicubic的方式进行上采样,右边则为我们的LCVR算法超分的结果。可以看到我们的方法由于可以利用视频的过去和未来的信息,得到了更加清晰的超分结果

图3 Bicubic上采样与LCVR空间超分效果对比

图5则展示了LCVR-MQVI模型在时空超分联合任务上的效果。相比于图4,我们的算法可以同时提高视频的分辨率和帧率

图4 LCVR-MQVI时空超分输入(插值放大播放效果)

图5 LCVR-MQVI时空超分效果

随着互联网的蓬勃发展,视频已经成为越来越多人获取资讯以及娱乐的方式。而短视频的出现让越来越多的人可以即时分享自己创作的内容。然而由于个人创作者创作设备还有方法的不专业以及大量早期生产的影视作品,互联网上存在着大量的低分辨率、低帧率的视频,影响着人们的观看体验。因此如果能通过自动化的算法将这些低质量的视频转换为高质量的视频具有重要的现实意义。

本文转载自腾讯优图。

END

备注:质量

图像增强与质量评价交流群

图像增强、去雾、去雨、图像修补、图像恢复等技术,

若已为CV君其他账号好友请直接私信。

我爱计算机视觉

微信号:aicvml

QQ群:805388940

微博知乎:@我爱计算机视觉

投稿:amos@52cv.net

网站:www.52cv.net

在看,让更多人看到  

腾讯优图提出LCVR-MQVI算法,勇夺NTIRE 2021双赛道冠亚军相关推荐

  1. 腾讯优图提出LAP无监督多视角人脸3D重建算法,高清还原面部细节

    编辑丨腾讯优图AI开放平台 近日,腾讯优图实验室提出无监督多视角人脸3D重建算法LAP(Learning to Aggregate and Personalize),摆脱人脸3D训练样本真值依赖,高清 ...

  2. 【论文解读】让特征感受野更灵活,腾讯优图提出非对称卡通人脸检测,推理速度仅50ms...

    该文是腾讯优图&东南大学联合提出一种的非对称卡通人脸检测算法,该方法取得了2020 iCartoon Face Challenge(Under 200MB)竞赛的冠军,推理速度仅为50ms且无 ...

  3. 深圳内推 | 腾讯优图实验室招聘计算机视觉算法工程师(校招/实习)

    合适的工作难找?最新的招聘信息也不知道? AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职! 腾讯优图 腾讯长期致力于社交平台与数字内容两大核心业务,积极拥抱产业互联网 ...

  4. CVPR 2022|上海交大腾讯优图提出IFRNet:视频插帧新范式新SOTA

    点击下方卡片,关注"CVer"公众号 AI/CV重磅干货,第一时间送达 点击进入-> CV 微信技术交流群 IFRNet: Intermediate Feature Refi ...

  5. 加速DeiT-S 60%+吞吐量!腾讯优图提出高性能Transformer加速方法

    ©PaperWeekly 原创 · 作者 | 小马 单位 | FightingCV公众号运营者 研究方向 | 计算机视觉 写在前面 视觉 Transformer(ViT)最近引起了非常大的热度,但巨大 ...

  6. 腾讯优图CVPR中标论文:不靠硬件靠算法,暗光拍照也清晰

    雷刚 发自 凹非寺  量子位 报道 | 公众号 QbitAI 暗光拍照也清晰,这是手机厂商目前激烈竞争的新拍照目标. 但除了堆摄像头和硬件,AI科学家带来算法方面的新突破. 他们提出基于深度学习优化光 ...

  7. 腾讯优图:AI内容理解新实践

    本文来源  腾讯优图实验室 近年来随着数字经济的高速发展和数字化转型进程的不断推进,AI技术在各个领域的应用落地也呈现出了大规模爆发的趋势.作为AI市场中的最大分支之一,计算机视觉的应用领域几乎涵盖了 ...

  8. 最新!腾讯优图联合厦门大学发布:2021十大人工智能趋势!无监督/多模态等热点...

    点击下方卡片,关注"CVer"公众号 AI/CV重磅干货,第一时间送达 本文转载自:腾讯优图 近日,2021全球人工智能技术大会在杭州成功举办,在计算机视觉论坛上,腾讯优图实验室副 ...

  9. 八年,腾讯优图攒了多厚的技术“家底”?

    2020-04-30 17:29:53 受访者 | 黄飞跃,优图实验室总监 记者 | 夕颜 出品 | CSDN(ID:CSDNnews) 「AI 技术生态论」 人物访谈栏目是 CSDN 发起的百万人学 ...

最新文章

  1. spring boot 项目源码_Spring Boot2 系列教程(三)理解 Spring Boot 项目中的 parent
  2. 操作系统实验报告18:硬盘柱面访问调度算法
  3. idea配置的导入导出
  4. 国内外独立IP行情及网站用独立IP优势面面观
  5. 字符编码过滤器中对特殊的路径进行特殊处理
  6. 使用LaTeX绘制列表(有的地方称作Num Item)
  7. oppoJava面试!mysql客户端安装包
  8. java线程抢占式执行,Java并发基础(一)-线程基础
  9. Android Studio GPU/CPU/Network/Memory monitor使用
  10. java2实用教程第五版耿祥义电子版_Java2实用教程(第5版)答案 耿祥义、张跃平
  11. 世界各国和地区名称代码(GB/T 2659-2000)
  12. 百度首页被tn劫持的办法有那些、两种解决百度劫持的方法
  13. Visio2016绘制框图的基本操作方法
  14. 经典C语言编程100例——题目+答案代码(完结)
  15. 联想重装系统去掉保护_联想硬盘保护系统7.6卸载后PE还原系统步骤
  16. 谷歌浏览器不能用_正在用 Chrome 或 Edge 浏览器的你,不能错过这亿个好用插件...
  17. USB NCM usbnet 枚举流程代码分析
  18. v-chart柱状图点击改变颜色
  19. 12-20210225华为海思Hi3518EV300在鸿蒙系统下测试WIFI(AP+STATION模式)
  20. kill word fore out

热门文章

  1. linux下mysql连接错误解决
  2. python 中【example[I] for example in dataset】的理解
  3. Ubuntu16.04 设置环境变量的方法
  4. Redis(数据类型及操作指令、Java连接Redis)
  5. CSU 1115 最短的名字
  6. 5调色板怎么打开_CAD打开较大的图纸就卡死的解决方法
  7. centos7源码安装mysql8.0_CentOS7下源码安装MySQL 8.x
  8. 怎么截取网页全图_FastStone Capture长截图怎么使用?滚动截图教程
  9. python中socket模块常用吗_python中socket模块详解
  10. mysql+性能优化+命令_MySQL 性能优化及常用命令