关注公众号,发现CV技术之美

作者单位:西电、鹏城实验室

论文链接:https://arxiv.org/pdf/2103.11744.pdf

编者言: 视频超分辨率(VSR)任务中第一个设计对偶学习的方案,多阶上采样的方法和添加对偶子网与对偶损失可以参考与学习

01

看点

本文的主要亮点如下:

1.提出了一种针对大运动VSR的对偶子网和多阶通信上采样(DSMC)网络,该网络旨在最大限度地实现VSR过程中各种决定性信息的通信,并隐式捕获运动信息。所提出的基于三维卷积的U形密集残差网络(U3D-RDN)模块可以从输入的视频帧中学习到从粗到细的时空特征,从而有效地指导大运动的VSR处理。

2.提出了一个对偶子网,可以模拟自然图像退化,减少解空间,增强泛化能力,帮助DSMC更好地训练。

02

方法

Overview

DSMC包含一个VSR子网(MSCU)和一个对偶子网,如下图所示:

模型首先对输入的2m+1帧进行可变形卷积,进行粗特征提取。然后输出的特征图通过可变形残差网络(DResNet)处理,在考虑时间特征之前提取精细的空间信息。

然后,将特征图输入到三维卷积u形密集残差网络 (U3D-RDN)中,进行时空特征降维和相关分析。接着是另一个DResNet模块,特征图被送到MSCU模块。最后,DSMC利用对偶子网进行训练,得到HR帧。

U3D-RDN

U3D-RDN实现了精细隐式MEMC和粗空间特征提取,降低了计算复杂度,如下图:

利用一个3×3的2D卷积对输入特征进行下采样编码,在编码空间上进行残差学习后,通过亚像素卷积层对残差映射进行上采样解码。其中3D DenseBlock和Transition层的结构如下:

MSCU

MSCU充分利用上采样阶段的先验知识来恢复HR帧,架构如下图:

在MSCU中,为了充分利用先验信息,我们将VSR的上采样过程分解为更小的上采样过程。例X4的上采样任务可以分解为两个连续的上采样任务,这使网络有能力去捕捉每个阶段中相应的不定性去尝试恢复。

上采样后的剩余图由两个分支处理,一个是通过ResNet进行特征修正来生成,另一个是通过1×1卷积进行通道缩减,与双三次上采样的中心帧进行相加,生成的修复帧,随后被1X1卷积虚拟化,虚拟化的结果与在通道上叠加,通过1X1卷积进行融合,生成下阶段的残差图。

对偶子网

设计了一个对偶子网来约束解空间。对偶问题为恢复VSR输出的退化结果使其尽可能接近LR帧。本文提出的对偶子网模拟了真实图像的退化过程,包括模糊、降采样和噪声。

具体来说,模糊和下采样过程分别由两个3×3的2D卷积(C2D)完成,噪声通过下采样C2D的偏置值添加到退化帧中。对偶损失是输入帧和在对偶子网的输出帧之间进行计算的。那么DSMC的总损失由VSR子网的损失和两部分组成,为:

研究表明,更严格的对偶机制可以更好的恢复原任务的反向过程,因此这里的两部分损失使用相同的损失函数(Cb损失和感知损失)来限制和到相同的分布。

03

实验

消融实验 
不同组件的消融实验,表示通信::

不同的对偶损失的消融实验:

定量评估 
不同方法在VID4测试集上的定量评估:

定性评估 
不同方法在VID4测试集上的定性评估

END

欢迎加入「三维视觉交流群

AAAI2021 大运动“视频超分辨”中的对偶子网与多阶通信上采样方案相关推荐

  1. CVPR2022 | 无需对齐就能胜任大运动超分的内存增强非局部注意方法

    作者单位:京东探索研究院 论文链接:https://arxiv.org/abs/2108.11048 代码链接:https://github.com/jiy173/MANA 笔者言: 如何对齐是VSR ...

  2. 大数据架构和模式(五):利用大数据识别保险行业中的欺诈业务案例

    大数据架构和模式(五):利用大数据识别保险行业中的欺诈业务案例 [复制链接]     pig2 1232 主题 2069 帖子 1万 积分 超级版主 积分 11358 收听TA 发消息 电梯直达 楼主 ...

  3. 网络蛋白质组学在计算机中应用,蛋白质组学及其相关技术在运动人体科学中的应用...

    摘要: 目的:对蛋白组学及蛋白芯片技术发展现状进行综述,为该技术在运动医学中的应用提供参考资料.资料来源:应用计算机检索PubMed2003-01/2006-12期间相关蛋白组学及蛋白芯片技术方面的文 ...

  4. 龙瀛:大数据在城市设计中的应用(附演讲视频)

    来源:北京城市实验室BCL 今天为大家分享的是2022国地云讲堂期间清华大学建筑学院龙瀛老师在"智慧+"专场分享的<大数据在城市设计中的应用>报告,本文内容根据现场录音 ...

  5. 国防科大提出基于可变形三维卷积的视频超分辨,代码已开源

    原文链接:https://bbs.cvmart.net/articles/3041 专注计算机视觉前沿资讯和技术干货 微信公众号:极市平台 官网:https://www.cvmart.net/ 视频是 ...

  6. 国防科大提出基于可变形三维卷积(D3Dnet)的视频超分辨,代码已开源

    视频是具有时间连续性的图像集合,其中每帧图像的上下文信息(空域信息)与不同帧之间的互补信息(时域信息)都有助于提升视频超分辨的性能. 近日,来自国防科技大学的学者提出基于可变形三维卷积的视频超分辨网络 ...

  7. 国防科大提出基于可变形三维卷积(D3DNET)的视频超分辨

    视频是具有时间连续性的图像集合,其中每帧图像的上下文信息(空域信息)与不同帧之间的互补信息(时域信息)都有助于提升视频超分辨的性能. 近日,来自国防科技大学的学者提出基于可变形三维卷积的视频超分辨网络 ...

  8. D3Dnet:基于可变形三维卷积的视频超分辨,编译好的D3DNet可行变卷积python文件已经放在我的CSDN下载资源---->D3D.so

    视频是具有时间连续性的图像集合,其中每帧图像的上下文信息(空域信息)与不同帧之间的互补信息(时域信息)都有助于提升视频超分辨的性能. 近日,来自国防科技大学的学者提出基于可变形三维卷积的视频超分辨网络 ...

  9. 2021综述:视频监控中的多目标跟踪

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 来源丨CV技术指南 作者丨仿佛若有光 前言 本文来自一篇2021的论文,论文简要回顾了现有的SOTA模 ...

最新文章

  1. golang mysql 基本操作
  2. mat opencv 修改roi_OpenCV中如何提取不规则ROI区域
  3. 函数粘合云服务提供端到端解决方案
  4. [Tip]什么是3D 电影 和 4D立体电影?
  5. pae扩展内存 linux,Linux内核-内存管理-PAE(物理地址扩展)
  6. 视频号、抖音、海外Tiktok到底该选择那个平台更好
  7. 查看端口占用情况lsof,并关闭对应进程kill
  8. 使用idea练习springmvc时,出现404错误总结
  9. tensorflow.python.framework.errors_impl.NotFoundError: Could not find valid device for node.
  10. 高抗干扰低功耗LCD驱动芯片-VK2C21A/B/C/D,常用在电气类、工控类低功耗驱动上
  11. 弹簧优化设计MATLAB,基于Matlab的圆柱螺旋弹簧可靠性优化设计
  12. Oracle 解决中文乱码问题
  13. word批量转PDF
  14. 我奋斗了18年还是不能和你坐在一起喝咖啡(转)
  15. 【python】 实现排列组合公式
  16. Metro风格的CSS框架 BootMetro
  17. Ansys workbench分析应用基础(2)
  18. 如何使用left join,以及left join的分析
  19. 山河盟:人类为大地母亲准备的一份礼物
  20. 9.9元进群项目源码/付费进群源码含搭建教程以及微擎工具

热门文章

  1. java version 和javac版本不一致_windows安裝多個版本的jdk,解決java-version和javac-version版本不一致的問題...
  2. django连接MySQL报错Did you install mysqlclient?
  3. STM32 - 定时器的设定 - 基础- 06 - OCxREF signal - Clearing the OCxREF signal on an external event
  4. 在将varchar值id转换为int时失败_MySQL令人咋舌的隐式转换
  5. jquerymobile在手机上很小_手机如何建立自己的网站
  6. oracle必备文件,oracle初学者必备基础
  7. map写法 scala语言_(转)scala中map与flatMap浅析
  8. python今日内容_python笔记15
  9. pythondev更新到3_python版本升级到3.7
  10. linux修改ip配置文件_协助调试Linux服务器经验分享