点击上方“AI算法与图像处理”,选择加"星标"或“置顶”重磅干货,第一时间送达

从事算法岗经常需要查看最新的研究成果,希望从中能借鉴一些别人的思路。

全世界每天更新的成果太多了,我们没有办法仔细研读每一篇文章,而从摘要入手,获取文章研究的主要内容和成果,与自己目前的需求对比,是否吻合,再决定是否详细研读,无疑能节省大量的时间。

本文将介绍CVPR 2021 视频插帧相关主题的三篇论文,如果你喜欢这样的分享,欢迎给我一个三连鼓励,后续会分享更多其他主题的研究成果。

论文已经放在:

https://github.com/DWCTOD/CVPR2021-Papers-with-Code-Demo

CDFI: Compression-Driven Network Design for Frame Interpolation

论文:https://arxiv.org/abs/2103.10559

代码:https://github.com/tding1/CDFI

基于DNN的帧插值生成给定两个连续帧的中间帧通常依赖具有大量特征的重型模型架构,从而防止它们部署在资源有限的系统上,例如移动设备。提出了一种基于压缩驱动的帧插值网络设计方法,该方案利用模型修剪通过稀疏引入优化,在显著减小模型尺寸的同时,实现了良好的性能。具体地说,我们首先压缩了最近提出的ADACF模型,并证明了一个10×压缩AdaCoF的性能与原始的对应物类似;然后,通过引入多分辨率翘曲模块,进一步改进了压缩模型,提高了多层次细节的视觉一致性。因此,与原ADACF相比,我们仅获得了四分之一的规模,从而获得了显著的性能增益。此外,我们的模型在广泛的数据集中与其他技术状态相比表现良好。最后,所提出的压缩驱动框架是通用的,可以很容易地转换到其他基于dnn的帧插值算法。

主要贡献:

我们提出了一个压缩驱动的视频插值框架,在该框架中,我们对过度参数化进行了反思。我们首先压缩AdaCoF并获得一个紧凑的模型,但性能同样好,然后在其上进行改进。CDFI的pipline 如图2所示。这种回溯的方法导致了优越的性能,可以很容易地转移到任何其他基于DNN的帧插值算法。

Deep Animation Video Interpolation in the Wild

论文:https://arxiv.org/abs/2104.02495

代码:https://github.com/lisiyao21/AnimeInterp/

在动画产业中,动画视频通常以较低的帧速率制作,因为手工绘制这样的帧既昂贵又耗时。因此,开发能够在动画帧之间自动插值的计算模型是可取的。然而,现有的视频插值方法对动画数据的插值效果并不理想。与自然视频相比,动画视频具有两个独特的特点,使得帧插值困难:1)卡通包含线条和平滑的色彩片段。平滑区域缺少纹理,因此很难在动画视频中估计出精确的运动。2) 卡通通过夸张来表达故事。有些运动是非线性的,而且非常大。本文首次对动画视频插值问题进行了形式化的定义和研究。为了应对上述挑战,我们提出了一个有效的框架AnimeInterp,其中包含两个从粗到精的专用模块。具体而言,1)分段引导匹配通过利用分段相干的颜色片段之间的全局匹配来解决“缺少纹理”的挑战。2) 递归流细化解决了“非线性和超大运动”的挑战,通过使用变压器式结构的递归预测。为了便于全面的训练和评估,我们建立了一个大规模的动画三胞胎数据集ATD-12K,该数据集包含12000个三胞胎和丰富的注释。大量实验表明,该方法优于现有的动画视频插值方法。值得注意的是,AnimeInterp在野外动画场景中表现出良好的感知质量和鲁棒性。

整体架构:

本文的主要贡献如下:

1)首次对动画视频插值问题进行了形式化的定义和研究。这个问题对学术界和工业界都有重要意义。

2) 针对动画中纹理不足和非线性运动量大的问题,提出了一种有效的动画插值框架&动画插值框架,该框架由两个专用模块组成。大量实验表明,AnimeInterp在数量和质量上都优于现有的最新方法。

3) 我们建立了一个大规模的卡通三元组数据集ATD-12K,该数据集具有代表多种动画类型的大内容多样性,用于测试动画视频插值方法。鉴于ATD-12K的数据量和丰富的注释,它将为今后的动画研究铺平道路

FLAVR: Flow-Agnostic Video Representations for Fast Frame Interpolation

论文/paper:https://arxiv.org/abs/2012.08512 | 主页 | Homepage

代码/code:https://github.com/tarun005/FLAVR

视频帧插值的大多数方法都是计算图像相邻帧之间的双向光流,然后采用合适的扭曲算法生成输出帧。然而,依赖光流的方法往往无法直接从视频中模拟遮挡和复杂的非线性运动,并引入了不适合广泛部署的额外瓶颈。我们利用FLAVR解决了这些限制,它是一种灵活高效的架构,使用3D时空卷积来实现视频帧插值的端到端学习和推理。我们的方法有效地学习非线性运动、复杂遮挡和时间抽象的推理,从而提高了视频插值的性能,同时不需要以光流或深度图的形式进行额外的输入。由于它的简单性,FLAVR可以提供3个×与目前最精确的多帧插值方法相比,在不损失插值精度的情况下,推理速度更快。此外,我们在广泛的具有挑战性的环境中评估了FLAVR,并在各种流行的基准(包括Vimeo-90K、UCF101、DAVIS、Adobe和GoPro)上与先前的方法相比,一致地证明了优越的定性和定量结果。最后,我们证明用于视频帧插值的FLAVR可以作为一个有用的自我监督任务,用于动作识别、光流估计和运动放大。

整体框架:

效果对比:

主要贡献:

1)我们提出了一种用于视频帧插值的可伸缩、无流、高效的3D CNN架构FLAVR。据我们所知,FLAVR是第一个既不受光流影响,又能进行单镜头多帧预测的视频帧插值方法。

2)在多个标准benchmark上,FLAVR在数量和质量上优于或可与当前方法相比较,包括Vimeo-90K、UCF101、DAVIS、Adobe和GoPro,同时在视频插值图1和图3a)1的准确性和推理速度方面提供最佳权衡

3)我们证明了由FLAVR自主学习的视频表示可以用于各种下游任务,如动作识别、光流估计和运动放大

个人微信(如果没有备注不拉群!)
请注明:地区+学校/企业+研究方向+昵称下载1:何恺明顶会分享
在「AI算法与图像处理」公众号后台回复:何恺明,即可下载。总共有6份PDF,涉及 ResNet、Mask RCNN等经典工作的总结分析
下载2:终身受益的编程指南:Google编程风格指南
在「AI算法与图像处理」公众号后台回复:c++,即可下载。历经十年考验,最权威的编程规范!
下载3 CVPR2021在「AI算法与图像处理」公众号后台回复:CVPR,即可下载1467篇CVPR 2020论文 和 CVPR 2021 最新论文

点亮 ,告诉大家你也在看

丝滑!CVPR 2021 视频插帧论文+开源代码汇总相关推荐

  1. CVPR2021 行人重识别/Person Re-identification 论文+开源代码汇总

    点击上方"AI算法与图像处理",选择加"星标"或"置顶"重磅干货,第一时间送达 行人重识别(Person re-identification ...

  2. 【深度学习】2021 最新视频防抖论文+开源代码汇总

    大家好,今天给大家分享,今年三篇关于视频防抖的文章,这三篇文章分布采用了不同的方法来解决视频抖动的问题. 1.基于深度的三维视频稳定学习方法Deep3D稳定器 2.融合运动传感器数据和光流,实现在线视 ...

  3. 视频插帧(Video Frame interpolation)论文及源码

    视频插帧论文列表(含Code) 蓝色突出表示热门方法 CCF A AAAI 2019 CyclicGen:Deep Video Frame Interpolation Using Cyclic Fra ...

  4. CVPR 2022 | 腾讯优图实验室30篇论文入选,含场景文本语义识别、3D人脸重建、目标检测、视频场景分割和视频插帧等领域...

    关注公众号,发现CV技术之美 本文转载自腾讯优图 近日,CVPR 2022官方公布了接收论文列表(CVPR 2022 接收论文公布! 总计2067篇!),来自腾讯优图实验室共计30篇论文被CVPR收录 ...

  5. CVPR 2022|上海交大腾讯优图提出IFRNet:视频插帧新范式新SOTA

    点击下方卡片,关注"CVer"公众号 AI/CV重磅干货,第一时间送达 点击进入-> CV 微信技术交流群 IFRNet: Intermediate Feature Refi ...

  6. CVPR 2023 | EMA-VFI: 基于帧间注意力提取运动和外观信息的高效视频插帧

    ©作者 | Guozhen Zhang 单位 | 南京大学媒体计算组 本文介绍南京大学媒体计算组最近被 CVPR 2023 接收的视频插帧方向的工作:Extracting Motion and App ...

  7. 视频插帧—学习笔记(算法+配置+云服务+Google-Colab)

    恰好碰到同学项目需要,了解了一下关于利用深度学习视频插帧的相关知识,在这里做一个简单的记录. 目录 一.方法+论文 1.DAIN (Depth-Aware Video Frame Interpolat ...

  8. 深度学习MEMC插帧论文列表paper list

    整理一下深度学习用于运动估计和运动补偿的论文列表.大致按照内容与时间区分.鉴于工作量太大,而且MEMC这块点击量很少,就不介绍文章内容了. 认准原创:https://blog.csdn.net/lon ...

  9. 开源视频插帧软件DAIN使用教程

    文章目录 第一波 linux下实现DAIN的方法 windows使用DAIN-APP 第二波来了 先提供两个网址 github项目下载 DAIN-APP(windows)官方下载地址 关于DAIN的介 ...

最新文章

  1. 万年历的设计c语言,万年历设计报告
  2. Netty原理三:NioEventLoop如何处理客户端连接
  3. 软件架构的数据流总结(三)
  4. Programming with gtkmm 3
  5. Jackson相关的一些注解
  6. listview 每行后面的小箭头_主卧带小衣帽装修,这几个装修方案,你喜欢哪个?...
  7. 好的飞鸽传书2007对于对外的API
  8. fiddler设置中文版本_突破安卓7.0以上版本WX小程序抓包篇
  9. c6011取消对null指针的引用_COM编程攻略(二十二 IDL中的枚举,指针,数组)
  10. python 线程池 锁_python 线程池和锁
  11. JAVA 反射(JAVA面试题)
  12. iTOP4412 uboot移植教程
  13. matlab imagesc jet,matlab imagesc
  14. 类似京东商城筛选模块
  15. 拉卡拉支付最新支付方式预览——刷脸支付上线
  16. Redis学习(三) - Redis客户端对比及配置(SpringBoot)
  17. 计算机上机考试自我检查800字,【考试太差 自我反省检讨书800字】_考试成绩差自我反省检讨书范文3篇...
  18. Oracle的直方图
  19. 十一届蓝桥模拟赛 元素之间最大的元素距离 JAVA
  20. 我的毕业四年总结及对未来的期许!

热门文章

  1. html给div加圆角边框,border-radius是向元素添加圆角边框的方法
  2. alfred 常用搜索_如何使用Alfred完善macOS的Spotlight搜索
  3. 中介模式(python实现2)
  4. 互联网安全初创企业Cylance获 1 亿美元融资
  5. Java应用系列之Pinyin4j简单使用教程
  6. Android使用keytool-importkeypair生成一个系统签名,只要打包的时候使用该签名,便可以获得系统所有权限
  7. Markdown设置字体大小、颜色、类型、加粗
  8. linux 冒号用法
  9. GAIN: Missing Data Imputation using Generative Adversarial Nets学习笔记
  10. zipentry java_java.util.zip 类 ZipEntry - Java 中文参考手册