AI视频插帧 附带『视频插帧』工具

视频插帧工具来啦!
下载链接在最下面。

前言

  • 继视频抠图工具以来,本人又考虑制作一款视频插帧的工具,最近一直在改各种问题(头都大了- _ -),还好该来的终于来了(^ _ ^)。现在自媒体越来越流行,很多人都开始自己做个小视频玩玩,各大视频平台也都开放了高刷视频功能。这次的灵感也就来源于之前搜了一搜目前视频插帧的工具和方法,要么下载各种乱七八糟的软件,要么就是折腾好一阵效果还是差强人意,总之很麻烦还浪费时间。于是还是想弄个几键就开始处理的,不需要配置太多就能用的工具。
  • 所以,我就搜集了一下目前插帧常用的方法,基本都是基于光流法,网上一搜基本都是用SVP4的视频渲染软件,把视频提到60帧,但是这个下载和配置太麻烦了,而且仅仅也就60帧,再想提高就得掏money了。
  • 之前看过一篇《Super SloMo: High Quality Estimation of Multiple Intermediate Frames for Video
    Interpolation》论文。于是想在其基础上优化一下,弄个轻量一点的模型。奈何效果还是有限,电脑跑了好久模型,处理速度还是太慢了。由于本人电脑用的nvidia显卡cuda加速,可能目前还有大部分电脑只能用cpu处理,所以速度太慢了。如果有人仅需处理一小段视频的话,可以下载用一用。

提示:工具缺点就是处理速度较慢,还有一些功能后续再完善。


一、视频插帧效果

最终实现:帧数翻倍
效果:在每帧图片较为清晰的情况下,效果还是可以的。但是是在图像较为模糊、两段视频转场时,效果还是差强人意。

1.效果

运动一般较为模糊,也是受影响较大的部分,由于原始视频帧就比较模糊,所以仅仅是提升了高刷新率的模糊帧,但是观感还是更舒服了一点,如果原始视频质量高的话,效果就会更好。

1.1 原始30fps 1.2 120fps

总结:相较于其他方法,使用较为简便,但是由于每个人电脑配置不同,移植到不同设备上可能会有不同的bug,如果能用GPU加速的就用,如果不能用GPU的,我就不太建议视频插帧了,因为处理速度太慢了。目前视频插帧的普遍问题就是处理速度,这个受硬件限制太大了。但是你电脑不支持GPU加速也想尝试一下的话,我也加入了取消勾选GPU的按键,利用cpu来处理,但仅供娱乐了。


二、采用的方法

  作者原代码同样为pytorch环境上训练的类Unet结构模型。根据生成的双向光流与伪标签构建的无监督模型,这里供上人家的[文章]。对于这个模型,本人对其进行轻量化改进,引入MobileNet的可分离卷积,使得处理速度与模型大小稍有改进,但还是有限。
  训练所使用的数据集使用了adobe240fps,对其进行了处理。采用的损失包括了:重建损失(lr)、感知损失(lp)、平滑损失(ls)和wrap损失。对于可用GPU的cuda加速的情况,我对模型数据采用半精度来提升处理速度,模型结构也稍作改变。但还是胳膊拧不过大腿,对于这种图像生成的模型,需要消耗比较多的时间。
  由于基于torch框架,其所占空间较大,所以这次的工具占的空间也就较大。


三、使用步骤

判断GPU是否可用

如何判断电脑是否支持GPU cuda加速:
1.首先是nvidia品牌,且cuda版本>=10.2,安装好显卡驱动。
2.其次可通过按下win+R组合键,打开cmd命令窗口。输入nvidia-smi命令,查看CUDA Version版本。如果CUDA Version<=10.2,尝试更新显卡驱动,看看显卡是否支持更高版本的cuda。

直接打开Interpolation tool by CS.exe,选择安装位置进行安装,并生成桌面快捷方式,然后可以直接打开。

1.Data选择

  • Input Dir:选择所需处理的视频;
  • Output Dir:选择保存位置文件夹;

2.Advance设置

  • GPU:选择是否使用GPU。默认勾选,(如果运行时报错,可尝试判断自身显卡是否支持cuda10.2版本以上加速,若支持可尝试更新显卡驱动提升cuda版本;若不支持就取消勾选,采用cpu处理,但是速度非常慢);
  • BatchSize:选择批处理大小。一般太大会爆显存或内存,自己尝试找到适合自己电脑的最大值(一般不超过5);
  • ScaleRate:帧率提升的倍数。一般30帧视频可以选择设置为3倍,提升至90帧(帧数提升倍数越多,处理时间也会跟着翻倍,所以超过120帧就没必要了);

主界面

3.Start Run

  • 点击Run按钮开始处理,可通过命令行窗口查看当前处理进度(注意处理时不要关闭这个窗口)。
  • 如果不想处理了,可以点击Stop按钮结束处理进程。

最终输出为output(+audio).mp4视频。


4.错误提示的解决
错误一:

不支持显卡GPU cuda加速。 根据上面的方法:判断GPU是否可用,来自行判断。如果不支持GPU,则取消勾选GPU按钮再尝试重新运行。

错误一

错误二:

BatchSize设置太大了,爆显存、内存了,尝试调小。如果调到2还是爆内存,那就是电脑配置不行了。

错误二

错误三:

Input DirOutput Dir 输入、输出路径没有选择。

错误三

成功运行:

分别显示的是:完成百分比已运行时间预计剩余时间

成功运行

总结

工具可从网盘获取,提取码:1210
目前bug较多,处理速度和效果有限,硬件依赖大,仅供娱乐。
制作不易,主界面有个小彩蛋,可以打赏一下呦,感激不尽!
如果大家喜欢的话,后面可以考虑再出个增强图片、视频分辨率的工具,让你的人像与场景更加清晰!

AI视频插帧 附带『视频插帧』工具相关推荐

  1. 【ROM定制】Android 12 制作『MIUI官改』那点事④修改

    作者:小谢 内容:「MIUI官改」的修改 时间:2022.10.14 机型:小米10 安卓:Android 12 版本:V13.0.7.0稳定版 制作『MIUI官改』③工具:查看链接 -------- ...

  2. 商汤插帧算法让视频顺滑如丝丨NeurIPS 2019 Spotlight论文

    点击我爱计算机视觉标星,更快获取CVML新技术 自相机被发明以来,人们对更高画质视频的追求就没有停止过. 分辨率从480p,720p,再到1080p,现在有了2K.4K:帧率也从25FPS到60FPS ...

  3. 120帧手机动态壁纸_OPPO Find X2支持独立芯片视频动态插帧,30帧以下可升至120帧...

    OPPO将于3月6日举办发布会,并于会上正式带来全新的OPPO Find X2系列旗舰新机.关于这次将要到来的OPPO Find X2系列,此前OPPO副总裁沈义人已多次进行新机剧透预热.现在随着OP ...

  4. 直播那么火,视频安防公司也想插一脚

    近日视频安防公司万佳安在深圳召开发布会,推出了WorthCloud视频云平台,"值得看"直播电商平台和直播摄像机X6.万佳安是一家有十多年历史的视频安防解决方案公司,去年11月在新 ...

  5. anyRTC加持AI,打造下一代实时音视频引擎

    前言: 伴随着音视频技术高速发展,直播行业异军突起,在社交.娱乐.电商.教育.医疗等领域高歌猛进.当下,5G和AI时代已至,音视频技术已经上升到一个全新的高度,新场景.新应用.新标准也必将出现.any ...

  6. 程序员用 AI 修复百年前的老北京视频后,火了!

    公众号关注 "GitHubDaily" 设为 "星标",带你了解技术圈内新鲜事! 最近,一个 "修复老北京街道" 的视频刷屏全网. 一段由加 ...

  7. python(二)进阶之cv2读取视频文件或摄像头,并进行保存帧图像或视频

    版本 # 4.5.1 python import cv2 cv2.__version__ 函数 # 参数0表示默认为笔记本的内置第一个摄像头,如果需要读取已有的视频则参数改为视频所在路径, # 例如: ...

  8. 让手机跑SOTA模型快8倍!Facebook AI开源最强全栈视频库:PyTorchVideo!

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 来源丨新智元 编辑丨极市平台 导读 时隔一年,Facebook AI ...

  9. [AI开发]基于深度学习的视频多目标跟踪实现

    据我目前了解掌握,多目标跟踪大概有两种方式: Option1 基于初始化帧的跟踪,在视频第一帧中选择你的目标,之后交给跟踪算法去实现目标的跟踪.这种方式基本上只能跟踪你第一帧选中的目标,如果后续帧中出 ...

最新文章

  1. CDN技术之--流媒体CDN系统的组成
  2. WPF 绕圈进度条(一)
  3. java统计空间占用_如何计算Java对象占用了多少空间?
  4. python中astr是啥_python 基础 之 字符串
  5. 给定数组,查找最小的k个元素或最大的k个元素
  6. php streamsocketenablecrypto,PHPMailer发送邮件报错Msg:stream_socket_enable_crypto():
  7. 运筹学matlab实例,运筹学与MATLAB应用答案
  8. 《赤裸裸的统计学》读后感
  9. 触发器详解——(一)D触发器
  10. 磁盘分区怎么恢复回去?易我分区大师恢复丢失分区
  11. 阿里云RDS Serverless测评
  12. the little schemer 笔记(0)
  13. 臀部无论大小,翘起才是王道。
  14. 萌新扫盲4—交换机级联?还是堆叠?
  15. pl330 dmac驱动分析1--数据结构
  16. 通过Vue+flvjs在HTML5中播放flv格式视频文件—demo及api
  17. js随机跳转域名_从代码角度看各类子域名收集工具
  18. schedule_delayed_work()
  19. sql的update语句 批量更新某字段
  20. ZYNQ PS与PL通信之DMA

热门文章

  1. MaxWell的使用
  2. 普元eos中jsp无法自动编译
  3. android 自动化测试
  4. 运营商大数据到底有什么意义?
  5. 11g-sql plan management
  6. rtu中所采用的计算机,什么是RTU,有哪些作用?
  7. android 日历 周显示,按周显示的日历和按月显示的日历,你需要吗
  8. 《非暴力沟通》[1]
  9. laravel框架下载指定版本
  10. 采用CXF框架发布WebService