目录

大赛概况

1.数据预处理

2.模型初选

3.训练 ->确定两个模型

4.训练,修改网络,继续优化


大赛概况

大赛地址:https://tianchi.aliyun.com/competition/entrance/231711/introduction?spm=5176.12281949.1003.2.37422448y3C5Xj

视频增强和超分是计算机视觉领域的核心算法之一,目的是恢复降质视频本身的内容,提高视频的清晰度。该技术在工业界有着重要的实用意义,对于早期胶片视频的质量和清晰度的提升有着重大的意义。

此外,复赛审核通过的排名前10队伍,可进入阿里(优酷)校招绿色通道。

数据地址:https://tianchi.aliyun.com/competition/entrance/231711/information

注明:研究生期间做这方面的,现在打算做这个比赛;把我一路心得体会记录下来,模型代码也会同时公布,尽量每周更新,希望近复赛吧,一起加油

1.数据预处理

下载并安装FFmpeg;

ffmpeg工具十分强大,抽帧,合成视频的功能都具备

按照这篇博客操作:https://blog.csdn.net/chy466071353/article/details/54949221

说明下,我配置环境是win10+cuda9.0;

如果速度太慢的话,这里是百度网盘地址:

链接:https://pan.baidu.com/s/1UQcxSuqjGq8bLI3yCOwf9A 
提取码:b9ma

官方提供的预处理命令:

y4m 格式介绍:https://wiki.multimedia.cx/index.php/YUV4MPEG2
y4m 与 yuv(yuv420 8bit planar) 互转命令:y4mtoyuv: ffmpeg -i xx.y4m -vsync 0 xx.yuv  -yyuvtoy4m: ffmpeg -s 1920x1080 -i xx.yuv -vsync 0 xx.y4m -y
y4m 与 png 互转命令:y4mtobmp: ffmpeg -i xx.y4m -vsync 0 xx%3d.bmp -ybmptoy4m: ffmpeg -i xx%3d.bmp  -pix_fmt yuv420p  -vsync 0 xx.y4m -y
y4m 每25帧抽样命令:ffmpeg -i xxx.y4m -vf select='not(mod(n\,25))' -vsync 0  -y xxx_sub25.y4m

一条条处理太麻烦了:自己写一些函数处理省事。

我的初步想法是将y4m转成.bmp图片,然后单张图片超分辨率,最后合成y4m视频。这个过程是存在问题的:

y4m转bmp      bmp转y4m    :  y4m和转回来的y4m之间的psnr是44左右,理论上是inf(无限大的),所以这个转换过程存在精度损失。但是这个流程简单,我才用这种方式获得图片,现在的分值在39.38,40+的大神应该已经有更优秀的方式吧;怎样无损获得图像这个问题值得思考。

2.模型初选

推荐一些单张图片超分辨率比较好的论文,并附带代码:

DBNP:https://github.com/alterzero/DBPN-Pytorch;有代码,有模型,eccv workshop冠军,这个网络效果的确无敌,奈何电脑渣渣,跑不了。

超分总结:https://github.com/YapengTian/Single-Image-Super-Resolution;这是一位大神总结的,可以好好看看

今天用RDN:https://github.com/MingtaoGuo/Residual-Dense-Network-Trained-with-cGAN-for-Super-Resolution

上面的代码修改的,跑出了自己的模型:psnr32.7有点偏低。

这是我的代码,里面也有模型:https://github.com/958099161/Super_resolution

下面就是单张图片的效果:

小图:

超分结果

看下面的字体就知道,效果不太好了,流程走通了,下面就慢慢优化了

总结的一些超分辨率小技巧:

1、图像超分辨率领域上采样常采用的方式是亚像素卷积https://blog.csdn.net/CHNguoshiwushuang/article/details/81155361

2、很多论文将gan应用在图像超分辨方面,但是都给出结论,gan只能在感官效果上对图像有提升,但客观指标psnr却没有提升。

3、空洞卷积没有在图像超分辨率得到广泛应用,主要原因是图像超分辨率上采样的过程中只是和周围的像素点有关系,空洞卷积的目的是扩大感受野,所以空洞卷积对图像超分辨率也没有提升。

3.训练 确定两个效果比较好的网络

还没有用19年论文,目前采用18年提出的一些网络结构,觉得RDN,DBNP效果都不错,显卡多的大神都可以试试。一块显卡的同学,建议RDN吧。层数越深效果越好,当然建立在收敛好的前提下,所以感觉这个比赛最后很考验硬件。感觉40是个坎

目前就是这个成绩了,渣渣电脑,跑程序的时候电脑特别卡,15000张图一个epoch,一晚上跑10个epoch吧,进复赛就行,后续再优化吧。

4.训练,修改网络,继续优化

阿里巴巴优酷视频增强和超分辨率挑战赛-持续更新相关推荐

  1. 阿里巴巴优酷视频增强和超分辨率挑战赛

    https://tianchi.aliyun.com/competition/entrance/231711/success 大赛概况 视频增强和超分是计算机视觉领域的核心算法之一,目的是恢复降质视频 ...

  2. 阿里巴巴优酷视频增强和超分辨率挑战赛记录

    之前做过超分辨率,刚好有这个比赛,拿来记录一下,截止目前初赛,score=40.22,排名46. 更新,已经复赛B轮了,目前排名24. 数据 官方给的txt,用于获取: y4m 格式介绍:https: ...

  3. 阿里巴巴优酷视频增强和超分辨率挑战的冠军方案:VESR-Net

    作者单位:中国科学技术大学.微软亚洲研究院 挑战赛链接:https://tianchi.aliyun.com/competition/entrance/231711/rankingList/1 论文链 ...

  4. 阿里-优酷视频增强和超分辨率挑战赛冠军方案:VESR-Net

    作者单位:中国科学技术大学.微软亚洲研究院 论文:https://arxiv.org/pdf/2003.02115.pdf 挑战赛:https://tianchi.aliyun.com/competi ...

  5. 详解优酷视频质量评价体系

    万字长文 | 详解优酷视频质量评价体系 分享嘉宾|李静博士,阿里巴巴文娱集团资深算法专家,阿里巴巴大文娱摩酷实验室视频体验与质量团队负责人 整理出品|AICUG人工智能社区 本文地址:https:// ...

  6. 微信团队分享:视频图像的超分辨率技术原理和应用场景

    为什么80%的码农都做不了架构师?>>>    本文来自微信多媒体团队高欣玮的技术分享. 1.前言 图像和视频通常包含着大量的视觉信息,且视觉信息本身具有直观高效的描述能力,所以随着 ...

  7. 优酷视频kux格式转换为MP4的两种技巧

    优酷作为老牌的视频站点,每天都有很多人在上面看视频.也有一些朋友会将视频从优酷上下载下来,放到手机上进行观看.可是,如果下载的视频跟手机尺寸不匹配怎么办呢?而且优酷视频只能在优酷上才能够播放,对于那些 ...

  8. web页面播放优酷视频,播放html5视频,兼容ie7 vcastr22.swf播放

    一:vcastr22.swf播放本地视频 1.下载vcastr22.swf 把播放插文件放到服务器文件夹. 2.代码如下 红色路径是你自己服务器的路径 可以用最简单的 文件夹/文件夹/文件夹/xx.M ...

  9. 怎样用计算机合并视频,怎么合并视频-只需1键,将多个腾讯|爱奇艺|优酷视频瞬间转换成mp4(送转换器)...

    相信各位小伙伴都在腾讯.爱奇艺.优酷上看过视频吧.如果你还在里面下载过视频,会发现用一般的播放器无法打开,也无法进行后期剪辑,很麻烦.怎么办呢?一个非常简单的方法是进行视频格式转换. 怎么转换?我们以 ...

  10. 如何将多个腾讯|爱奇艺|优酷视频转换成mp4

    相信各位小伙伴都在腾讯.爱奇艺.优酷上看过视频吧.如果你还在里面下载过视频,会发现用一般的播放器无法打开,也无法进行后期剪辑,很麻烦.怎么办呢?一个非常简单的方法是进行视频格式转换.怎么转换?我们以优 ...

最新文章

  1. Groovy开发语言
  2. SMS短信通API——(1)Java应用发送手机短信
  3. 【作品】超级玛丽射击版
  4. java协变返回类型_Java中的协变返回类型
  5. Q绑查询html单页源码 自带接口
  6. 仅用10个月!中国高中生拿下Kaggle Master,怎么做到的?
  7. grid赋予oracle磁盘权限,grid 与 Oracle 用户下 Oracle 程序权限不一致导致无法连接 ASM 问题...
  8. OPTIMIZE TABLE的作用--转载
  9. CentOS 7.0 关闭防火墙
  10. XMind 2022 使用教程
  11. java 点云数据处理_概述 | 点云数据处理方法都有哪些?
  12. 日语学习软件推荐——五十音图APP:AI纠正你的日语发音
  13. 修图类APP原型设计分享– Hello Camera
  14. 中国最令人崩溃的25个姓氏,排名第1位的,打死都想不到
  15. eclipse的下载、安装
  16. QQ空间日志导出(php)
  17. jboss启动oracle表不存在,JBoss的部署及运行
  18. AE如何制作星云粒子特效
  19. OVP 过压保护电路
  20. 程序员的内功修炼指南

热门文章

  1. 机器学习算法的Python实现 (1):logistics回归 与 线性判别分析(LDA)
  2. vb基础计算机应用,老师给学生的-VB计算机应用基础考试
  3. PHP毕业设计源码带论文和答辩、大作业、实例程序源码下载合集【21套】
  4. PPT常见的几种排版技巧,你都掌握了吗?
  5. php 导出excel接口,PHP实现导出Excel文件
  6. 中国移动”5G大规模外场测试技术要求(V1.0)”基站要求
  7. oracle可以只装客户端吗,我想在linux下只装oracle客户端行吗?怎么装?
  8. Dev-C++/Cpp使用入门详解
  9. 简明python教程gitbook_简明Python教程 Byte of Python
  10. 流畅的python 18章