赛题介绍

百度网盘AI大赛——图像处理挑战赛是 百度网盘开放平台 面向AI开发者和爱好者发起的计算机视觉领域挑战赛。AI时代已到来,百度网盘与百度飞桨AI Studio强强联合,旨在基于个人云存储的生态能力开放,通过比赛机制,鼓励选手结合当下前沿的计算机视觉技术与图像处理技术,完成模型设计搭建与训练优化,产出基于飞桨框架的开源模型方案,为中国开源生态建设贡献一份力量。

本次图像处理挑战赛以线上比赛的形式进行,参赛选手需要在规定时间内,完成模型设计搭建与训练优化,并提交基于评测数据集产出的结果文件,榜单排名靠前且通过代码复查的队伍可获得高额奖金。

百度网盘开放平台 致力于为全球AI开发者和爱好者提供专业、高效的AI学习与开发环境,挖掘培养AI人才,助力技术产业生态发展。我们向所有胸怀梦想的开发者发出邀请,希望大家能与百度一起,用技术让复杂的世界变得更简单。

本项目地址:https://aistudio.baidu.com/aistudio/projectdetail/3220041?contributionType=1

可fork一键运行。

数据集简介

选手需要建立模型,对比赛给定的带有摩尔纹的图片进行处理,消除屏摄产生的摩尔纹噪声,还原图片原本的样子,并提交模型输出的结果图片。希望各位参赛选手结合当下前沿的计算机视觉技术与图像处理技术,在设计搭建模型的基础上,提升模型的训练性能、精度效果和泛化能力。在保证效果精准的同时,可以进一步考虑模型在实际应用中的性能表现,如更轻量、更高效等。

在本次比赛最新发布的数据集中,所有的图像数据均由真实场景采集得到,再通过技术手段进行相应处理,生成可用的脱敏数据集。该任务为image-to-image的形式,因此源数据和GT数据均以图片的形式来提供。各位选手可基于本次比赛最新发布的训练数据快速融入比赛,为达到更好的算法效果,本次比赛不限制大家使用额外的训练数据来优化模型。测试数据集的GT不做公开,请各位选手基于本次比赛最新发布的测试数据集提交对应的结果文件。

数据集构成

|- root  |- images|- gts

本次比赛最新发布的数据集共包含训练集、A榜测试集、B榜测试集三个部分,其中训练集共1000个样本,A榜测试集共200个样本,B榜测试集共200个样本;
images 为带摩尔纹的源图像数据,gts 为无摩尔纹的真值数据(仅有训练集数据提供gts ,A榜测试集、B榜测试集数据均不提供gts);
images 与 gts 中的图片根据图片名称一一对应。

以下图片为数据中的样本,左侧图片为原图,右侧图片为已经去除摩尔纹,同时亮度也有所调整的GT图(GroundTruth)。

Baseline模型WDNet介绍

整体结构

WDNet是ECCV 2020提出一种去除摩尔纹的模型。该模型是一种基于小波与双分支的神经网络,结构如下:

首先RGB图片需要通过WaveletTransform模块进行转换,得到一个48通道的数据,通过WDNet网络同样得到一个通道数与尺寸不变的特征图。最后在一次通过WaveletTransform使用转置卷积将图片还原得到最终预测结果。

这里WaveletTransform的权重是固定不变不需要训练的。

DenseNet

DenseNet中使用旁路连接和特征复用的方式缓解了梯度消失的问题,同时减少了网络参数。DenseNet已经被用于去雾和超分辨率网络。

如上图所示,该模型中的dense分支新增了一个方向感知模块(DPM),用于找到摩尔纹的方向。DPM的输出和每一个dense的输出相乘,然后乘以一个因子β然后与输入相加。该设计可以有效的定位摩尔纹的位置。

Dilation

下采样和池化可以增大感受野,但同时也丢失了一些细节。空洞卷积可以解决这个问题。在每一个dilation分支里,都有两层,有一个3x3的空洞卷积和3x3的普通卷积组成。

训练

准备数据集

%cd /home/aistudio/data/
!unzip /home/aistudio/data/data120844/moire_train_dataset.zip
!unzip /home/aistudio/data/data120844/moire_testA_dataset.zip

解压数据集之后,数据集目录如下

moire_train_dataset/
├── gts
└── images

启动训练命令

%cd /home/aistudio/demoire-baseline/
!python train.py --dataset_root ../data/moire_train_dataset/ --max_epochs 100 --batch_size 8 --sample_interval 100

在训练过程中,可以设置sample_interval的值,来获取中间模型的预测推理效果图。比如100,代表每迭代100次,则使用模型进行一次推理预测,并生成一张对比图。

epoch 8:

epoch 12:

在上面的图片中,左侧的图片为数据集中的原始图片,右边的图片为GT图,中间的图片为模型推理预测输出。可以看出随着模型训练迭代次数的增加,预测图越来越与GT图相似。

预测

启动预测脚本

!python predict.py --dataset_root ../data/moire_testA_dataset/ --pretrained train_result/model/epoch_100/model.pdparams
W1210 13:11:09.804253   265 device_context.cc:447] Please NOTE: device: 0, GPU Compute Capability: 7.0, Driver API Version: 11.0, Runtime API Version: 10.1
W1210 13:11:09.809393   265 device_context.cc:465] device: 0, cuDNN Version: 7.6.
Loading pretrained model from train_result/model/epoch_100/model.pdparams
There are 176/176 variables loaded into WDNet.

运行结束后,结果文件保存在output/pre目录下。进入pre目录创建readme.txt文件。输入以下内容:

训练框架:PaddlePaddle
代码运行环境:V100
是否使用GPU:是
单张图片耗时/s:0.5
模型大小:15MB
其他说明:该算法参考WDNET网络。

然后压缩所有文件。

%cd /home/aistudio/demoire-baseline/output/pre/
!zip result.zip *.jpg *.txt

最后下载result.zip文件,提交即可。最终得分57.07。

百度网盘AI大赛:文档图像摩尔纹消除(赛题一) Baseline相关推荐

  1. 【百度网盘AI大赛——表格检测】Mask R-CNN 方案

    ★★★ 本文源自AI Studio社区精品项目,[点击此处]查看更多精品内容 >>> [百度网盘AI大赛-表格检测]MASK R-CNN 方案 一.项目背景 1.1 比赛介绍 背景: ...

  2. 百度网盘AI大赛-图像处理挑战赛:文档检测优化赛 Baseline

    转自AI Studio,原文链接:百度网盘AI大赛-图像处理挑战赛:文档检测优化赛 Baseline - 飞桨AI Studio 百度网盘AI大赛-图像处理挑战赛:文档检测优化赛 使用Resnet15 ...

  3. 百度网盘AI大赛-水印智能消除赛第3名方案

    百度网盘AI大赛-水印智能消除赛第3名方案 项目简介 本项目是百度网盘AI大赛--图像处理挑战赛:百度水印智能消除赛第3名的解决方案.在该项目中,我们对本次赛题的任务与数据进行了分析,并在此基础上详细 ...

  4. 第三季百度网盘AI大赛盛夏来袭,寻找热爱AI的你!

    青春总会因为热爱一件事,开始闪闪发光,从这里开始吗?没错!第三季百度网盘AI大赛盛大来袭,舞台已经准备好,Are you ready? 参赛福利 划重点!参加比赛有机会获得大手笔奖励呦! 万元现金 报 ...

  5. 大话存储pdf 百度网盘_学用系列亲身体验百度网盘内测在线文档,有遗憾也有期待...

    随着阿里系的Teambition网盘上线进入倒计时,百度网盘也终于开始发力,除了vip用户扩容11TB的豪举之外,另一个亮点就是上线了内测在线文档功能.胖胖老师也第一手获得了内测资格,今天就和大家分享 ...

  6. 大话存储pdf 百度网盘_学用系列|亲身体验百度网盘内测在线文档,有遗憾也有期待...

    随着阿里系的Teambition网盘上线进入倒计时,百度网盘也终于开始发力,除了vip用户扩容11TB的豪举之外,另一个亮点就是上线了内测在线文档功能.胖胖老师也第一手获得了内测资格,今天就和大家分享 ...

  7. 百度网盘AI大赛-通用场景手写文字擦除亚军方案

    ★★★ 本文源自AlStudio社区精品项目,[点击此处]查看更多精品内容 >>> 通用手写文字擦除A榜2,B榜第3方案 一.赛题背景 随着技术发展,OCR扫描在学习.办公等众多场景 ...

  8. Android实现百度网盘一些功能

    该项目是一个Android项目,适合新手,运用了很多的常见组件和布局. 项目亮点在于运用了百度网盘的API,通过授权可以在APP中展示授权账号的百度网盘里面的内容,展示的效果如文中图片所示.除此之外还 ...

  9. html 百度网盘的布局,百度网盘披露5G布局:打造个人云操作系统!

    原标题:百度网盘披露5G布局:打造个人云操作系统! [PConline资讯]消息:7月24日,百度网盘总经理汤利华在接受记者采访时表示,5G将重塑个人云服务的核心价值,百度网盘将从工具升级为个人云服务 ...

最新文章

  1. 怎么获取codeforces的数据_原创 | codeforces 1417C,逆向思考的数据结构题
  2. 【C++】37.为什么要使用Lambda表达式
  3. java对象在内存中的布局
  4. serverless 框架_Malaguv1.4.1支持Serverless的微服务框架
  5. 分布式事务中的2PC
  6. mysql记录相互关系查询_MySQL关系表查询两个表的数据
  7. (1) 自定义分页采用jsp和Java实现
  8. 设计模式之不简单的工厂模式(二)
  9. 计算机应用操作题word,计算机应用基础网考模拟练习题Word部分操作题
  10. 物体识别_深度学习在物体识别中的应用探讨:以ImageNet和人脸识别为例
  11. 《冰河的渗透实战笔记》电子书,442页,37万字,正式发布!!
  12. java里面的斜杠是什么意思_java 单斜杠
  13. TJX theft tops 45.6 million card numbers——TJX公司被盗取45600000卡号
  14. DBveaver的一些使用心得
  15. 2022.04.14【读书笔记】|转录因子分析
  16. python 学习爬取哔哩哔哩今日热门的前100个视频
  17. 【okhttp3.OkHttpClient】ClassNotFoundException: okhttp3.OkHttpClient
  18. 迷糊到清楚,清楚又到迷糊
  19. LiveNVR配置拉转RTSP传统海康大华安防摄像机直播流输出RTSP/RTMP/HLS/HTTP-FLV如何获取直播流地址
  20. post_thumbnail_html,使用WordPress函数the_post_thumbnail_url()获取特色图片缩略图URL

热门文章

  1. 侨报纽约网:纽约华人寿命长于全市平均值
  2. main memory
  3. JavaScript 实现图片轮播
  4. PS(三种文字描边)
  5. python getcwd函数_os.getcwd()函数的用法
  6. oracle系列(六)OEM与常见故障处理
  7. 【艾特淘】店铺获取免费流量的三大核心要素
  8. SolidEdge联盟操作指南
  9. FSG2.0(1)------内存镜像法
  10. Java 开源企业级电商 saas 系统之weiit-saas介绍