2021-CVPR-Drafting and Revision: Laplacian Pyramid Network for Fast High-QualityArtistic Style Transfer

  • 简介文章信息
  • 摘要
  • Introduction
  • 相关工作略
  • 方法
    • 主体网络结构
    • Drafting Network结构
    • ADAIN
    • Revision结构
  • 总结贡献如下
  • 实验结果
    • 客观评价
    • 主观评价
    • 效果图

简介文章信息

论文名称英文:Drafting and Revision: Laplacian Pyramid Network for Fast High-QualityArtistic Style Transfer
论文名称中文:草稿和修订:基于拉普拉斯金字塔网络的快速高质量艺术风格转移
发表期刊:CVPR2021 CCF-A
作者:Tianwei Lin1, Zhuoqi Ma1,2, Fu Li1, Dongliang He1, Xin Li1, Errui Ding1,Nannan Wang2, Jie Li2, Xinbo Gao3
作者研究机构:Department of Computer Vision Technology (VIS), Baidu Inc.1
作者研究机构中文:百度公司计算机视觉技术系
代码地址:https://github.com/PaddlePaddle/PaddleGAN/
作者近几年的论文
1、Deep concept-wise temporal convolutional networks for action localization
2、MVFNet: Multi-View Fusion Network for Efficient Video Recognition
3、Learning Semantic Person Image Generation by Region-Adaptive Normalization

摘要

风格迁移主要是三个指标:迁移速度,可迁移风格类别,迁移结果质量(主观)
目前缺点:1.质量很高但是,时间成本长,限制了应用。2.前馈的方法依旧不能合成复杂的风格。
本文改进:受到常见的绘画过程的启发,先画草图然后修改细节。我们提出了一种新颖的前馈方法LapStyle,拉普拉斯金字塔网络。
如下图:低分辨率传递全局模式,高分辨率下修改局部模式。

Introduction

第一段:艺术风格转移是一种有吸引力的技术,可以通过内容图像的结构和示例风格图像的风格样式来创建艺术图像。 它一直是学术界和工业界研究的热点。最近,提出了很多关于神经风格转移的方法,可以将其大致分为两种类型:图像优化方法和模型优化方法。
第二段:图像优化方法利用固定的网络对风格化的图像进行迭代优化。Gatysetal的开创性工作。通过迭代优化过程实现样式转换,通过预先训练的深度神经网络提取特征的相关性来捕获样式模式。接下来的工作主要以不同损失函数的形式对进行改进。
尽管实现了出色的样式化结果,例如STROTSS ,但是这些方法的广泛应用仍然受到其缓慢的在线优化过程的限制。 相反,模型优化方法通过训练来更新神经网络,并且在测试中是前馈的。 主要分为三种类型:
(1)Per-Style-Per-Model方法,被训练来合成具有单一给定样式的图像
(2)Multi-Style-Per-Model方法,引入了各种网络体系来同时处理多种风格
(3)Arbitrary-Style-Per-Model方法进一步采用各种特征修改机制来传递任意风格
回顾这些方法,我们发现虽然局部样式模式可以被转换,,但是仍然无法正确地传递混合了全局样式和局部样式的复杂样式。 同时,在许多情况下会出现伪影和瑕疵。
为此,在这项工作中,我们的主要目标是通过前馈网络实现高质量的艺术风格传递结果,在美学上保留局部和全局的样式。
第三段:人类画家在绘画时如何处理复杂的风格图案?一个常见的过程(特别是对于初学者而言)是首先绘制草图以捕获全局结构,然后逐步修改局部细节,而不是直接逐部分地完成最终绘画。
受此启发,我们提出了一种用于风格传递的神经网络——拉普拉斯金字塔网络(LapStyle)。
首先,在我们的框架中,drafting network(草稿网络)旨在以低分辨率传输全局样式模式,因为我们发现在低分辨率下,由于比较大的感受野和更少的局部细节,全局的样式可以很好的迁移。然后使用Revision network根据草稿和通过2×resolution content image上的拉普拉斯滤波提取的纹理,通过产生残差图像,以高分辨率修改局部细节。
请注意,我们的Revision network可以以金字塔的方式堆叠,以产生更高分辨率的细节。
最终的风格化图象是通过汇总所有金字塔的输出获得的。此外,我们采用浅色块(shallow patch)判别器来对抗的学习局部风格。如图1,我们的起草和修订过程获得了不错的结果。总结贡献如下:
1.我们引入了一个新颖的框架“草稿与修订”,通过将风格转换过程分为全局风格模式起草和局部风格模式修改来模拟绘画创作机制。
2.我们提出了一种名为LapStyle的前馈样式传递方法。采用起草网络传输低分辨率的全局样式模式,采用高分辨率修订网络根据内容图像的多级拉普拉斯滤波输出,以金字塔方式修改局部样式模式。
3.实验表明,我们的方法可以生成高分辨率和高质量的风格化结果,其中全局和局部样式模式都有效地合成。此外,提出的LapStyle非常高效,可以在110帧/秒内合成512像素的高分辨率风格化图像

相关工作略

方法

在这一节中,我们将详细介绍提出的前馈式传输网络LapStyle。为了便于理解,在本节中,我们只描述具有2级金字塔的框架。基准面为起草网络,第二级高分辨率采用修正网络,如图2所示。通过叠加修订网来建立更多的层次是非常直接的:

主体网络结构

Drafting Network结构

草稿网络的目的是在低分辨率下综合全局样式。为什么用低分辨率?如图所示,我们注意到,由于接收域大,局部细节少,全局模式在低分辨率下更容易传输。为了实现单一样式的传输,早期的工作直接训练一个编码器-解码器模块,其中只有内容图像被用作输入。为了更好的结合样式特性和内容特性,我们从最近的任意样式传输方法中采用了AdaIN。 草稿网络: 它包括一个编码器、几个AdaIN模块和一个解码器。 (1)编码器是一个预先训练好的VGG-19网络,在训练过程中是固定的。给出下采样的Xc和Xs,VGG编码器在2_1、3_1和4_1层提取多个粒度的特征。 (2)然后,我们分别在2_1、3_1和4_1层后使用AdaIN模块在内容和样式特征之间进行特征调制。 (3)最后,在解码器的每个粒度中,通过跳跃连接合并AdaIN模块的相应特征,在低和高级别的AdaIN模块之后,跳跃连接有助于保留内容结构,特别是对于低分辨率图像

ADAIN

(ICCV2017 ADAIN)核心,特征的均值和方差代表着图像的风格

Revision结构

修订网络的目的是通过生成残差细节图像来修改粗糙的程式化图像,而最终的程式化图像是通过结合rcs和粗糙的风格化图像̄下采用的Xcs生成的。这个过程确保了在̄下采样的Xcs中全局样式模式的分布得到了妥善的保存。同时,修正网络更容易学习利用残差细节图像对局部样式图案进行修正。 如图4所示,修正网络设计为简单有效的编解码器架构,只有一个下采样层和一个上采样层。此外,我们还引入了一个patch的鉴别器来帮助修正网络在对抗学习设置下捕获精细的patch纹理。我们定义了SinGAN之后的patch鉴别器,其中D有 5个卷积层和32个隐藏通道。 我们选择定义一个相对较浅的D,以(1)避免过度拟合,因为我们只有一个样式图像;(2)控制感受野,以确保只能捕获局部模式。

总结贡献如下

1.我们引入了一个新颖的框架“草稿与修订”,通过将风格转换过程分为全局风格模式起草和局部风格模式修改来模拟绘画创作机制。
2.我们提出了一种名为LapStyle的前馈样式传递方法。采用起草网络传输低分辨率的全局样式模式,采用高分辨率修订网络根据内容图像的多级拉普拉斯滤波输出,以金字塔方式修改局部样式模式。
3.实验表明,我们的方法可以生成高分辨率和高质量的风格化结果,其中全局和局部样式模式都有效地合成。此外,提出的LapStyle非常高效,可以在110帧/秒内合成512像素的高分辨率风格化图像。

实验结果

客观评价

主观评价

选用15张风格图像,15张内容图像,本文方法以及其他5种方法,分别合成225张图片。随机采样20组内容风格对,从100个用户中收集2000票,投最满意的风格化图像。

效果图

2021-CVPR-风格迁移 Drafting and Revision相关推荐

  1. CVPR 2021 | 澳洲国立大学提出基于模型的图像风格迁移

    ©作者|侯云钟 学校|澳洲国立大学博士生 研究方向|计算机视觉 本文从另外一个角度解读,澳洲国立大学郑良老师实验室 CVPR 2021 新工作.一般而言,我们需要同时利用两张图片完成图像的风格迁移(s ...

  2. 可逆网络风格迁移-解决内容泄漏问题 [CVPR 2021] ArtFlow: Unbiased Image Style Transfer via Reversible Neural Flows

    [CVPR 2021] ArtFlow: Unbiased Image Style Transfer via Reversible Neural Flows Jie An1∗   Siyu Huang ...

  3. Drafting and Revision: Laplacian Pyramid Network for Fast High-Quality Artistic Style Transfer--T Li

    [1] Lin T , Ma Z , Li F , et al. Drafting and Revision: Laplacian Pyramid Network for Fast High-Qual ...

  4. 图像风格迁移-DSTN

    样式传输的目的是从参考图像中再现具有样式的内容图像.现有的通用风格转换方法成功地以艺术或照片逼真的方式将任意风格传递给原始图像.然而,现有作品所定义的"任意风格"的范围由于其结构限 ...

  5. 华人团队用Transformer做风格迁移,速度快、可试玩,网友却不买账

    视学算法报道 编辑:杜伟 利用神经网络进行风格迁移是一项非常常见的任务,方法也很多,比如基于优化和基于 RL 的方法.最近,来自百度 VIS 团队的研究者提出了一种基于 Transformer 的风格 ...

  6. 一文详解计算机视觉的广泛应用:网络压缩、视觉问答、可视化、风格迁移等

    作者 | 张皓(南京大学) 来源:人工智能头条丨公众号 引言 深度学习目前已成为发展最快.最令人兴奋的机器学习领域之一,许多卓有建树的论文已经发表,而且已有很多高质量的开源深度学习框架可供使用.然而, ...

  7. 谷歌又放大招:视觉效果完胜其他SOTA的风格迁移网络,手机端可达实时4K

    Joint Bilateral Learning for Real-time Universal Photorealistic Style Transfer paper:https://arxiv.o ...

  8. CV Code | 本周新出计算机视觉开源代码汇总(含自动驾驶目标检测、医学图像分割、风格迁移、语义分割、目标跟踪等)...

    点击我爱计算机视觉标星,更快获取CVML新技术 刚刚过去的一周含五一假期,工作日第一天,CV君汇总了过去一周计算机视觉领域新出的开源代码,涉及到自动驾驶目标检测.医学图像分割.风格迁移.神经架构搜索. ...

  9. Neural Style Transfer 神经风格迁移详解

    Neural Style Transfer 神经风格迁移详解 今天和大家分享一个比较有意思的东西,Neural Style Transfer,神经风格迁移,简单说就是我们将一张普通的照片赋予它艺术作品 ...

最新文章

  1. [tomcat7源码学习]结束Bootstrap进入Catalina
  2. PostSharp AOP编程:1.基于PostSharp的AOP日志记录和异常捕捉【附带源码】
  3. python之路-网络编程
  4. 事务超时时间无效_什么是ZooKeeper?ZooKeeper分布式事务详解
  5. 【4】搭建Docker私服harbor
  6. android 开发50个技巧面向切面编程思想
  7. c#调用系统资源大集合(二)
  8. MWORKS应用案例 | 基于Modelica的射流管式电液伺服阀的建模仿真
  9. Remi教程GUI设计番外篇
  10. (最完美)红米Note 5A的usb调试模式在哪里打开的步骤
  11. 思维导图带你学习二层VLAN隔离技术
  12. git使用命令行首次提交代码
  13. 手游大佬(日期模拟)
  14. AI 隐身术,让你在视频中消失的“黑魔法”,想拥有吗?
  15. 70后.net老猿,尚能饭否?
  16. 6park留园 android,‎「掌上留园-6park」をApp Storeで
  17. 完美字符子串 单调队列预处理+DP线段树优化
  18. git撤销未提交的commit
  19. Linux cat命令过滤#和空白行
  20. 打包带走极客时间大数据课程的正确姿势

热门文章

  1. 【评测】小鼠胚胎成纤维细胞转染方法
  2. 批量采集url工具软件【速度极快】
  3. C# 使用 wkhtmltopdf 将HTML文本或文件转换为PDF
  4. [精简]托福核心词汇90
  5. 微信小程序wx.request接口
  6. 010.MODBUS与台达变频器通讯1
  7. 西行漫记(20):一路向北 1
  8. Firefox和IE中浏览一些网页字体模糊的解决方法
  9. 数据分析之前程无忧(一)
  10. AnyMP4 Mac Video Converter Ultimate for Mac(视频格式转换器) v8.2.18激活版