二、图像编辑-基于StyleGAN

11、StyleCLIP: Text-Driven Manipulation of StyleGAN Imagery

  • 受 StyleGAN 启发,最近许多工作都集中在了解如何使用 StyleGAN 的潜在空间来操纵图像生成。但为了挖掘语义上有意义的潜在表示,通常涉及到一些人工,甚至是打标签的图像数据。

  • 这项工作探索利用最近引入的对比语言图像预训练 (CLIP) 模型,以便为 StyleGAN 图像处理开发一个基于文本的界面。提出一种将文本映射到 StyleGAN 风格空间中的方法,实现交互式文本驱动的图像操作。

12、Diagonal Attention and Style-based GAN for Content-Style Disentanglement in Image Generation and Translation

  • 图像生成模型中的重要研究课题之一是,解耦空间内容和风格,以便对其进行单独控制。虽然 StyleGAN 可以从随机噪声中生成内容特征向量,但由此产生的空间内容控制主要针对微小的空间变化,全局内容和风格的解耦并不完全。

  • 受对归一化和注意力的启发,提出一种新的层次自适应空间注意力(DAT)层,操纵风格和内容从粗到细的层次解耦。此外,生成器可轻松集成到 GAN逆映射框架中,从而可以灵活控制来自多域图像转换任务的内容和风格。

13、ReStyle: A Residual-Based StyleGAN Encoder via Iterative Refinement

  • 生成对抗网络 (GAN)在无条件图像生成能力有显著提升。逆映射,将图像转化为经过训练的 GAN 的相应潜码表示,是有意义的,这样可以操纵真实图像。

这项工作提出一种新的逆映射方案,通过引入迭代细化机制,扩展当前基于编码器的逆映射方法。与当前最先进的方法相比,基于残差的编码器 ReStyle 提高了准确性,推理时间的增加可以忽略不计。https://yuval-alaluf.github.io/restyle-encoder/

三、图像编辑-逆映射

14、From Continuity to Editability: Inverting GANs with Consecutive Images

  • 本文通过将连续图像(例如,视频帧或具有不同姿势的同一个人)引入GAN逆映射过程,大量实验表明,方法在真实图像数据集和合成数据集的重建保真度和可编辑性方面明显优于最先进的方法。源代码

  • https://github.com/cnnlstm/InvertingGANs_with_ConsecutiveImgs

15、GAN Inversion for Out-of-Range Images with Geometric Transformations

  • 对图像的语义编辑,GAN 逆映射方法找到与预训练 GAN 模型域对齐的域潜码至关重要。但潜码只能用于与 GAN 模型的训练图像对齐的范围内图像。

  • 对与 GAN 模型训练图像不对齐的、超出范围的图像,本文提出BDInvert,一种新的 GAN 逆映射方法,用于进行语义编辑。

四、图像编辑-人脸

16、A Latent Transformer for Disentangled Face Editing in Images and Videos

  • 高质量人脸图像编辑是电影后期制作行业的挑战,需高度控制和 ID身份信息保留。此前试图解决这个问题的方法可能有人脸属性纠缠、ID丢失问题。

  • 本文提出通过 StyleGAN 生成器的潜在空间来编辑人脸属性,训练专用的潜在转换网络,并在损失函数中加入显式解耦和ID保留损失项。并将方法推广到视频。

  • 源代码https://github.com/InterDigitalInc/latent-transformer

五、图像编辑-语义生成

17、Collaging Class-specific GANs for Semantic Image Synthesis

  • 提出一种高分辨率语义图像合成方法,它由一个基本图像生成器和多个特定于类的生成器组成,生成器基于分割图生成高质量图像。

为进一步提高不同对象的质量,通过特定于类展开单独训练,构建一组生成对抗网络 (GAN)。这有几个好处,包括 :每个类专用权重;每个模型更集中对齐数据;并轻松操纵场景中的特定对象。实验表明,方法可生成高分辨率高质量图像,同时特定于类的生成器具有对象级控制的灵活性。

  • https://yuheng-li.github.io/CollageGAN/

18、Image Synthesis via Semantic Composition

  • 本文提出一种基于语义布局合成逼真图像的方法,方法假设对于具有相似外观的对象,它们共享相似的表示。根据它们的外观相关性建立区域之间的依赖关系,产生空间变化和相关表示。基于这些特征,提出一个通过空间条件计算(具有卷积和归一化)构造的动态加权网络。除了保留语义差异之外,给定的动态网络还增强了语义相关性,有利于全局结构和细节合成。

19、Image Synthesis from Layout with Locality-Aware Mask Adaption

  • 针对生成以布局(一组具有对象类别的边界框)为条件的图像任务。现有方法构建布局-掩码-图像的流程,物体掩码会单独生成,形成语义分割掩码(layout-to-mask),由此生成新图像(掩码到图像)。但是,布局中的重叠框会导致对象掩膜重叠,降低清晰度并导致混乱。

本文认为生成干净且语义清晰的语义掩码非常重要,提出局部感知掩码适应 (LAMA) 模块以适应生成中重叠或附近的物体掩膜。

猜您喜欢:

 戳我,查看GAN的系列专辑~!

一顿午饭外卖,成为CV视觉的前沿弄潮儿!

超110篇!CVPR 2021最全GAN论文汇总梳理!

超100篇!CVPR 2020最全GAN论文梳理汇总!

拆解组新的GAN:解耦表征MixNMatch

StarGAN第2版:多域多样性图像生成

附下载 | 《可解释的机器学习》中文版

附下载 |《TensorFlow 2.0 深度学习算法实战》

附下载 |《计算机视觉中的数学方法》分享

《基于深度学习的表面缺陷检测方法综述》

《零样本图像分类综述: 十年进展》

《基于深度神经网络的少样本学习综述》

图像编辑系列之(2)基于StyleGAN(3)GAN逆映射(4)人脸 (5)语义生成 | ICCV2021生成对抗GAN梳理汇总...相关推荐

  1. 图像转换 image translation系列(17)| 最新ICCV2021生成对抗GAN汇总梳理

    (1)GAN改进系列 | 最新ICCV2021生成对抗网络GAN论文梳理汇总 图像编辑系列之(2)基于StyleGAN(3)GAN逆映射(4)人脸 (5)语义生成 | ICCV2021生成对抗GAN梳 ...

  2. 图像检测系列之(12)异常检测(13)拼接伪造(14)deepfake | ICCV2021生成对抗GAN汇总梳理...

    (1)GAN改进系列 | 最新ICCV2021生成对抗网络GAN论文梳理汇总 图像编辑系列之(2)基于StyleGAN(3)GAN逆映射(4)人脸 (5)语义生成 | ICCV2021生成对抗GAN梳 ...

  3. CVPR 2021 | ShapeInversion: 基于GAN逆映射的无监督点云补全方法

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 摘要 · 看点 在CVPR 2021上,商汤科技-南洋理工大学联合 AI 研究中心 S-Lab 提出了 ...

  4. CVPR2022新作:P图不会,深度学习来帮忙,基于GAN逆映射的图像编辑(中)

    导 语 GAN逆映射(GAN Inversion)实际上是逆向思维的极佳范式.简单来说,以往将编码z通过生成器合成图像:现在是求真实图像的编码,期望在特征空间的修改最终映射为对图像语义的修改,比如将人 ...

  5. CVPR2022新作:P图不会,深度学习来帮忙:基于GAN逆映射的图像编辑(上)

    导 语 人脸图像编辑广泛应用于图像后期处理中,通常使用PS工具通过多个步骤来完成.手动完成人像的后期编辑非常耗时,同时对工具的娴熟运用会有较高的学习门槛.下面让我们看下如何用AI一键修图. 本文效果 ...

  6. 最新ICCV 2021 | 虚拟试衣(21)图像编辑-文本引导(22)图像编辑-单样本(23)生成对抗GAN...

    (1)GAN改进系列 图像编辑系列之(2)基于StyleGAN(3)GAN逆映射(4)人脸 (5)语义生成 图像恢复系列之(6)超分(7)反光去除(8)光斑去除 (9)阴影去除(10)水下图像失真去除 ...

  7. 图像恢复系列之(6)超分(7)反光去除(8)光斑去除 (9)阴影去除(10)水下图像失真去除 | ICCV2021生成对抗GAN...

    六.图像恢复-超分 20.Fourier Space Losses for Efficient Perceptual Image Super-Resolution 许多超分辨率 (SR) 模型仅针对精 ...

  8. 基于PyTorch的GAN框架TorchGAN:用架构级API轻松定制GAN项目

    机器之心报道 参与:刘晓坤 TorchGAN 是基于 PyTorch 的 GAN 设计开发框架.该框架旨在为流行的 GAN 提供构造模块,且允许为前沿研究进行定制化. 使用 TorchGAN 的模块化 ...

  9. SQL Server 2008空间数据应用系列七:基于Bing Maps(Silverlight) 的空间数据展现

    SQL Server 2008空间数据应用系列七:基于Bing Maps(Silverlight) 的空间数据展现 原文:SQL Server 2008空间数据应用系列七:基于Bing Maps(Si ...

最新文章

  1. 搜索关键词分析——以个人博客网站为例
  2. 记一次死锁问题的排查和解决
  3. [精华][推荐]SSO CAS单点登录框架学习 搭建详细步骤及源码
  4. 使用Python音频双通道分离
  5. Python-Flask实现电影系统管理后台
  6. SCM系统(Supply Chain Management System,供应链管理系统)
  7. java int stack_java中int算法的有趣现象
  8. 半个月使用rust语言的体验
  9. Excel的FIND函数及其用法
  10. 大数据文本相似去重方案
  11. 计算机专业新生创新思维研究,计算机基础与计算思维探究论文
  12. 使用python求解特征值与特征向量
  13. DotProject的安装(1)
  14. 升级版的冒泡排序Java
  15. C语言实验——时间间隔(java)
  16. 这些网络流行语是什么意思!打工是不可能打工的,这辈子不可能打工的!(来自窃·格瓦拉的名言)
  17. 【信息系统项目管理师】第二十三章 信息系统综合测试与管理(考点汇总篇)
  18. 鸿蒙掉不掉凤羽符,《诛仙3》灌注符怎么得?装备各部件灌注符获取方式一览...
  19. 备份软件Cobian Backup介绍
  20. 雅思考试流程与应试注意事项

热门文章

  1. 使用Python和docTR提取车辆识别号
  2. wifidog 源码初分析
  3. 有关神经网络的训练算法,神经网络算法通俗解释
  4. AndroidStudio haxm installer win10安装失败问题建议
  5. android分享视频到微信,android 分享文本、图片、音乐、视频到微信朋友圈、好友、我的收藏...
  6. apple登录服务端验证
  7. 多元线性回归算法预测房价【人工智能】
  8. 8×8二维载荷谱编制
  9. 使用Linux命令cURL实现文件定时上传到ftp服务器的程序
  10. 同花顺-图像算法工程师-笔试题