项目主页:https://yuheng-li.github.io/CollageGAN/ | github-空项目 | paper

图1:语义条件下高分辨率的图像生成(左上角黄色插图)。我们的基本模型(第1列)比spade(第4-5列)产生更现实的结果。
我们通过使用特定于类的生成器来生成前景对象或部件,并将它们组合在(compose them on)由基本模型生成的图像上(已基本结果作为输入,到特定类别GAN),从而进一步提高了结果的质量。第二列的分割图(蓝色插图)显示了被我们的gan库修改的部分,放大的结果显示在每个图像旁边

摘要

提出了一种高分辨率语义图像合成的方法(semantic image synthsis)。
它由一个基本图像生成器(base generator)和多个特定类(mutiple class-specific)的生成器构成。

基础生成器基于分割图(segmentation map)生成高质量的图像,为了进一步改善不同目标品质,我们通过单独训练特定类的模型( separately training class-specific models)创建了一个生成对抗网络。
这有几个好处:

  • 包括每个类的专用权重(dedicated weights);
  • 为每个模型集中对齐的数据(centrally aligned data)
  • 来自其他来源的额外训练数据(additional),具有更高的分辨率和质量的潜力
  • 并且易于操作(manipulation)场景中的特定对象(specifc object)。

实验表明,该方法可以生成高分辨率的高分辨率图像,同时使用特定于类的生成器具有对象级控制的灵活性(flexi-bility of object-level contral)

3. 方法

图2 基础与特定生成器的结构


基础和特定类别生成器的结构是一直的。。作者修改了StyleGAN2的结构,将输入常数替代为编码器的输出,z也添加了编码器的输出。

训练流程

图3 本文的训练推理流程

在训练期间,我们基本的生成器训练产生整张图片,而我们的特定类的生成器使用裁剪后删除对象信息的真实图像(阴影区域填充零或对象的低频信息),并将裁剪分割地图作为上下文信息来生成相应类的实例。
在推理的时候,基本生成器(base generator)首先生成整个图像,然后由特定类的生成器(class-specific generators)依次(sequentially)生成图像的特定区域,同时将前一个生成器的输出作为上下文(as context)。c&r 是指裁剪和实例信息删除操作注意,为了简单起见,我们不会在推理管道中显示裁剪的语义映射作为特定类模型的输入

4. 实验

数据集

卧室数据集

  • 74318张,来自 ADE20K-bedroom-category

全身人类数据集

  • 67560张,高分辨率标记图片,24个类别语义标记、10%作为测试集
  • 模糊了背景

Cityscape

  • 3000train,500测试的德国街景图片。

训练补充数据集

we use (4) iMaterialist [6] and (5) Indoor dataset (childs room, dining room and living room from places dataset [40]).
For cityscapes, we use (6)Cityscapes extra [4] and (7) Caltech Pedestrian。

结果


Github

  • OASIS: You only need adversarial supervision for semantic image synthesis
  • SPADE: Semantic Image Synthesis with Spatially-Adaptive Normalization.

与其他模型对比结果

基础生成器(整体生成结果)

拼接生成器对细节的生成

对现实图片的结果进行改进

【论文简介】CollageGAN: Collaging Class-specific GANs for Semantic Image Synthesis(用于语义图像合成的特定类拼贴GANs)相关推荐

  1. 论文笔记:SPADE(CVPR 2019)-Semantic Image Synthesis with Spatially-Adaptive Normalization

    论文笔记:SPADE(CVPR 2019)-Semantic Image Synthesis with Spatially-Adaptive Normalization SPADE DEMO 前言 语 ...

  2. Text to image论文精读 DM-GAN: Dynamic Memory Generative Adversarial Networks for t2i 用于文本图像合成的动态记忆生成对抗网络

    Text to image论文精读 DM-GAN: Dynamic Memory Generative Adversarial Networks for Text-to-Image Synthesis ...

  3. Paper之ACLEMNLP:2009年~2019年ACL计算语言学协会年会EMNLP自然语言处理的经验方法会议历年最佳论文简介及其解读

    Paper之ACL&EMNLP:2009年~2019年ACL计算语言学协会年会&EMNLP自然语言处理会的经验方法会议历年最佳论文简介及其解读 目录 ACL计算语言学协会年会& ...

  4. 利用条件GANs的pix2pix进化版:高分辨率图像合成和语义操作 | PaperDaily #23

    在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果. 点击本文底部的「阅读原文」即刻加入社区 ...

  5. Paper之IEEERSJ:2009年~2019年机器人技术(IEEE机器人和自动化国际会议RSJ智能机器人与系统国际会议机器人技术:科学与系统机器人学报)历年最佳论文简介及其解读

    Paper之IEEE&RSJ:2009年~2019年机器人技术(IEEE机器人和自动化国际会议&RSJ智能机器人与系统国际会议&机器人技术:科学与系统&机器人学报)历年 ...

  6. DL之FAN:FAN人脸对齐网络(Face Alignment depth Network)的论文简介、案例应用之详细攻略

    DL之FAN:FAN人脸对齐网络(Face Alignment depth Network)的论文简介.案例应用之详细攻略 目录 FAN人脸对齐网络(Face Alignment depth Netw ...

  7. DL之LSTM:LSTM算法论文简介(原理、关键步骤、RNN/LSTM/GRU比较、单层和多层的LSTM)、案例应用之详细攻略

    DL之LSTM:LSTM算法论文简介(原理.关键步骤.RNN/LSTM/GRU比较.单层和多层的LSTM).案例应用之详细攻略 目录 LSTM算法简介 1.LSTM算法论文 1.1.LSTM算法相关论 ...

  8. 论文简介:Extract Line Art from Illustrations

    版权声明:禁止转载.(首发时间:2020-10-02,更新时间:2022-01-10) |  个人笔记,仅供参考. 目录 1. 问题的定义与意义 1.1 自动线稿提取算法的意义 1.2 问题概述 1. ...

  9. Paper之ICASSPIEEEAUDIOSPE:2018~2019年ICASSP国际声学、语音和信号处理会议IEEE-ACM T AUDIO SPE音频、语音和语言处理期刊最佳论文简介及其解读

    Paper之ICASSP&IEEEAUDIOSPE:2018~2019年ICASSP国际声学.语音和信号处理会议&IEEE-ACM T AUDIO SPE音频.语音和语言处理期刊最佳论 ...

最新文章

  1. ESX VMFS文件系统浏览及修复软件部分免费发布
  2. mysql 给表起别名_MySQL ------ 高级联结 (自联结,自然联结,外联结,带聚合函数的联结)(十五)...
  3. sublime Text3常用快捷键
  4. 【论文解读】用Dropout思想做特征选择保证效果,还兼顾了线上性能?
  5. 堆/栈/动态存储方式/静态存储方式
  6. psql客户端乱码问题
  7. 使用BeetleX.ESDoc构建文档搜索功能
  8. c语言读取文件到结构体数组,有关文件读写到结构体数组问题;
  9. 如何快速从基因组中提取基因、转录本、蛋白、启动子、非编码序列?
  10. .net runtime占用cpu_Go服务在容器内CPU使用率异常问题排查手记
  11. POJ读书笔记2.1 —— 鸡兔同笼
  12. iOS最全学习资源汇总
  13. Spark 已死,Storm 已凉,Flink 永远滴神!
  14. win7 插入鼠标自动禁用触摸板
  15. 中国象棋马走日 — 递归
  16. 25岁女生,转行学前端合适吗?
  17. python安装库之----有些库库真是小妖精
  18. 技术类应届生面试技巧(牛客网)
  19. 百度网盘百度云不限速下载几种方法介绍汇总(借助网页或者软件等)
  20. ORACLE实现MySQL中substring_index函数功能

热门文章

  1. asp.net MVC之AuthorizeAttribute浅析
  2. Line 8 in XML document from class path resource [conf/applicationContext.xml] is invalid
  3. 30分钟了解所有引擎组件,132个Unity 游戏引擎组件速通!【收藏 == 学会】
  4. qq邮箱 微信提醒不通知
  5. 趣味算法-04-跟着作者读《趣味算法(第2版)》-贪心算法
  6. Python实现多个视频合成视频的功能你知道吗
  7. 【电脑讲解】电脑没有声音了怎么恢复?以win7为例
  8. 微信小程序工程化之路
  9. 分步傅里叶算法_分步傅立叶算法(SSFFT),split-step fast Fourier transformation(SSFFT),音标,读音,翻译,英文例句,英语词典...
  10. require的使用