编者按:图像填充是深度学习领域内的一个热点任务。尽管现有方法对于小规模、稀疏区域的填充可以取得不错的效果,但对于大规模的缺失区域始终无能为力。为解决这一问题,微软亚洲研究院提出了协同调制生成式对抗网络——一种通用的方法,跨越了条件与无条件图像生成领域之间的鸿沟。

这一方法不但能够高质量、多样地填充图像任意规模的缺失区域,同时也能被应用于更广泛的图像转换任务。此外,考虑到图像填充领域内缺乏良好的指标,研究员们还提出了配对/无配对感知器辨别分数(P-IDS/U-IDS)以更加鲁棒、直观、合理地衡量模型性能。该相关工作已被 ICLR 2021 接受为 Spotlight Presentation。

如何对残缺图像进行修复?传统方法需要使用修图软件中的画笔、图章、加深减淡……等工具,如果有美观/美颜的需求,还得请“专家”上手。近日,微软亚洲研究院的研究员们在 ICLR 2021 大会上发表了一项工作:“Large Scale Image Completion via Co-Modulated Generative Adversarial Networks”(通过协同调制生成对抗网络进行大规模图像填充),能够实现一键修图。

让我们先来看看它的修复“手艺”吧!

下面这两张图片,左图是原图,右图是修复过的图像。与左图相比,右图中的裂缝是不是没有了?

不仅如此,遮挡物也能修复!将左边的原图经过处理后,右图呈现出的景物更加完整。

残缺的图片也可以自动补全啦!原来破败的房子,处理之后,焕然一新。

现在这项研究成果已经可以在线体验啦!点击阅读原文,即可上手尝试。

技术思想:图像生成能力

事实上,图像填充是深度学习领域内的一个热点任务。尽管现有方法对于小规模、稀疏区域的填充可以取得不错的效果,但对于大规模的缺失区域始终无能为力。为解决这一问题,微软亚洲研究院的研究员们提出了协同调制生成式对抗网络,其研究主要思想是:解决大规模图像填充的关键在于需要充分的图像生成能力。

考虑一个极端情况——如果一张图像绝大部分的面积被遮挡,那么这一情况下图像填充的难度就几乎等价于无条件的图像生成。由此可以推断,充足的图像生成能力将能够极大地助力大区域的图像填充。

当前,越来越多基于条件生成对抗网络(conditional GAN)的图像填充方法被提出。因为这一任务极具挑战性,大量研究者都在针对这一具体任务来优化网络结构,如利用中间表征信息(边缘、结构等)来构建多阶段的生成网络。但即便如此,这些方法在面对大规模的缺失区域时仍然无法生成合理的、与已知部分协调的图像内容。而利用图像的生成能力则能够在一定程度上解决这个挑战。

技术核心:协同调制生成对抗网络

目前,以 StyleGAN、BigGAN 为代表的无条件生成对抗网络借助调制(modulation)的方法(如图1 (a)),可以在无条件图像生成任务(如随机生成人脸)中取得非常好的结果。

然而,在以图像为条件的生成任务(如图像填充)中,大多数工作仍然无法突破普通图像条件生成器(图1 (b))带来的瓶颈。即便有些工作尝试利用输入图片进行条件调制(图1 (c)),但这种完全依赖于条件输入、缺乏随机性的生成器结构导致其无法泛化到需要弱条件生成能力的任务上,尤其是大区域的图像填充。

图1:不同生成式网络架构对比——(a) 无条件调制生成器,(b) 普通图像条件生成器,(c) 有条件调制生成器,(d) 协同调制生成器。

因此,微软亚洲研究院的研究员们提出了协同调制生成对抗网络(如图1 (d)),协同地将条件输入与随机潜矢量经过映射网络产生的风格表征对每个卷积层进行调制,从而跨越了条件与无条件图像生成领域之间的鸿沟,轻松实现任意大区域的图像填充(见图2、图3),并能够应用于更一般的图像转换(image-to-image translation)任务中(图4)。

图2:从小规模(左)到大规模(右)的缺失区域,协同调制生成对抗网络始终可以创作出高质量、多样的填充内容。

图3:不同图像填充方法之间的比较。协同调制生成对抗网络的填充结果(右一)显著优于其它经典方法,即使面对大面积且不规则的缺失区域,它的效果依旧出色。

图4:协同调制生成对抗网络应用于图像转换任务。在 Edges2Handbags 数据集上,协同调制生成对抗网络表现出严格优于其它经典方法的图像质量(FID)与图像多样性(LPIPS)之间的权衡曲线。

技术评价:配对/无配对感知器辨别分数

研究员们还注意到图像填充领域内缺乏良好的评价指标。此前的研究多采用像素级相似度指标(如 l_1、l_2、SSIM、PSNR 等)或直接采用图像生成领域内如 FID、KID 等的指标。前者更加青睐模糊的生成图像,而后者则完全忽略了图像的配对关系(原图像—填充后图像)。

因此,研究员们提出了新的配对/无配对感知器辨别分数(P-IDS/U-IDS),通过计算生成图像与真实图像在感知器特征空间中的线性可分程度,反映了生成图像的保真度。实验验证了该指标的鲁棒性、直观性、与合理性:

1)P-IDS/U-IDS 在少量数据的情况下能够快速收敛(如图5);

2)P-IDS 能够敏锐地捕捉图像的微小差距(如图6);

3)P-IDS 与人类偏好有着高相关度——FID 与人类偏好的负相关度为0.765,而 P-IDS 的正相关度高达0.870。

图5:相较于 FID,P-IDS/U-IDS 在数据量少的情况下收敛迅速。

图6:P-IDS 能够捕捉图像的细微差距。在 512×512 大小的图像中,一定数量(横轴)的像素被删除并进行了最近邻插值。

协同调制填补了条件与无条件图像生成之间的空缺,可轻松实现任意大区域的图像补全,还可以被拓展至更广泛的图像转换任务。同时,配对/无配对感知器辨别分数(P-IDS/U-IDS)评价指标的诸多良好性能也使其在领域内有着极高的潜力。研究员们希望协同调制生成对抗网络架构能够成为领域内的基准方法,继续推动这一领域的前进。

论文:Large Scale Image Completion via Co-Modulated Generative Adversarial Networks

论文链接:https://arxiv.org/pdf/2103.10428

GitHub:https://github.com/zsyzzsoft/co-mod-gan

Demo:http://comodgan.ml/

本文作者:赵晟宇、崔仁、盛翊伦、董玥、梁霄、张益肇、许燕

备注:修补

图像增强与质量评价交流群

图像增强、去雾、去雨、图像修补、图像恢复等技术,若已为CV君其他账号好友请直接私信。

图像填充不怕区域大!MSRA等提出协同调制生成对抗网络相关推荐

  1. 【转】为了修复打码女神脸,他们提出二阶段生成对抗网络EdgeConnect

    当图像缺失部分太多的时候,结合多阶段方法和边缘先验信息,这个 GAN 实现了高还原度的图像修复,玩法还不止于此. 在过去几年中,深度学习技术在图像修复方面取得了显着进步.然而,许多这些技术无法重建合理 ...

  2. 孪生网络图像相似度_生成对抗网络的进步多大,请看此文

    全文共4175字,预计学习时长8分钟 最近,多项研究采用了生成对抗网络(Generative Adversarial Networks, 简称GANs)这一技术来生成分辨率为1024x1024的高清图 ...

  3. CVPR2017/图像翻译:Image-to-Image Translation with Conditional Adversarial Networks基于条件对抗网络的图像到图像的翻译

    CVPR2017/图像翻译:Image-to-Image Translation with Conditional Adversarial Networks基于条件对抗网络的图像到图像的翻译 0.摘要 ...

  4. 【图像上色小综述】生成对抗网络的GAN法

    点击上方"机器学习与生成对抗网络",关注"星标" 获取有趣.好玩的前沿干货! 超100篇!CVPR 2020最全GAN论文梳理汇总! 0,图像上色及其分类 图像 ...

  5. 四天搞懂生成对抗网络(三)——用CGAN做图像转换的鼻祖pix2pix

    点击左上方蓝字关注我们 [飞桨开发者说]吕坤,唐山广播电视台算法工程师,PPDE飞桨开发者技术专家,喜欢研究GAN等深度学习技术在媒体.教育上的应用. Pix2Pix的不甘の野望 也许是CycleGA ...

  6. ECCV2022 | 生成对抗网络GAN论文汇总(图像转换-图像编辑-图像修复-少样本生成-3D等)...

    图像转换/图像可控编辑 视频生成 少样本生成 图像外修复/结合transformer GAN改进 新数据集 图像增强 3D 图像来源归属分析 一.图像转换/图像可控编辑 1.VecGAN: Image ...

  7. 换脸方法大汇总:生成对抗网络GAN、扩散模型等

    1.One-Shot Face Video Re-enactment using Hybrid Latent Spaces of StyleGAN2 StyleGAN的高保真人像生成,已逐渐克服了单样 ...

  8. 云检测2020:用于高分辨率遥感图像中云检测的自注意力生成对抗网络Self-Attentive Generative Adversarial Network for Cloud Detection

    用于高分辨率遥感图像中云检测的自注意力生成对抗网络Self-Attentive Generative Adversarial Network for Cloud Detection in High R ...

  9. 图像生成对抗生成网络gan_生成对抗网络(GAN)的直观介绍

    图像生成对抗生成网络gan by Thalles Silva 由Thalles Silva 暖身 (Warm up) Let's say there's a very cool party going ...

最新文章

  1. 第八章教材内容总结:异常控制流
  2. [转]Creating Unit Tests for ASP.NET MVC Applications (C#)
  3. SolverParameter
  4. Python实现跨文件全局变量的方法
  5. 享元模式 Composite
  6. mybaties与hibernate的不同点
  7. FreeEIM 来点新知识iOS UIScrollView详解
  8. python管理系统web版_【程序源代码】python web 管理系统开发框架
  9. jquery-ui寺
  10. POJ 1014 Dividing
  11. 医疗大数据技术与应用
  12. LeetCode第 252 场周赛 之5187. 收集足够苹果的最小花园周长
  13. 125KHz 100cm ID 读卡电路_二维码门禁读卡器动态二维码扫描器二维码刷卡读头介绍...
  14. 大数据开发之在idea中开发第一个hadoop程序
  15. Docker架构简介 命令详解
  16. 合成大西瓜游戏|微信合成大西瓜游戏技巧及资源
  17. l1-norm loss l2-norm loss (l1范数和l2范数作为正则项的比较)
  18. 用YOLO玩「吃鸡」?搭载AI的自瞄外挂来了!一枪爆头!又快又准...
  19. layui-icon各种常用动态图标
  20. 一些兼容性的问题收集

热门文章

  1. 设置 mock_Quasar 使用 Mock.js
  2. CentOs基础操作指令(网络配置,RPM包管理)
  3. STM32 - 定时器的设定 - 基础- 02 - Capture/compare channels 和相关设置寄存器 - 和STM32缩写词条解释
  4. android6.0关机动画,安卓系统修改开机动画,关机动画
  5. python扫地机器人开发学校_扫地机器人源码及解释
  6. python 验证码图片 模拟登录_Python 模拟生成动态产生验证码图片的方法
  7. java channel源码_java nio ServerSocketChannel源码分析
  8. 2 找图像连通域_MATLAB--数字图像处理 简单人脸识别
  9. python中的zip是什么意思_python中zip是什么函数
  10. 安装Tomcat7教程