笔者最近在集中时间学习对抗生成网络(GAN),特别是深度生成先验进行多用途图像修复与处理,需要对图像修复与处理经典论文进行回顾和精读。

将从图像修复与处理的经典之作DGP《Exploiting Deep Generative Prior for Versatile Image Restoration and Manipulation》开始,重启精读之路。

7月14日,算法大咖1小时精讲Gan论文

扫码0.1元预约直播

提供代码数据集哈

DGP提出了一种挖掘GAN中图像先验的方式,在多个任务上揭示了GAN作为一种通用图像先验的潜力。

论文提出了同时插值隐变量和生成器的渐变式图像反演方法可以应用于复杂图片的对抗防御,在实验中DGP所展现出的强大的像素间空间关系模拟能力也十分有趣。

Deep generative prior的图像复原效果

01

深度生成先验

深度图像先验DIP仅依靠输入图像的统计信息,无法应用于需要更一般的图像统计信息的任务,如图像上色和图像编辑。

我们更感兴趣的是研究一种更通用的图像先验,即在大规模自然图像上训练的GAN生成器用于图像合成。具体来说,是一个基于GAN-inversion的图像重构过程。

在实践中,仅仅通过优化隐向量z难以准确重建ImageNet这样的复杂真实图像。训练GAN的数据集(ImageNet)本身是自然图片中很少的一部分,GAN受限于有限的模型性能和mode collapse,其模拟的图片分布与训练集图片分布也存在鸿沟。

即使存在以上限制,GAN仍然学习了丰富的图片信息,为了利用这些信息并且实现精确重建,我们让生成器online地适应于每张目标图片,即联合优化隐向量z和生成器参数。

我们将此新的目标称为深度生成先验(DGP),DGP显著提高了图像重构的效果。设计合适的距离度量和优化策略非常关键,在重建过程中,生成器原始的生成先验被修改了,输出真实自然图像的能力可能会下降。

7月14日,算法大咖1小时精讲Gan论文

扫码0.1元预约直播

提供代码数据集哈

02

判别器指引的渐进式重建

从 latent space Z 中随机抽取几百个候选的初始 latent code,并选择在度量L下重构效果最好的一个。

在GAN重建中,传统的距离度量方法是 MSE 或 Perceptual loss。优化生成器参数时,将这些传统距离度量用在图像恢复如上色任务中,常常无法准确恢复颜色,并且重建过程中图像会变得模糊,需要设计更好的优化方式来保留生成器的原有信息。

7月14日,算法大咖1小时精讲Gan论文

扫码0.1元预约直播

提供代码数据集哈

我们在该工作中选择使用与生成器对应的判别器来作为距离度量。与Perceptual loss所采用的VGGNet不同,判别器并非在一个第三方的任务上训练,而是在预训练时就与生成器高度耦合,它天然地适用于调整生成器的输出分布。

使用这种基于判别器的距离度量时,重建的过程更加自然和真实,最终颜色恢复的效果也更好。

其中D(x, i)代表以x作为输入时判别器第i个block输出的特征

虽然改进的距离度量带来了更好的效果,但是图像复原的结果仍存在非自然痕迹,因为生成器在针对目标图片优化时,浅层参数匹配好图片整体布局之前,深层参数就开始匹配细节纹理了。

上面的苹果图是几种训练策略的对比,从三行效果可以看出,有的苹果在训练初期没被染上色后期还是没被染上色,我们把这种现象称作“信息滞留”。

对策就是:使用渐进式重建的策略,即在微调生成器时,先优化浅层,再逐渐过渡到深层,让重建过程“先整体后局部”。

与非渐进策略相比,这种渐进策略更好地保留了缺失语义和现有语义之间的一致性。

7月14日,算法大咖1小时精讲Gan论文

扫码0.1元预约直播

提供代码数据集哈

03

重建结果

使用BigGAN模型,基于ImageNet进行训练,使用ImageNet验证集中的1000张图像进行实验,取每类的第一张,相比于其他方法,DGP取得了非常高的PSNR和SSIM,视觉上的重建误差几乎难以察觉。

04

实验

因为GAN刻画了自然图像的先验,因此可以完成很多的任务:比如上色、补全、超分辨率等等,还能进行图像处理。下面放一些效果图。

图像上色

使用ResNet50上的分类精度作为定量评估结果, 下列方法的精度分别为 51.5%, 56.2%, 56.0%, 62.8%。

图像补全

超分辨率

灵活性

随机扰动

7月14日,算法大咖1小时精讲Gan论文

扫码0.1元预约直播

提供代码数据集哈

总结

GAN作为图像领域最强大的生成式模型之一,学习到了丰富的自然图像流形,可以对自然图像的恢复和编辑带来巨大帮助。

利用好大规模预训练模型的能力是深度学习目前各个领域的流行前沿,可以减少对训练数据的需求,整合相近的研究领域。

未来更强大的生成式模型,将带来更具实际应用价值的图像恢复和编辑应用,有望在更广泛的领域落地

7月14日,算法大咖1小时精讲Gan论文

扫码0.1元预约直播

提供代码数据集哈

牛啊!2小时复现顶会论文,他的秘诀是——相关推荐

  1. 全球顶会论文作者,28天手把手带你复现顶会论文

    作为AI从业者,怎样才有所建树,而不是浅尝辄止? 毫无疑问,当然是啃Paper.复现Paper呀! 对于本科生,论文复现可以帮你快速奠定理论基石并彻底搞懂,为课题研究打好基础: 对于硕博生,如果你要发 ...

  2. 干货 | 这样做轻松复现顶会论文

    在科研界,快速刷论文了解一下最前沿研究已经是每个科研er的必备技能了. 尤其是个各大顶会论文,作为当下Al发展的风向标.每一次论文出来,本着不想被别人卷死,就只能去卷别人了的原则,顶会论文大家都希望能 ...

  3. 百度官方论文复现营!顶会审稿人28天手把手带你复现顶会论文

    对于本科生,论文复现可以帮你快速奠定理论基石并彻底搞懂,为课题研究打好基础: 对于硕博生,如果你要发AI论文,就必须要快速大量的阅读特定方向的重要论文,并且理解创新点,进行复现,这才有利于找到自己的研 ...

  4. 面试AI算法岗,你被要求复现顶会论文了嘛?

    如果你准备发AI方向的论文,或准备从事科研工作或已在企业中担任AI算法岗的工作.那么我真诚的向大家推荐,贪心学院<高阶机器学习研修班>,目前全网上应该找不到类似体系化的课程.课程精选了四大 ...

  5. 牛逼!一文看尽2020上半年阿里、腾讯、百度入选AI顶会论文

    (给机器学习算法与Python学习加星标,提升AI技能) 本文来自数据派THU 2020年已过近半,人工智能学术界的顶级会议也举行了不少.在今年已经举行的顶会中,腾讯.百度.阿里等国内科技巨头被收录论 ...

  6. 百度顶会论文复现(1):课程概述

    最近百度推出了一款重磅课程<全球顶会论文作者,28天免费手把手带你复现顶会论文>.这个课程真的是很硬核的课程,这里简单记录下自己的学习过程. 文章目录 1. 课程设计思路和安排 2. 课程 ...

  7. 6个月为50篇AI论文写摘要,网友:这有啥,我曾被要求1.5小时内复现一篇论文...

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 来源丨机器之心 编辑丨极市平台 导读 快速阅读论文是研究人员不可或缺 ...

  8. 导师:寒假复现几篇顶会论文?答:3天1篇!

    3天复现1篇顶会论文!?这怎么做的到? 自己读论文总会遇到很多问题: 不知道从哪里找论文.不知道如何甄别论文质量? 找到论文之后,找不到论文源代码? 好不容易找到代码,却配置不好环境,更别说复现论文了 ...

  9. 导师:顶会论文3天都复现不出来?你退学吧!

    (文末招聘论文讲师) 说起国内的AI算法大赛平台,你首先会想到哪一个? 我猜你第一反应会是:阿里云天池--国内第一人工智能竞赛平台. 天池的比赛打的多了,但天池的论文复现课程你体验过吗?11月23日, ...

最新文章

  1. i2c通信 msp430g2553_请教 AD7150 + MSP430G2553 i2C通讯问题该如何编码??
  2. 系统架构师学习笔记_第三章_连载
  3. Chapter 1 First Sight——25
  4. Android之TextUtils类介绍
  5. 计算机的网络体系以及参考模型
  6. ios13 无法传参_iOS13个人热点功能频遭投诉
  7. matlab中quiver,matlab quiver 比例尺
  8. 利用c#实现远程注入非托管WIN32程序,并利用嵌入汇编调用非托管WIN32程序中的内部过程...
  9. POJ1011 Sticks
  10. [转载] Python time sleep()方法如何使用?
  11. 关于取反符号的相关问题
  12. 基于公网smtp协议实现邮件服务器
  13. qq不加好友实现网页在线聊天(qq在线客服)
  14. rtk采点后如何导入cad_CAD图片导入:如何对JPG图片进行描图
  15. spring集成flyway
  16. OpenSSL下载安装
  17. 相关性分析和相似度计算
  18. Type-C边充电边OTG芯片LDR6028A
  19. matlab 代码转 Python
  20. 微信小程序canvas画布新接口type为2D时drawImage方法的使用以及注意事项

热门文章

  1. deque实现生产者-消费者队列
  2. 白帽SEO霸屏技术分享,霸屏并没有想象的那样神秘
  3. 通过站点优化记录规划书
  4. 排序与分页Pagination
  5. Python-opencv:将文件夹中的图片序列按顺序转化为视频
  6. mysql pt工具 加索引_[转]MySQL中如何为连接添加索引
  7. Spring同一个类事务处理
  8. 网络项目实施方案介绍
  9. RestTemplate的ParameterizedTypeReference
  10. mes系统是什么?mes系统的主要功能有哪些?