来源:机器之心

来自以色列特拉维夫大学的研究者在生成图像方面又有了新的升级,所用方法在保留源图像身份的同时,在细节编辑上实现了更精细的效果。

英伟达提出的风格迁移模型 StyleGAN 系列,一直是人们用来进行各类脑洞画图实验的流行工具。从生成二次元「老婆」,照片修图,到人物的卡通化,最近几年基于这种技术的应用不一而足。

然而 StyleGAN 也一直有着自己的不足,近年来的各种改进也未能让其在反向生成、细节编辑上实现精细的效果。什么时候我们才能让 AI 随心所欲地修改真人照片呢?

今年 6 月,这样的研究终于出现了。

在以色列特拉维夫大学的论文《Pivotal Tuning for Latent-based Editing of Real Images》中,研究人员通过添加一个简短的训练过程,让 StyleGAN 有了焕然一新的升级。

它的生成效果是这样的,生成更年轻和微笑的 Yann LeCun:

还有更年轻和面部旋转后的吴恩达:

下图中,输入小威廉姆斯、小罗伯特 · 唐尼以及小丑等人的照片,经过处理后,生成了微笑、换发型、老年、张嘴、去胡须、摆 pose 等多样化的形象:

不得不说,效果看起来真不错!

研究介绍

最近,一波先进的面部编辑技术被提出,这些技术利用预训练 StyleGAN 的图像生成能力。要用这种方法成功地编辑图像,必须首先将图像投影到预先训练好的生成器域中。然而,事实证明,StyleGAN 的潜在空间在失真和可编辑性之间产生了内在的折衷,即在保持原始外观和改变其某些属性之间需要折中。

实际上,这意味着将保留 ID 的面部潜在空间编辑应用于生成器域之外的面部仍然具有挑战性。在本文中,来自以色列特拉维夫大学的研究者提出了一种方法来弥补这一差距。该研究稍微改变了生成器,使得一个域外的图像如实的被映射到一个域内的潜码。该研究一个关键的调整,一个简短的训练过程,保留域内潜在区域的编辑质量,同时改变其描述的身份和外观。

论文地址:https://arxiv.org/pdf/2106.05744.pdf

GitHub 地址:https://github.com/danielroich/PTI

Colab 地址:

https://colab.research.google.com/github/danielroich/PTI/blob/main/notebooks/inference_playground.ipynb

在研究者提出的 PTI(Pivotal Tuning Inversion)中,初始反向潜码充当枢轴(pivotal),你可以围绕它微调生成器。同时,正则化项保持附近的身份信息不变,保持局部信息影响。这种训练过程最终会改变身份的外观特征,而不会影响编辑能力。为了补充这一点,该研究进一步表明,枢轴调整(pivotal tuning)还可以调整生成器以适应多个人脸,同时在域的其余部分引入可忽略的失真。

PTI 方法的示意图。

该研究主要是使用 StyleGAN 为真实图像提供生成高质量的编辑。由于 StyleGAN 的特性,可以对其生成的外观进行细微的局部更改,而不会损害其强大的编辑功能。因此,给定一张图像,可能外观看起来不正常(例如一个人处在极端的照明条件下,或浓妆艳抹,或夸张的发型和头饰),该研究建议在生成器的域内找到最近的可编辑点。然后这些点可以被拉向目标,对周围的域影响微乎其微,对其他域的影响也微乎其微。

实验

实验采用 StyleGAN2 生成器 ,对于面部图像,研究者使用在 FFHQ 数据集上预训练的生成器进行处理,并使用 CelebA-HQ 数据集进行评估。此外,该研究还收集了一些其他名人的图像,以突出显示该研究保持身份的能力。

研究者采用以下指标:像素级距离 MSE、感知相似度 LPIPS 、结构相似度 MS SSIM 、以及利用预训练的人脸识别网络实现身份相似度。结果如下表所示。可以得出在每个指标上,该研究都是最佳得分。

如下图所示,即使不考虑可编辑性,该研究的方法对所有的例子都获得了较好的重建效果,特别是域外的例子,因为该方法是唯一可以成功的重建具有挑战性的细节,如脸部绘画或手等细节。

此外,该研究提出的方法还能够重建很多细节,如妆容、光线、皱纹等。

图 6 显示了对 CelebA-HQ 数据集的编辑比较,演示了姿势(顶部)和微笑收敛(底部)编辑。由结果可得在 SG2 W + 上的编辑不会产生所需的效果,例如,底部行中的嘴没有闭合。SG2 和 e4e 实现了更好的编辑,但失去了原有的身份。PTI 在保持身份的同时实现了高质量的编辑。

推荐阅读

  • 【重磅】斯坦福李飞飞《注意力与Transformer》总结,84页ppt开放下载!

  • 分层级联Transformer!苏黎世联邦提出TransCNN: 显著降低了计算/空间复杂度!

  • 清华姚班教师劝退文:读博,你真的想好了吗?

  • 2021李宏毅老师最新40节机器学习课程!附课件+视频资料

  • 最强通道注意力来啦!金字塔分割注意力模块,即插即用,效果显著,已开源!

  • 登上更高峰!颜水成、程明明团队开源ViP,引入三维信息编码机制,无需卷积与注意力

  • 常用 Normalization 方法的总结与思考:BN、LN、IN、GN

  • 注意力可以使MLP完全替代CNN吗? 未来有哪些研究方向?

  • 清华鲁继文团队提出DynamicViT:一种高效的动态稀疏化Token的ViT

  • 并非所有图像都值16x16个词--- 清华&华为提出一种自适应序列长度的动态ViT

重磅!DLer-计算机视觉&Transformer群已成立!

大家好,这是计算机视觉&Transformer论文分享群里,群里会第一时间发布最新的Transformer前沿论文解读及交流分享会,主要设计方向有:图像分类、Transformer、目标检测、目标跟踪、点云与语义分割、GAN、超分辨率、视频超分、人脸检测与识别、动作行为与时空运动、模型压缩和量化剪枝、迁移学习、人体姿态估计等内容。

进群请备注:研究方向+学校/公司+昵称(如Transformer+上交+小明)

???? 长按识别,邀请您进群!

年轻的LeCun、吴恩达长啥样?升级版StyleGAN告诉你相关推荐

  1. 吴恩达专访 Yann LeCun:是的我们曾经历黑暗时刻,但我始终抱有信念

    原标题:吴恩达专访 Yann LeCun:是的我们曾经历黑暗时刻,但我始终抱有信念 雷锋网 AI 科技评论按:时隔半年,终于等来了 Yann LeCun 回忆杀视频. 去年 8 月时,随着 deepl ...

  2. 吴恩达对话Yann LeCun:从相识Hinton到深度学习崛起

    视频链接:https://www.youtube.com/watch?v=JS12eb1cTLE&feature=youtu.be 吴恩达:Hi Yann,你研究神经网络很长一段时间了,我想听 ...

  3. 吴恩达对话LeCun:神经网络跌宕四十年

    夏乙 栗子 发自 凹非寺 量子位 出品 | 公众号 QbitAI Yann LeCun,深度学习三巨头之一. 最近,这位AI领域的传奇大牛,接受了另一位大牛吴恩达的视频专访.在这次对话中,LeCun回 ...

  4. 2020年AI将会如何发展?吴恩达、周志华、Yann LeCun等大神对2020年 AI 发展趋势的预测的预测...

    点击上方"深度学习技术前沿",选择"星标"公众号 资源干货,第一时间送达 本文选自deeplearning.ai 终于,我们开启了 2020 年的进度条,在新的 ...

  5. 吴恩达邀请9位AI大牛畅想2020:李开复看好医疗教育,LeCun强调自监督学习

    来源:凹非寺 2020,AI的研究会有哪些突破? 2020,AI的应用又会有什么变化? 吴恩达DeepLearning.ai旗下的THE BATCH刊物,分享了包括Yann LeCun.李开复.周志华 ...

  6. 马库斯批判Hinton、吴恩达、LeCun等煽风点火!炒作将带来AI寒冬

    2019-12-02 16:29:50 [新智元导读]纽约大学心理学与认知科学教授.畅销书作家加里·马库斯认为,在关于AI研究的新闻报道中,过度的宣传和错误的信息将导致AI寒冬再来.而问题不仅出在媒体 ...

  7. LeCun、吴恩达等4位大佬解析2019人工智能

    来源:Venturebeat 官网 | www.datayuan.cn 今日头条丨一点资讯丨腾讯丨搜狐丨网易丨凤凰丨阿里UC大鱼丨新浪微博丨新浪看点丨百度百家丨博客中国丨趣头条丨腾讯云·云+社区 人工 ...

  8. NIPS 2016精华大盘点丨吴恩达、LeCun等大师的论文、PPT都在这儿,别劳心去找了...

    2016 NIPS 仍在如火如荼地进行,各位大佬也频繁在会场露面,并时不时的搞个"大新闻".雷锋网时刻关注着 NIPS 的一切动态,并把大家较为关注的论文以及学术大师的PPT整理出 ...

  9. 【AI风向标】LeCun、周志华、吴恩达、李开复等众神展望AI的2020年

    关注:决策智能与机器学习,聚焦AI干货 2020,AI的研究会有哪些突破? 2020,AI的应用又会有什么变化? 吴恩达DeepLearning.ai旗下的THE BATCH刊物,分享了包括Yann ...

最新文章

  1. PMP知识要点(第七章)
  2. php如何判断多文件上传,php多文件上传
  3. 测试你C语言水平的十道题,挑战一下?
  4. c++ vector学习
  5. 在VirtualBox里复制VDI文件[转]
  6. linux chown命令: 修改文件或目录的所有者或群组
  7. 华为软件在线测试2018,2018华为软件精英挑战赛
  8. python取绝对值fab_Python transforms.CenterCrop方法代碼示例
  9. nginx源码下载、编译和安装
  10. UserWarning: Usage of dash-separated ‘script-dir‘ will not be supported in future versions. 笔记
  11. excel复制公式递增_快速向下复制Excel公式
  12. 苹果保修期查询_保修期还有6个月的IPhone X 换个“新”主板变“过保”了 维修点这样回应...
  13. 终于搞掂博文自动发送
  14. Java入门-Java执行语句
  15. BAPI上传物料主数据
  16. c语言学生成绩管理论文,C语言学生成绩管理系统源代码论文
  17. 揭秘狂热的支付宝红包“薅羊毛”套路赚钱法
  18. 上海亚商投顾:三大指数集体调整 消费板块逆市活跃
  19. C语言函数及分文件编程
  20. 「高频面试题」浏览器从输入url到页面展示中间发生了什么

热门文章

  1. 图书管理系统需求说明书
  2. android 不同activity之间传递数据
  3. 服务器系统重装后要配置吗,服务器系统重装后要配置吗
  4. JanusGraph报错:Unknown external index backend
  5. python ndarray
  6. 数据归一化 - MinMaxScaler()/MaxAbsScaler() - Python代码
  7. keras图像增强augmentation
  8. EJB3.0定时发送jms(发布/定阅)方式
  9. 活动 | 智源学者计划启动暨联合实验室发布会(4月16日)
  10. C语言与C++不得不说的那点事