栗子 晓查 发自 凹非寺 
量子位 报道 | 公众号 QbitAI

不敢相信,上面这些人脸,全都是假的。

是英伟达的AI生成的。

借用风格迁移的思路,团队为GAN创造了一种新的生成器

连GAN之父Goodfellow老师也忍不住发推称赞优秀!

这个结构不需要人类监督,可以自动分离图像中的各种属性。这样,在或粗糙或精细的不同尺度上,人类便能自如地控制GAN的生成。

另外,英伟达的人脸生成模型,支持1024 x 1024的高清大图生成。毕竟,GAN从小吃的是高清数据集。团队还说,数据集很快就要开源了。

实际效果展示

人物自然,背景自然,边缘又自然。足以骗过我这个普通人类的肉眼了。

输入两张图,图A决定生成人物的性别,年龄,头发长度,以及姿势;一张决定其他一切因素:比如肤色、发色、衣服颜色等等。

这样,就可以把图B的一部分人物特征,迁移到图A上了:

不过,人脸的朝向和表情,还是A的。

就算人种发生剧烈变化,也丝毫不会违和。你看,把非裔人类的脸部特征“移植”给四位白种人,嘴唇的厚度、鼻子的形态,以及额头,都有明显的变化。

再来看看从不同尺度调节的效果吧。

这是粗糙尺度 (Coarse Styles) ,也是三种尺度中最大规模的调整,会涉及脸部朝向的变化,脸型和发型也是在这里调整的:

然后看看中间尺度 (Middle Styles) ,调整仅限于面部特征和发色发量了,姿势、发型、脸型都不会有明显变化:

再来就是精细尺度 (Fine Styles) ,只是调整图像的配色,几乎不会给人物变脸了:

全新的生成器

我们前面说过,这个GAN不用人类监督,就可以自动分割图像里的各种部分。

经过训练,它就可以把这些部分,按照一定的方式组合到一起。

具体怎么组合呢:

这种新的生成器,像风格迁移算法一样,把一张图像,看做许多风格 (Styles) 的集合。

每种风格都会在一个不同的尺度 (Scale) 上控制图像的效果:

粗糙 (Coarse Styles) :姿势、头发、脸型。

中度 (Middle Styles) :面部特征、眼睛。

精细 (Fine Styles) :配色。

三者组合在一起,才是最终的生成结果。

调节不同“风格”,就可以在不同尺度上调节人脸图片。

另外,这只GAN还可以自动把那些无关紧要的变化 (Inconsequential Variation) 剔除出去。

所谓无关紧要,就是说画面发生了变化,但看上去主角还是原来的主角。

粗糙的噪音:如大尺度上的卷发程度。

精细的噪音:更加精细的细节,如质地等。

无噪音:没有特征的、像画画一样的样子 (Featurelessly “painterly” look) 。

相同图片,输入不同的噪音,效果就不一样。

人类也可以选择,每种Style的强度 (Strength) 多大。

选择高强度 (High Strength) 的话,生成的图像就会比较多样化,但生成坏图也会有一些。

如果是低强度 (Low Strength) ,生成的图像之间不会有太多变化,但也几乎不会出现坏图。

从结构上来看,这个新的生成器是这样的:

传统的图像生成器仅通过输入层提供潜在编码(Latent Code),英伟达从一开始就舍弃了这种设计方案。

就像上图展示的那样,他们设计的新生成器先将输入从潜在空间Z映射到中间的潜在空间W,将映射网络生成结果输入到下一层。在生成网络g每次卷积运算之后,加入高斯噪声(Gaussian noise),也就是图像的随机变化。

图像在不同尺度上的“风格”,就是由上面的每个卷积层控制的,它实现了直接控制各层级的图像特征强度(Strength)。

从生成图像中的随机自动变化中。它可以无监督地从中分离出图像的“风格”。

发布更强人脸数据集

除了发布图像生成算法外,英伟达从Flickr中选取了7万张1024×1024分辨率的照片,形成了一个新的人脸数据集FFHQ(Flickr-Faces-HQ)。

它能提供了高度多样化、高质量的人脸数据,并且涵盖了比现有高分辨率数据集(如CelebA-HQ)更多的变化,比如更多佩戴眼镜、帽子的照片。

英伟达将在不久后公开提供此数据集,并放出源代码和预训练网络。

最后,给广大猫奴们送出福利。英伟达的图片生成器不仅能用于人脸,研究人员还用LSUN数据集造出了很多猫咪的图片。

你能看出它们都是假的吗?

传送门

论文地址:
https://arxiv.org/pdf/1812.04948.pdf

源代码和人脸数据不久后将放出:
http://stylegan.xyz/code

活动报名

加入社群

量子位AI社群开始招募啦,欢迎对AI感兴趣的同学,在量子位公众号(QbitAI)对话界面回复关键字“交流群”,获取入群方式;

此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。

进专业群请在量子位公众号(QbitAI)对话界面回复关键字“专业群”,获取入群方式。(专业群审核较严,敬请谅解)

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

这些假脸实在太逼真了!英伟达造出新一代GAN,生成壁纸级高清大图毫无破绽...相关推荐

  1. 软硬件解耦太难!英伟达竟“越来越像Mobileye”

    尽管Mobileye已经愿意推行"软硬件解耦",但由于车企自己目前还没有能力搞定算法,Mobileye便"不得不"又回到软硬一体化的老路上. 随着软件能力越来越 ...

  2. 玩了5万局游戏,英伟达让GameGAN自己生成「吃豆人」,世界首创无需游戏引擎...

    本文转载自新智元(AI_era).   新智元报道   编辑:元子 [新智元导读]近几年来,英伟达在GAN这个领域越走越远.英伟达推出"GameGAN",不需要任何底层游戏引擎,用 ...

  3. Github趋势榜第一!英伟达发布StyleGAN2,生成图像逼真到吓人

    点击我爱计算机视觉标星,更快获取CVML新技术 本文转载自新智元(AI_era).   新智元报道   来源:arXiv 编辑:肖琴 [新智元导读]StyleGAN是目前最先进的高分辨率图像合成方法, ...

  4. 英伟达发布新型GAN,豹子秒变沙皮狗!| 技术头条

    作者 | 刘静 编译 | 李尔客 转自自图灵TOPIA(ID:turingtopia) 5月9日,英伟达首席研究科学家刘明宇在社交网站公布了其最新研究成果:一种新型的GAN,在测试期间只需几张示例图像 ...

  5. 英伟达再出GAN神作!多层次特征的风格迁移人脸生成器

    选自arXiv 作者:Tero Karras.Samuli Laine.Timo Aila 机器之心编译 GAN 自 2014 年提出以来得到了广泛应用.前不久效果令人震惊的 ICLR 2019 论文 ...

  6. 英伟达发布全球唯一千万亿级集成型 AI 工作组服务器

    IT之家 11 月 17 日消息 今天,英伟达发布全球唯一的千万亿级工作组服务器 NVIDIA DGX Station A100,配备四个 NVIDIA A100 GPU,具有高达 320GB 的 G ...

  7. 90TB显存!英伟达发布新一代SuperPod超算,AI算力新巅峰!

    周一,黄教主又很淡定的在自家厨房里开完了GTC发布会 众所周知,NLP领域的模型一个比一个大,自从百亿参数的Google T5出来后,大部分AI研究者只能望着手里的蹩脚算力兴叹.如今动辄就是千亿.万亿 ...

  8. 撑起百万亿参数模型想象力!英伟达发布新一代SuperPOD超算,AI算力新巅峰!

    周一,黄教主又很淡定的在自家厨房里开完了GTC发布会. 众所周知,NLP领域的模型一个比一个大,自从百亿参数的Google T5出来后,大部分AI研究者只能望着手里的蹩脚算力兴叹.如今动辄就是千亿.万 ...

  9. 英伟达 Magic3D:一句话生成3D模型,分辨率清晰8倍,速度快2倍,编辑文本还可直接修改...

    丰色 发自 凹非寺  量子位 | 公众号 QbitAI 一句话生成3D模型,英伟达也来"秀肌肉"了- 来看它最新捣鼓出的Magic3D AI,效果是这样儿的. 输入"坐在 ...

最新文章

  1. 数据库事务和spring事务的区别
  2. Linux下重要目录功能介绍
  3. Python 学习笔记(2) - 基本概念、运算符与表达式
  4. 用云闪付乘坐公交地铁,能否享受到优惠,取决于这一点
  5. Chapter7-7_Deep Learning for Coreference Resolution
  6. Linux系列之fdisk 分区挂盘
  7. NanoDet:这是个小于4M超轻量目标检测模型
  8. Java并发编程-线程池底层工作原理
  9. wttr.in -- a magical website
  10. 在线的代码托管平台 coding.net ===中国扩展版github
  11. [转载] 请不要做浮躁的人
  12. python计算正方形、立方体、圆、球的面积和体积
  13. 网络游戏防沉迷的理想与现实
  14. win10配置JDK环境变量
  15. 神经网络计算棒怎么用,微软神经网络计算棒
  16. 翻译: 3.4. Softmax 回归 pytorch
  17. 智能管家---1.项目搭建
  18. LR11补丁下载地址
  19. Schwartz-Zippel Lemma
  20. 解决谷歌浏览器启动页面默认是搜狗浏览?

热门文章

  1. 用户可以使用三种方式使用计算机,计算机操作系统期末复习笔记
  2. Java高级进阶学习资料!Java虚拟机的垃圾回收机制
  3. 带你全面掌握高级知识点!java修改map中的value
  4. 第 5 章 单例设计模式
  5. ubuntu合并终端_技术|初级:如何在终端及图形界面中更新 Ubuntu
  6. 计算机报名填错学制,2017年在职研究生填报信息发现错误怎么修改?
  7. 支持pygame的python有哪些版本_完整构建文件支持PYGAME
  8. mysql一样的查询在我本地很快但是线上很慢_Mysql读写分离原理及主众同步延时如何解决...
  9. c语言 分函数,C语言部分函数.doc
  10. 无法取消 Promise