栗子晓查发自凹非寺
量子位报道 | 公众号 QbitAI

不敢相信，上面这些人脸，全都是假的。

是英伟达的AI生成的。

借用风格迁移的思路，团队为GAN创造了一种新的生成器。

连GAN之父Goodfellow老师也忍不住发推称赞优秀！

这个结构不需要人类监督，可以自动分离图像中的各种属性。这样，在或粗糙或精细的不同尺度上，人类便能自如地控制GAN的生成。

另外，英伟达的人脸生成模型，支持1024 x 1024的高清大图生成。毕竟，GAN从小吃的是高清数据集。团队还说，数据集很快就要开源了。

实际效果展示

人物自然，背景自然，边缘又自然。足以骗过我这个普通人类的肉眼了。

输入两张图，图A决定生成人物的性别，年龄，头发长度，以及姿势；一张决定其他一切因素：比如肤色、发色、衣服颜色等等。

这样，就可以把图B的一部分人物特征，迁移到图A上了：

不过，人脸的朝向和表情，还是A的。

就算人种发生剧烈变化，也丝毫不会违和。你看，把非裔人类的脸部特征“移植”给四位白种人，嘴唇的厚度、鼻子的形态，以及额头，都有明显的变化。

再来看看从不同尺度调节的效果吧。

这是粗糙尺度 (Coarse Styles) ，也是三种尺度中最大规模的调整，会涉及脸部朝向的变化，脸型和发型也是在这里调整的：

然后看看中间尺度 (Middle Styles) ，调整仅限于面部特征和发色发量了，姿势、发型、脸型都不会有明显变化：

再来就是精细尺度 (Fine Styles) ，只是调整图像的配色，几乎不会给人物变脸了：

全新的生成器

我们前面说过，这个GAN不用人类监督，就可以自动分割图像里的各种部分。

经过训练，它就可以把这些部分，按照一定的方式组合到一起。

具体怎么组合呢：

这种新的生成器，像风格迁移算法一样，把一张图像，看做许多风格 (Styles) 的集合。

每种风格都会在一个不同的尺度 (Scale) 上控制图像的效果：

粗糙 (Coarse Styles) ：姿势、头发、脸型。

中度 (Middle Styles) ：面部特征、眼睛。

精细 (Fine Styles) ：配色。

三者组合在一起，才是最终的生成结果。

调节不同“风格”，就可以在不同尺度上调节人脸图片。

另外，这只GAN还可以自动把那些无关紧要的变化 (Inconsequential Variation) 剔除出去。

所谓无关紧要，就是说画面发生了变化，但看上去主角还是原来的主角。

粗糙的噪音：如大尺度上的卷发程度。

精细的噪音：更加精细的细节，如质地等。

无噪音：没有特征的、像画画一样的样子 (Featurelessly “painterly” look) 。

相同图片，输入不同的噪音，效果就不一样。

人类也可以选择，每种Style的强度 (Strength) 多大。

选择高强度 (High Strength) 的话，生成的图像就会比较多样化，但生成坏图也会有一些。

如果是低强度 (Low Strength) ，生成的图像之间不会有太多变化，但也几乎不会出现坏图。

从结构上来看，这个新的生成器是这样的：

传统的图像生成器仅通过输入层提供潜在编码（Latent Code），英伟达从一开始就舍弃了这种设计方案。

就像上图展示的那样，他们设计的新生成器先将输入从潜在空间Z映射到中间的潜在空间W，将映射网络生成结果输入到下一层。在生成网络g每次卷积运算之后，加入高斯噪声（Gaussian noise），也就是图像的随机变化。

图像在不同尺度上的“风格”，就是由上面的每个卷积层控制的，它实现了直接控制各层级的图像特征强度（Strength）。

从生成图像中的随机自动变化中。它可以无监督地从中分离出图像的“风格”。

发布更强人脸数据集

除了发布图像生成算法外，英伟达从Flickr中选取了7万张1024×1024分辨率的照片，形成了一个新的人脸数据集FFHQ（Flickr-Faces-HQ）。

它能提供了高度多样化、高质量的人脸数据，并且涵盖了比现有高分辨率数据集（如CelebA-HQ）更多的变化，比如更多佩戴眼镜、帽子的照片。

英伟达将在不久后公开提供此数据集，并放出源代码和预训练网络。

最后，给广大猫奴们送出福利。英伟达的图片生成器不仅能用于人脸，研究人员还用LSUN数据集造出了很多猫咪的图片。

你能看出它们都是假的吗？

传送门

论文地址：
https://arxiv.org/pdf/1812.04948.pdf

源代码和人脸数据不久后将放出：
http://stylegan.xyz/code

— 完 —

活动报名

加入社群

量子位AI社群开始招募啦，欢迎对AI感兴趣的同学，在量子位公众号（QbitAI）对话界面回复关键字“交流群”，获取入群方式；

此外，量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募，面向正在从事相关领域的工程师及研究人员。

进专业群请在量子位公众号（QbitAI）对话界面回复关键字“专业群”，获取入群方式。（专业群审核较严，敬请谅解）

诚挚招聘

量子位正在招募编辑/记者，工作地点在北京中关村。期待有才气、有热情的同学加入我们！相关细节，请在量子位公众号(QbitAI)对话界面，回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

这些假脸实在太逼真了！英伟达造出新一代GAN，生成壁纸级高清大图毫无破绽...相关推荐

软硬件解耦太难！英伟达竟“越来越像Mobileye”
尽管Mobileye已经愿意推行"软硬件解耦",但由于车企自己目前还没有能力搞定算法,Mobileye便"不得不"又回到软硬一体化的老路上. 随着软件能力越来越 ...
玩了5万局游戏，英伟达让GameGAN自己生成「吃豆人」，世界首创无需游戏引擎...
本文转载自新智元(AI_era). 新智元报道编辑:元子 [新智元导读]近几年来,英伟达在GAN这个领域越走越远.英伟达推出"GameGAN",不需要任何底层游戏引擎,用 ...
Github趋势榜第一！英伟达发布StyleGAN2，生成图像逼真到吓人
点击我爱计算机视觉标星,更快获取CVML新技术本文转载自新智元(AI_era). 新智元报道来源:arXiv 编辑:肖琴 [新智元导读]StyleGAN是目前最先进的高分辨率图像合成方法, ...
英伟达发布新型GAN，豹子秒变沙皮狗！| 技术头条
作者 | 刘静编译 | 李尔客转自自图灵TOPIA(ID:turingtopia) 5月9日,英伟达首席研究科学家刘明宇在社交网站公布了其最新研究成果:一种新型的GAN,在测试期间只需几张示例图像 ...
英伟达再出GAN神作！多层次特征的风格迁移人脸生成器
选自arXiv 作者:Tero Karras.Samuli Laine.Timo Aila 机器之心编译 GAN 自 2014 年提出以来得到了广泛应用.前不久效果令人震惊的 ICLR 2019 论文 ...
英伟达发布全球唯一千万亿级集成型 AI 工作组服务器
IT之家 11 月 17 日消息今天,英伟达发布全球唯一的千万亿级工作组服务器 NVIDIA DGX Station A100,配备四个 NVIDIA A100 GPU,具有高达 320GB 的 G ...
90TB显存！英伟达发布新一代SuperPod超算，AI算力新巅峰！
周一,黄教主又很淡定的在自家厨房里开完了GTC发布会众所周知,NLP领域的模型一个比一个大,自从百亿参数的Google T5出来后,大部分AI研究者只能望着手里的蹩脚算力兴叹.如今动辄就是千亿.万亿 ...
撑起百万亿参数模型想象力！英伟达发布新一代SuperPOD超算，AI算力新巅峰！
周一,黄教主又很淡定的在自家厨房里开完了GTC发布会. 众所周知,NLP领域的模型一个比一个大,自从百亿参数的Google T5出来后,大部分AI研究者只能望着手里的蹩脚算力兴叹.如今动辄就是千亿.万 ...
英伟达 Magic3D：一句话生成3D模型，分辨率清晰8倍，速度快2倍，编辑文本还可直接修改...
丰色发自凹非寺量子位 | 公众号 QbitAI 一句话生成3D模型,英伟达也来"秀肌肉"了- 来看它最新捣鼓出的Magic3D AI,效果是这样儿的. 输入"坐在 ...

这些假脸实在太逼真了！英伟达造出新一代GAN，生成壁纸级高清大图毫无破绽...

栗子晓查发自凹非寺
量子位报道 | 公众号 QbitAI

实际效果展示

全新的生成器

发布更强人脸数据集

传送门

这些假脸实在太逼真了！英伟达造出新一代GAN，生成壁纸级高清大图毫无破绽...相关推荐

最新文章

热门文章

这些假脸实在太逼真了！英伟达造出新一代GAN，生成壁纸级高清大图毫无破绽...

栗子 晓查 发自 凹非寺 量子位 报道 | 公众号 QbitAI

实际效果展示

全新的生成器

发布更强人脸数据集

传送门

这些假脸实在太逼真了！英伟达造出新一代GAN，生成壁纸级高清大图毫无破绽...相关推荐

最新文章

热门文章

栗子晓查发自凹非寺
量子位报道 | 公众号 QbitAI