杨净 发自 凹非寺
量子位 报道 | 公众号 QbitAI

换脸的GAN,还能有啥突破?

要不,分析个脸部纹理试试。

不得不说,真有点科幻电影的赶脚~

这是英伟达最新推出GAN——Alias-Free GAN,号称更适合图片和视频生成。

尤其是他们之前推出的StyleGAN2相比。

在很多细节上, 比如头发、皱纹的转换、移动都更加顺滑。

我仔细看了看,确实如此。

以前的StyleGAN2,就像是某些固定的点粘在屏幕上,然后脸在屏幕下面移动。

而最新的GAN,则是所有细节全都一起移动。

对此,有网友表示,

StyleGAN2出来后,不知道在此基础上还能有啥突破。

结果现在一对比,StyleGAN2更像是拙劣的视频游戏特效。

论文详情

一个典型的GAN是这样处理脸部细节的。

首先提取一些粗糙、低分辨率的特征,通过上采样层分层细化。随后经过卷积层进行局部混合,并经由非线性映射层引入新的细节。

呈现出来的效果就像是,移动头部导致了鼻子的移动,而鼻子又会移动周围的皮肤毛孔。

StyleGAN2

但这些细节特征有很强的位置偏好。

也就是说,这些细节特征每移动到一个位置,都会在那里停留很久,才移去下一个位置。

依然给人一种不太自然的感觉~

就好比是某个毛孔被固定住了,其他细节绕着它原地摩擦~

用他们的话来说,就是纹理粘连(texture sticking)。

比如StyleGAN2生成的毛发,大多坚持在相同的坐标上,形成了水平的条纹。

本次则主要针对两种类型的移动——平移和旋转,Alias-Free-T和Alias-Free-R。

传统的GAN网络结构,包括卷积、上采样、下采样和非线性这几个方面,而Alias-Free GAN整架构,是在StyleGAN2基础上调整的。

大致是这样一个调整过程。

首先,为了便于对输入的图像进行连续的平移和转化,他们用傅里叶特征取代StyleGAN2中的输入常数。接着,删除了每个像素中的噪声输入,因为它们与特征转换无关。

此外,他们还降低了映射网络的深度,并禁用了混合正则化和路径长度正则化。最后取消了输出跳过连接。

在实践中,还对卷积权重进行了划分。各层遵循严格的2×上采样时间表,在每个分辨率下执行两层,使得上采样后特征图的数量减半。

结果表明,与StyleGAN2相比,Alias-Free GAN在FID分数上表现的更好。

(FID 用于评估GAN生成图像的质量,分数越低说明图像质量越高)

英伟达出品

一作Tero Karras,可能熟悉StyleGAN系列的看出来了。

这位也是StyleGAN系列的主要开发者。

目前Alias-Free GAN还未开源,GitHub上还没有任何内容。

研究人员表示,预计9月开源。

论文链接:
https://nvlabs-fi-cdn.nvidia.com/alias-free-gan/alias-free-gan-paper.pdf
参考链接:
[1]https://news.ycombinator.com/item?id=27606347
[2]https://nvlabs.github.io/alias-free-gan/
[3]https://github.com/NVlabs/alias-free-gan

成熟的GAN会自己分析脸部纹理!英伟达StyleGAN团队出新作,网友:竟然还能有突破...相关推荐

  1. 这些假脸实在太逼真了!英伟达造出新一代GAN,生成壁纸级高清大图毫无破绽...

    栗子 晓查 发自 凹非寺  量子位 报道 | 公众号 QbitAI 不敢相信,上面这些人脸,全都是假的. 是英伟达的AI生成的. 借用风格迁移的思路,团队为GAN创造了一种新的生成器. 连GAN之父G ...

  2. 英伟达再出GAN神作!多层次特征的风格迁移人脸生成器

    选自arXiv 作者:Tero Karras.Samuli Laine.Timo Aila 机器之心编译 GAN 自 2014 年提出以来得到了广泛应用.前不久效果令人震惊的 ICLR 2019 论文 ...

  3. 仅用18天,英伟达新型GAN合成真假难辨高清明星脸

    安妮 编译整理 量子位 出品 | 公众号 QbitAI 考眼力:你能分出下面哪张图是电脑合成的吗? 是这位神似年轻时莱昂纳多的神秘男子-- 还是这位卷发碧瞳女士-- 难以分辨. 但事实是,上面两张均为 ...

  4. 英伟达发布新型GAN,豹子秒变沙皮狗!| 技术头条

    作者 | 刘静 编译 | 李尔客 转自自图灵TOPIA(ID:turingtopia) 5月9日,英伟达首席研究科学家刘明宇在社交网站公布了其最新研究成果:一种新型的GAN,在测试期间只需几张示例图像 ...

  5. 最新3D GAN可生成三维几何数据了!模型速度提升7倍,英伟达斯坦福出品

    明敏 发自 凹非寺 量子位 报道 | 公众号 QbitAI 2D图片变3D,还能给出3D几何数据? 英伟达和斯坦福大学联合推出的这个GAN,真是刷新了3D GAN的新高度. 而且生成画质也更高,视角随 ...

  6. 英伟达推出GAN“超级缝合体”,输入文字草图语义图都能生成逼真照片

    晓查 发自 凹非寺 量子位 报道 | 公众号 QbitAI 继GauGAN2之后,英伟达推出了一个GAN的"超级缝合体"--PoE GAN. PoE GAN可以接受多种模态的输入, ...

  7. 用GAN也可以P图,效果还不输PS | 英伟达出品

    丰色 发自 凹非寺 量子位 报道 | 公众号 QbitAI 把人的眼睛变大.把闭着的嘴合上.转动眼珠: 质量如此逼真.一点糊图的痕迹都没出现-- 如果我不说,你知道这其实是GAN自己P的吗? 除了人脸 ...

  8. drive数据集_英伟达的最强人脸GAN开源了,它吃的高清数据集也开源了

    栗子 假装发自 凹非寺 量子位 出品 | 公众号 QbitAI 你大概还没忘记,英伟达去年年底推出的GAN,它合成的人脸甚至骗得过肉眼. 如今,它终于有了自己的名字,叫StyleGAN.顾名思义,GA ...

  9. 你也能用英伟达GAN造脸了:官方实现有了,高清数据集也开源了

    栗子 假装发自 凹非寺 量子位 出品 | 公众号 QbitAI 你大概还没忘记,英伟达去年年底推出的GAN,它合成的人脸甚至骗得过肉眼. 如今,它终于有了自己的名字,叫StyleGAN.顾名思义,GA ...

最新文章

  1. IxRmhOECiP
  2. 部署虚拟服务器,把网站部署到虚拟服务器
  3. xml突然变成空白_“侏罗纪中期”出现了型增转变填补食肉性恐龙体型发展当中的空白...
  4. Bootstrap之栅格系统
  5. 微服务精华问答 | 如何理解中台战略和微服务
  6. 信息学奥赛C++语言: 求小数的某一位
  7. 一文了解元宇宙最新发展
  8. 集合总结(全是代码)----------java基础学习
  9. 【Linux学习010】算数运算、文件测试、字符测试、位置变量和特殊变量
  10. 苹果系统服务器状态,苹果开发者中心app显示黄色状态详情介绍
  11. 363、Java中级18 -【JDBC - 增、删、改】 2020.06.28
  12. 华为计步器下载手机版_华为健运动计步器
  13. fd leak问题查找(Android)
  14. FlexiTimer2库下载 无偿 分享 仅供学习
  15. 安卓5.0开发环境的搭建
  16. PCL学习:随机采样一致性算法(RANSAC)
  17. 【网络安全入门】SQL注入是什么?SQL注入危害有哪些?
  18. 学习笔记-第十二章 恶意代码分析实战
  19. Anaconda开始菜单快捷方式打不开或找不到——解决办法
  20. Mosaic马赛克图像增强原理

热门文章

  1. 如何在Python中将一个字符串附加到另一个字符串?
  2. JavaScript中的endsWith
  3. 构造函数中的虚拟成员调用
  4. Data Structure_Sort Algorithm
  5. 工程项目如何实现采购效益最大化?
  6. 2017年2月24日星期五
  7. MVC 视图与控制器传值的几种方法
  8. three.js贴图
  9. 一种高效的可变行高列表行定位算法
  10. interrupt InterruptException