梦晨 鱼羊 发自 凹非寺
量子位 报道 | 公众号 QbitAI

这样的于和伟老师,还是你熟悉的那个“接着奏乐接着舞”的feel吗?

而如果容嬷嬷也进入到这个次元,画风竟然……

啊,是世外高人的感觉没错了,容嬷嬷不愧是童年真神!

那如果把互联网大佬们变成这样的画风,又会是怎样一种场面?

先看看雷军,端的是剑眉星目,风流倜傥。

再看BAT的三位大佬……

好家伙,感觉可以直接看图写作,去橙光游戏整一个《互联网风云录之三雄争霸》了。

(万字腹稿已就位……)

连歪果仁,也能被这个次元统一画风。

看图灵奖得主、深度学习三巨头,Bengio狷狂,Hinton坚毅,LeCun冷傲,绝世高手的feel直接拉满,随时可以华山论剑走一波。

Hinton大佬小说男主脸实锤

连LeCun本人看了,都忍不住转发:

想必你也看出来了,这确实又是GAN的杰作。

不过这个来自字节跳动的GAN届新秀,可不止是能当橙光游戏立绘带师。

卡通风:

油画风:

甚至是特朗普风……

只要男女各100张照片作为训练样本,让AgileGAN看上1个小时,它就都能信手拈来。

即使照片上的人戴了口罩,也能把脸补全:

还会自动把帽子转换成头发。戴的帽子越多头发就越密,如果戴5层帽子,就是这样了:

甚至还能开发出一些鬼畜玩法,比如把生成的图像再喂回去……

LeCun变美女

而培养出这么一个文能绘图、武能鬼畜的GAN的,是字节跳动和南洋理工大学。一作宋果鲜,目前在字节跳动担任研究实习生。

并且,AgileGAN的相关论文已经入选SIGGRAPH 2021。

只需100对样本训练1小时

之所以命名为AgileGAN (敏捷GAN),是因为它在一块V100上训练时间只需要1小时,训练数据集也只需要大概100对样本(男女各100张)。

这么强,怎么做到的?

要知道风格迁移的一大难点,就是如照片到卡通这种面部几何形状变化较大的迁移。

如果过于强调保留几何形状特征,会造成不符合审美的扭曲与瑕疵。

但是保留的少了迁移完就和输入的照片不像了。

以前的算法不是脸发绿就是五官扭曲

这是因为,风格迁移算法如StyleGAN2,通把照片的特征编码成向量,逆映射(Inversion Mapping)到隐空间 (Latent Space)。

在此基础上对向量进行变换,再映射回图像,就能产生加减年龄,转换性别的效果。

图源 GAN Inversion: A Survey

但是AgileGAN团队发现,像StyleGAN2那样寻找最佳的隐空间映射是行不通的,因为适用于真实照片的映射并不一定适用于其他风格。

AgileGAN以StyleGAN2为基础进行改进,解决办法分为两部分

第一个是层级变分自编码器 (hierarchical Variational Eutoencoder,简称hVaE)。

在确保映射隐空间分布符合原始高斯分布的同时,将原来的一个隐空间分成不同分辨率的多个隐空间,可以更好地编码图像中不同层次的细节。

第二个是从StyleGAN2的预训练权重开始,重新微调出一个属性感知的生成器

包括不同属性(如性别、年龄)的多个生成路径和多个判别器,以更好地实现依赖属性的风格迁移。

StyleGAN2生成器和属性感知的生成器这两个训练阶段是独立执行的,可以并行训练。

这样分开操作不仅减少了需要的训练数据集大小,还使风格迁移拥有更大的灵活性。

不过使用小数据集时判别器容易过拟合。解决办法是加入一个早期停止策略,一旦风格化效果达到预期,就停止训练。

这还没完,如果用上一阶运动技术(First Order Motion),AgileGAN还可以完成视频的风格迁移。

字节跳动实习生一作

另外,AgileGAN还是个“实习生作品”,成型于一作宋果鲜在字节跳动实习期间。

宋果鲜,本科毕业于中科大数学专业,目前正在南洋理工大学攻读计算机科学博士学位。同时,他也是字节跳动美国AI实验室的实习生。

他的研究方向主要是计算机视觉和计算机图形学,包括基于图像的3D人脸重建/分析、VR/AR应用等等。

所以,在AgileGAN眼里,宋同学又是什么样的呢?

发量和发质,真的很优秀了。

说起来,没准以后就能在抖音直接玩上这样的GAN了。

要是等不及,作者已经放出了试玩版:

http://www.agilegan.com/

论文地址:
https://guoxiansong.github.io/homepage/paper/AgileGAN.pdf

项目地址:
https://guoxiansong.github.io/homepage/agilegan_cn.html

参考资料:
[1]https://www.researchgate.net/publication/348487325_GAN_Inversion_A_Survey
[2]https://mp.weixin.qq.com/s/ayt6g-5KoSV14s6a5mp9pg

字节AI实习生搞出这个玩意儿,撩到了图灵奖大神,我用了用结果画风逐渐鬼畜起来……...相关推荐

  1. 网传字节跳动实习生删除GB以下所有机器学习模型,差点没上头条

    点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达 作者 | 陈大鑫.陈彩娴 来源 | AI科技评论 昨晚脉脉上有网友爆料,字节跳动一位实 ...

  2. 字节跳动实习生提出实例分割新方法:性能超过何恺明Mask R-CNN

    乾明 十三 发自 凹非寺 量子位 报道 | 公众号 QbitAI 框架更简单,但实现了比Mask R-CNN还好的性能. 这是字节跳动实习生提出的实例分割新方法,名为SOLO. 核心在于通过引入&qu ...

  3. 提前泄露小米10至尊版,博主赔偿100万;传字节跳动实习生删除GB以下所有机器学习模型;​快手宣布7月将取消大小周|极客头条

    「极客头条」-- 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧. 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews ...

  4. 字节一实习生求助:晚上九点半在公司打游戏,被领导发现后开除,将来找工作会背调出来吗?...

    打游戏是许多年轻人的爱好,在家里怎么打都无可厚非,但如果是在公司打,还被领导抓住了,那会怎么样呢? 一个字节的实习生发帖求助:打游戏被上上级领导拍照了,商量的结果是自己回学校.不知道会不会影响以后找工 ...

  5. 字节一实习生误删公司所有lite模型,几百人为其善后,有员工处理事故到凌晨三点!...

    一般人对实习生的印象都是谨小慎微,但一个字节的实习生却用实际行动证明:只要胆子够大,实习生也能翻天覆地. 近日,一个字节员工在网上发帖爆料:字节一个实习生把公司所有lite模型都删除了! 什么是lit ...

  6. 字节AI Lab总监李磊离职加入UCSB,马维英后又一大牛回归学界

    转自:新智元 [导读]近日,字节跳动 AI 实验室总监李磊离职,入职 UCSB!去年,该实验室的AI掌门人马维英从字节离开后,入职清华,如今李磊也重返高校.AI大牛从工业界返回学术界再成潮? 又一AI ...

  7. 腾讯“鹅城”开建,斥资370亿;提前泄露小米新机博主被判赔偿100万;传字节跳动实习生删除GB以下所有机器学习模型 | EA周报...

    EA周报 2021年6月25日 每个星期7分钟,元宝带你喝一杯IT人的浓缩咖啡,了解天下事.掌握IT核心技术. 周报看点 1.因提前泄露小米10 至尊版 博主赔偿 100 万美金 2.网传字节跳动实习 ...

  8. 字节测试实习生面试回顾

    字节测试实习生面试 28号内推投简历,31号收到面试通知 职位描述 面试流程 首先简短的自我介绍,问能不能每周实习五天? 然后询问项目细节: 做完项目有没有寻求优化方法?怎么优化的? 过程中遇到的困难 ...

  9. 【AI周报】2021图灵奖揭晓;字节开源veGiantModel;阿里开源EPL;谷歌AI框架Pathways论文放出

    01 行业大事件 2021图灵奖揭晓: 高性能计算先驱.超算TOP500榜单创始人之一Jack Dongarra获奖 他曾说过:未来的计算架构会是 CPU 和 GPU 的结合. 守了一天,终于揭晓! ...

最新文章

  1. 并发基础(一):Executor
  2. Python编程基础:第十一节 for循环For Loops
  3. Mysql中的增删改查操作
  4. 50个常用元器件图片_50个最常用的英语短语(一),值得收藏!
  5. springboot + mysql + mybatis配置
  6. 关于Oracle与MySQL的使用总结
  7. 我的docker随笔26:制作arm平台的python-pandas镜像
  8. Swift--集合类型 数组 字典 集合
  9. nginx main error_page
  10. 一起谈.NET技术,使用WCF实现SOA面向服务编程—— 架构设计
  11. tcp 状态转移图详解
  12. 1971年中国的预警机就上天了
  13. 安骑士主要功能(云盾服务器安全)
  14. xp计算机如何查看内存大小,windowsxp系统下如何查看电脑内存条最大频率
  15. 【考研英语】考研英语小作文万能模板(致歉信)
  16. ACM集训队论文合集
  17. 桑基图绘制的简易操作
  18. MATLAB 写入数据为科学计数法形式/ e03/ 形式
  19. 重来之大学版|学习篇-为什么要学习?为什么要终身学习?别一上来就“费曼学习法”,先学习学习再学习
  20. 低端键盘拆解(牛屎芯片、键盘导电膜、键盘帽、橡胶垫)

热门文章

  1. 如何在TypeScript中删除数组项?
  2. 从JS数组中删除重复的值[duplicate]
  3. 当有键盘时如何在开始编辑时使UITextField向上移动?
  4. 如何替换所有出现的字符串?
  5. Cannot connect to the Docker daemon. Is the docker daemon running on this host?
  6. [Winform]检测exe是否已经运行,并将其置顶
  7. 【原创】rabbitmq-env.conf用户手册(翻译)
  8. 巧用row_number和partition by分组取top数据
  9. Citrix Reciever更改https为http模式
  10. 带有.rdlc报表的项目发布需要注意的问题