本文经机器之心(almosthuman2014)授权转载,禁止二次转载.

电影《超人总动员》中的巴小飞和《飞屋环游记》中的小罗都是大家熟悉且喜欢的角色。但你有没有想过,这些动漫角色的「真人」版会是什么样子……这项研究将告诉你答案。

将人脸卡通化的应用我们已经见过一些了,比如此前介绍过的 Toonify Yourself !,那么能不能反过来,将卡通形象变成「真人版」呢?

最近 GS&P 广告公司技术总监 Nathan Shipley 利用AI创建了皮克斯角色的「真人」版,看起来效果还不错。(PS:他曾经制作了「复活」艺术家达利的deepfake实例。)

《超人总动员》里的「飞毛腿」巴小飞也太可爱了吧,真人版与原版非常相似。

《飞屋环游记》里的小罗原来「真人版」长这样,有点吓人。虽然五官相似,但头发有点非主流,看样子是把原图中的帽子转换成了头发……

二代蜘蛛侠Miles及其经过转换后的真人版。

不光如此,他还把画作里的人物变「回」现实。比如蒙娜丽莎:

墨西哥女画家弗里达·卡罗的自画像:

上:弗里达·卡罗的自画像(左)与转换后的「真人版」;下:弗里达·卡罗的照片。

这是怎么做到的呢?

Nathan表示他使用了一个叫做pixel2style2pixel的框架,在与源图像形状匹配的StyleGAN FFHQ潜在空间中快速找出「真人版」人脸图像,而且pixel2style2pixel的速度很快!

论文地址:

https://arxiv.org/pdf/2008.00951.pdf
GitHub地址:

https://github.com/eladrich/pixel2style2pixel

pixel2style2pixel 框架

今年8月,来自Penta-AI 和以色列特拉维夫大学的Elad Richardson、Yuval Alaluf等人发表论文,提出了一个图像到图像转换的通用架构——Pixel2Style2Pixel (pSp)。该架构基于一种新型编码器网络构建,可以直接生成一系列风格向量,然后输入到预训练好的StyleGAN生成器,形成可扩展的W+ 潜在空间。

该研究首先展示了编码器可以直接将真实图像嵌入到W+ 潜在空间,且不需要额外的优化。然后介绍了身份损失(identity loss),它可以在输入图像重建中实现更高的性能。

pSp是一个简单的架构,通过利用训练好的固定生成器网络,可以很容易地应用于广泛的图像转换任务。通过风格表示解决图像转换任务,这种方法带来了不依赖局部像素到像素对应的全局方法,且该方法通过风格重采样支持多模态合成。

值得注意的是,pSp架构可以在没有任何标注数据的情况下,将人脸图像与正面姿态对齐,为模糊任务生成多模态结果,如基于分割图的条件人脸生成、基于低分辨率图像构建高分辨率图像。

pSp可应用于基于分割图的人脸生成、超分辨率任务、图像修复等任务。

pSp架构

pSp 架构基于预训练 StyleGAN 生成器、W+ 潜在空间构建而成。在 StyleGAN 中,该研究展示了不同风格输入对应于不同层次的细节,这些细节大致分为三组:粗、中、细。于是,研究人员使用特征金字塔 [27] 扩展编码器主干网络,生成三种层次的特征图,它们使用简单的中间网络map2style来提取风格,如下图 2 所示。

图2:pSp架构图示。

pSp架构首先对ResNet主干网络应用标准特征金字塔,提取特征图;然后,对于每一个目标风格分别训练小型映射网络map2style,以基于对应特征图提取学得的风格;接着,将每一个生成向量输入到StyleGAN中。

pSp的应用场景

1. StyleGAN Inversion

pSp架构在预训练StyleGAN生成器的潜在域中寻找真实图像的潜码。

下图4展示了不同方法在CelebA—HQ数据集上的对比。实验结果表明,pSp方法能够在保留图像身份的同时重建细节,如面部光线、发型和眼镜等。

2. 面部转正

由于需要非局部变换、缺乏成对的训练数据,面部转正是图像转换中比较有挑战性的任务。该研究表明,其提出的基于风格的转换机制能够克服上述挑战,即使没有标注训练数据也可以运行。

下图展示了不同方法的面部转正效果对比:

由实验结果可以看出,当用相同的数据训练时,pix2pixHD无法收敛到令人满意的结果,因为它更依赖于输入和输出对之间的对应关系。而pSp能够很好地处理任务,生成逼真的脸部正面图像,与更复杂的RotateAndRender(R&R)方法效果相当。

3. 条件图像合成

条件图像合成即基于特定输入类型生成逼真图像。研究者在两个条件图像生成任务上对pSp架构进行了测试,分别是基于草图和语义标签图生成高质量的人脸图像。

对于基于草图生成高质量人脸图像任务,该研究对pSp、pix2pixHD、DeepFaceDrawing进行了对比,pSp实现了不错的效果:

对于基于分割图生成人脸图像的任务,研究者在CelebAMask-HQ数据集(包含19个语义类别)上对pix2pixHD、SPADE、CC_FPSE和pSp进行了对比:

4. 超分辨率

研究显示,pSp方法可以根据相应的低分辨率(LR)输入图像来构建高分辨率(HR)面部图像。下图11展示了使用该方法与以往方法的生成图像的视觉对比效果:

此外,为了更好地显示pSp框架的灵活性,研究者还展示了其在局部编辑、图像修复和人脸图像插值三种应用中的效果:

网友:图像分辨率很高,细节需要改进

这一研究工作引起了网友的热议。有人感叹:「图像分辨率实在太高了」、「做好病毒式传播的准备吧」。

该研究有什么实际用处呢?有人畅想:「在若干年内,我们能够以这种方式进行整部影片的转换,那该多酷啊。一部影片看5遍,每次都有不同的风格。」

不止如此,还有人表示:「除了已知情节外,我们还可以构建一些颠覆用户预期的原创故事情节。」

不过,转换后的图片有时存在一些瑕疵,比如上文提到的小罗,转换后不仅帽子消失了,头发变成了金黄色,耳朵也没有了。

参考链接:
https://www.reddit.com/r/MachineLearning/comments/jcuch4/p_creating_real_versions_of_pixar_characters/

END

备注:GAN

GAN

生成对抗网络、GAN等技术,

若已为CV君其他账号好友请直接私信。

我爱计算机视觉

微信号:aicvml

QQ群:805388940

微博知乎:@我爱计算机视觉

投稿:amos@52cv.net

网站:www.52cv.net

在看,让更多人看到  

GAN之绝唱:动漫角色转换真人,《飞屋环游记》中的小罗竟酷似他……相关推荐

  1. cdr怎么转换成psd转换为位图标准_动漫角色转换真人,飞屋环游记中的小罗竟酷似他……...

    机器之心报道 机器之心编辑部 电影<超人总动员>中的巴小飞和<飞屋环游记>中的小罗都是大家熟悉且喜欢的角色.但你有没有想过,这些动漫角色的「真人」版会是什么样子--这项研究将告 ...

  2. AI 轻松实现动漫角色转换真人,《飞屋环游记》中的小罗竟酷似他……

    来源:机器之心 本文约2000字,建议阅读5分钟 你有没有想过,这些动漫角色的真人版会是什么样子-- 电影<超人总动员>中的巴小飞和<飞屋环游记>中的小罗都是大家熟悉且喜欢的角 ...

  3. 追番必备,动漫角色也可以用人脸识别了

    机器之心报道 作者:小舟 用人脸识别找到你「老婆」. 自七十年代以来,人脸识别已经成为了计算机视觉和生物识别领域研究最多的主题之一.近年来,传统的人脸识别方法已经被基于卷积神经网络(CNN)的深度学习 ...

  4. Github大热论文 | U-GAT-IT:基于GAN的新型无监督图像转换

    作者丨武广 学校丨合肥工业大学硕士生 研究方向丨图像生成 生成对抗网络(GAN)在这几年的发展下已经渐渐沉淀下来,在网络的架构.训练的稳定性控制.模型参数设计上都有了指导性的研究成果.我们可以看出 1 ...

  5. 技术到管理岗位的角色转换:从优秀骨干到优秀管理者

    技术到管理岗位的角色转换:从优秀骨干到优秀管理者 作者:王珺之 前言 目前,我国企业95%的中层管理者都是从技术骨干提拔上来的,有相当一部分从技术骨干提拔上来的新任管理者都存在着诸多的困惑和问题.比如 ...

  6. 改进AnimeGANv2的图像动漫风格转换系统

    1.研究背景 图像风格转换技术已经融入到人们的生活中,并被广泛应用于图像艺术化.卡通化.图像着色.滤镜处理和去遮挡等实际场景中,因此,图像风格转换具有重要的研究意义与应用价值.AnimeGANv2是近 ...

  7. Crypko.ai:动漫角色生成和设计平台

    [产品介绍] Crypko.ai是一个基于GAN(生成对抗网络)的高质量动漫角色生成和设计平台,可以让用户通过简单的操作,创造出各种风格和特征的动漫角色,并且可以对角色的头发.脸部.衣服.风格等进行编 ...

  8. 学习如何用平板电脑设计和绘制自己的动漫角色

    创造你自己的动漫人物插图 学习如何用平板电脑设计和绘制自己的动漫角色 大家好,我是Pesa,一个想把快乐和希望融入到讲述故事的插画中的插画师.一点一点地,我画出我喜欢和希望的事物的场景,它把我带到了1 ...

  9. 混合动力simulink模型 转卖新能源混动车型模式转换说明,包含HCU模式转换simulink框图及说明文档

    混合动力simulink模型 转卖新能源混动车型模式转换说明,包含HCU模式转换simulink框图及说明文档 _:1350668221632825嘀嘀嘀哒哒

最新文章

  1. 裴健等9名华人当选加拿大皇家学会院士
  2. 字节跳动一面:i++ 是线程安全的吗?
  3. python头文件math.h_将常量从.h文件导入到python中
  4. SAP Commerce Cloud如何针对Spartacus进行安装
  5. 配置所需要的依赖_配置spring所需要的jar包
  6. 微信URL带来重大调整
  7. 在 Mac 上如何使用 iCloud 钥匙串保护信息安全?
  8. java 链式写法_JAVA中实现链式操作(方法链)的简单例子
  9. Vivado 2019.1下载与安装
  10. 【原创】Web前端性能优化思维导图
  11. phaser H5游戏框架的学习相关推荐教程
  12. edm邮件直投_EDM邮件直投专家 :直接投递Email到收件人邮箱 Version 4.0.9 Build 503
  13. 【读书总结】 《你只是看起来很努力》——致那段应该奋斗的岁月
  14. 输入三角形的3条边长(均为正整数),如果不能构成一个三角形,则输出“not a triangle”;如果能够构成一个直角三角形,则输出“yes”;如果不能构成直角三角形,则输出“no”。
  15. 基于 SpringMVC 的 POST 提交表单出现 405 错误的解决方法之一
  16. KaTex数学公式编辑器相关
  17. CSS的作用与各种样式
  18. Java模拟鼠标键盘输入事件 --- Robot 类
  19. 几个有用的数学概念-数论
  20. POJ 3208 Apocalypse Someday

热门文章

  1. Google免费DNS
  2. 微信web开发者工具下载地址
  3. PPT中实现长图片滚动条显示!(详解)
  4. uniapp图片自适应显示,不裁剪
  5. DeCAF: A Deep Convolutional Activation Featurefor Generic Visual Recognition阅读报告(1)
  6. user_privileges mysql_USER_PRIVILEGES
  7. 基于Matlab的图像拼接与拼接后平均剪切实现
  8. 量筒量水问题1--一个盛满水的池子,有一个6升的量筒,一个5升的量筒,怎样量出3升水?
  9. Redo Log介绍
  10. Foxmail 邮件内链接无法打开问题