理发总是差强人意?

醒醒吧!有些发型不适合你!

如果能在理发前,把这几个发型「试用」就好了。

Tony老师无法给你的,GAN给你。

最近,一个基于GAN的项目Barbershop火了!它不仅可以改变你的头发风格,还可以从多个图像实例中改变颜色。

重要的是,不同于一般的换头发AI,这次的效果让你的脸与新头发完美融合。

一头逼真的「假发」:发型、颜色任你选

把这三样东西交给算法,你就能看到自己的发型合不合适。

1 自己的照片;

2 一张你想拥有的发型的人的照片;

3 另一张你想尝试的头发颜色的照片(或同一张)

例如,我的原生发型是这样的:

来试验一下别样的发型:

‍‍换个直发试试?‍

颜色太显老?换一个试试!‍‍

怎么样是不是新发型与您的头完美融合?再也没有生硬感?

为了确定这个项目符合大众审美,作者还对396名参与者进行了用户研究。答案是:GAN给出的解决方案在95%的情况下都是他们首选的!

量化结果

这是如何做到的?

去掉生硬感!在GAN中加入对齐(alignment)步骤

GAN架构可以学习将一个图像的特定特征或风格移植到另一个图像上。虽然它并不是一项新技术了,但是关于它的应用一种充满新鲜劲儿。

但也有一些细节给GAN的应用带来挑战,譬如:光线的差异带来了遮挡,在两张照片中的头部可能会出现不同,会带来生硬感。

通常情况下,这些使用GANs的技术会试图对图片信息进行编码,并在此编码中明确识别与头发属性相关的区域来切换它们。但只有当两张照片的拍摄条件类似时,这种换头发的效果才会很好——不过,这很难。

因此,作者不得不想点办法。

首先,将换头发分为两个层级:结构(structure)和外观(appearance)。

结构是指头发的几何形状——卷曲的、波浪的还是直的。外观指的是深度编码的信息,包括头发颜色、纹理和照明。

这里的目标是将特定图片的发型和颜色移植到自己的图片上,同时按照图片的光照和属性改变结果,使其一次就能达到令人信服的真实效果,减少步骤和错误来源。

StyleGAN2架构

为了实现这一目标,作者在GANs中增加了一个缺失但必不可少的对齐(alignment)步骤。

事实上,它不是简单地对图像进行编码和合并,而是按照不同的分割掩码稍微改变编码,使两幅图像的潜伏代码更加相似。正如前面提到的,它们都可以编辑头发的结构和风格或外观。

我们知道,GANs使用卷积对信息进行编码。这意味着它使用卷积核来降低每一层的信息规模,并使其越来越小,从而迭代地去除空间细节,同时对所产生的输出的一般信息给予越来越多的价值。

这些信息是从不同的图像中提取的,但现在,如何合并这些信息,才使结果看起来逼真些呢?

流程示意图

这是用图像的分割图完成的。更准确地说,是在我们的目标和参考图像的对齐版本的基础上,生成这个想要的新图像。参考图像是我们自己的图像,而目标图像是我们想要应用的发型。这些分割图告诉我们图像包含什么以及它在哪里,头发、皮肤、眼睛、鼻子等。

分割图

利用这些来自不同图像的信息,他们可以在将图像发送到网络进行编码之前,使用基于StyleGAN2的改良架构,按照目标图像结构对齐。

然后,对于外观和光照问题,他们从目标图像和参考图像中找到这些外观编码的适当混合比例,用于相同的分割区域,使其看起来尽可能的真实。

对比一下就知道效果:左是没有对齐的结果,右是本文的方法。

是不是顺眼很多?

当然,这个过程有点复杂,具体细节都可以在论文中找到。

但请注意,就像大多数GANs的实现一样,他们的架构需要被训练。在这里,他们使用了一个在FFHQ数据集上训练的StyleGAN2基础的网络。然后,由于他们做了许多修改,正如刚才讨论的,他们用198对图像作为发型转移的例子,第二次训练他们修改后的StleGAN2网络,以优化模型外观混合比例和结构编码。

Fail examples.

具体细节参见:

GitHub地址:https://github.com/ZPdesu/Barbershop

论文:https://arxiv.org/pdf/2106.01505.pdf

推荐阅读

  • 【重磅】斯坦福李飞飞《注意力与Transformer》总结,84页ppt开放下载!

  • 只需两行代码,2080Ti 就能当 V100用,这个炼丹神器真牛!

  • 20亿参数,大型视觉Transformer来了,刷新ImageNet Top1

  • Deepfake文字版横空出世:AI高仿你的笔迹只需1个词!

  • 2021年,深度学习还有哪些未饱和、有潜力且处于上升期的研究方向?

  • 最强通道注意力来啦!金字塔分割注意力模块,即插即用,效果显著,已开源!

  • 分层级联Transformer!苏黎世联邦提出TransCNN: 显著降低了计算/空间复杂度!

  • 注意力可以使MLP完全替代CNN吗? 未来有哪些研究方向?

  • 清华鲁继文团队提出DynamicViT:一种高效的动态稀疏化Token的ViT

  • 并非所有图像都值16x16个词--- 清华&华为提出一种自适应序列长度的动态ViT

DLer-计算机视觉交流3群已成立!

大家好,这是DLer-计算机视觉微信交流3群!首先非常感谢大家的支持和鼓励,我们的计算机视觉交流群正在不断扩大人员规模!希望以后能提供更多的资源福利给到大家!欢迎各位Cver加入DLer-计算机视觉微信交流大家庭 。

本群旨在学习交流图像分类、目标检测、目标跟踪、点云与语义分割、GAN、超分辨率、人脸检测与识别、动作行为与时空运动、模型压缩和量化剪枝、迁移学习、人体姿态估计等内容。希望能给大家提供一个更精准的研讨交流平台!!!

进群请备注:研究方向+学校/公司+昵称(如图像分类+上交+小明)

???? 长按识别添加,即可进群!

这个假发太逼真!GAN帮你换发型,毫无违和感!相关推荐

  1. 这个假发太逼真!GAN 帮你换发型,alignment 步骤去掉生硬感

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 转自 | 新智元 来源 | GitHub 编辑 | 小匀 Tony老 ...

  2. 天锋w2019_天锋W2019叫板三星,三星欲哭无泪,网友称这也太逼真了!

    原标题:天锋W2019叫板三星,三星欲哭无泪,网友称这也太逼真了! 提起三星的心系天下系列,很多的机友也是一语难表,又爱又恨.三星W2019更是凭借万元以上的价格成为土豪专列.不过话说回来,纵使三星W ...

  3. 微软的语音太逼真了,用来听小说舒服了

    苏生不惑第344 篇原创文章,将本公众号设为星标,第一时间看最新文章. 2020年分享过如何轻松的将文字转语音 ,今天说说微软的文字转语音,真的太逼真了,话说微软的edge浏览器很早就有大声朗读功能: ...

  4. 帕克西AR一键换发型,让你秒变潮人!

    关于发型的绝望时刻,你肯定也经历过: 参加Party/约会-耗费大量时间做发型,最后却难看si? 想要Copy明星发型同款,自己打造太Faker?   为了更好地展现自己的产品同时服务好客户, 国际化 ...

  5. 改变发型的软件叫什么?来试试这几个换发型软件

    无论是为了特殊场合还是仅仅为了改变形象,尝试不同的发型都是一种令人兴奋的冒险.然而,在我们做出剪发决定之前,我们可能会对新发型的效果产生疑虑. 但是幸运的是,现在我们有一些可以P图的软件,让我们在现实 ...

  6. 人工智能、人脸识别、AR试妆、AR换发型、无人零售、RFID智能货架,2018屈臣氏HWB“未来店铺”用了一大波黑科技

    近日,那个我们熟悉的屈臣氏有些变了,变得让我们不敢相信--这不,上周五刚刚落下帷幕的2018年屈臣氏HWB健康美丽大赏就狠狠惊艳了所有人! 全球知名品牌.美妆时尚大咖和主流媒体齐聚一起,更有王源.景甜 ...

  7. 还在找一键换发型app?快来看这些一键换发型软件

        爱美之心人人有之,相信每个小伙伴都想要有一个好看的发型.但是换发型又不能太冲动,因为一旦剪刀剪下去,后悔都来不及了.那有没有什么好的办法呢?其实我们可以先在软件上看发型效果,然后再考虑是否去理 ...

  8. android 人脸识别换发型,换发型测脸型

    换发型测脸型是一款智能的拍照测脸型软件,上传自己的照片,AI智能面部分析,让你清楚知道自己是什么脸型,换发型测脸型安卓版(免费测试)还有实时换发型功能,帮你找到最适合自己的发型,感兴趣的小伙伴快来下载 ...

  9. 换发型算法_换发型屋软件-换发型屋app下载v1.7 最新版-腾牛安卓网

    换发型屋app下载,拍照就可以换发型了.各类型的发型都可以给大家,这样不用担心剪完头发不好看了哦,来下载尝试看看吧. 换发型屋app下载 换发型屋,一款专业个人发型设计.假发试戴,帮助用户迅速找到合适 ...

最新文章

  1. HttpWebRequest采集读取网站挂载Cookie的通用方法
  2. 设置树莓派SSH连接因超时闲置断开(转)
  3. PHP magic_quotes_gpc
  4. 计算机体系结构:嵌入式方法_计算机考研——计算机二级学科详解
  5. NOIP 2016 迟来的满贯
  6. 全国计算机等级考试题库二级C操作题100套(第09套)
  7. Ext3和Ext4文件系统
  8. matlab 信号与系统(一)—— 上采样(Upsampling)和下采样(Downsampling)
  9. Windows 远程连接后,自动断开,所有程序都自动关闭(待验证,待更新)
  10. 一些忘记了的....
  11. vijos 1002
  12. 将声音也输出到耳机(by quqi99)
  13. 常用的几个框架官网【前端 / 自用】
  14. Traceback (most recent call last):
  15. 获取Json对象中Json数组中的一个Json对象
  16. 盛世昊通:广州车展那些出彩的车,你心动了吗?
  17. 《重构》第七章--读书笔记
  18. 手把手教你如何写作美赛论文
  19. Windows10消费版和商业版有什么区别
  20. 【软件质量】软件一致性

热门文章

  1. 腾讯游戏分享汇:天天飞车六大研发经验
  2. C#调用非托管代码找不到入口点解决办法
  3. 乱思。。。。。。。、、、、、
  4. html语言字体是否依赖客户端,【前端面试】HTML5+CSS3初级面试1
  5. php 图片预览原理,JavaScript_纯JS实现的批量图片预览加载功能,1.实现原理直接见代码,需要一 - phpStudy...
  6. python怎么拆分没有分隔符字符串_python如何拆分含有多种分隔符的字符串
  7. 键盘历史记录实用程序已停止工作 解决办法
  8. tensorflow实战google深度学习框架在线阅读
  9. 费曼学习法与孔子温故知新学习法为两大重要学习法,前者外向表现,后者内省提升
  10. [转]java.lang.instrument 学习(一)