点击下方卡片,关注“CVer”公众号

AI/CV重磅干货,第一时间送达

博雯 发自 凹非寺
转载自:量子位(QbitAI)

换脸见多了,换身材的见过吗?

给定一张脸,就能自动换一个下半身,服饰、身材、肤色都毫无PS痕迹:

核心技术当然还是我们熟悉的GAN,但不同的是,现在身体的每个部分都能被PS了。

从脸,肤色、服饰、头发等身体各个部位,甚至到肢体动作,都能被随意设计和组合,最终“缝”成一张1024 × 1024分辨率的全身照片:

而且这张“缝合怪”还完全没有拼接行为带来的阴影和边界:

上方的面部由新方法生成,阴影边界很少

怎么做到的?把用于生成人体不同部位的GAN“拼”起来。

这就是Adobe团队最新提出的一种结合多个预训练的GAN进行图像生成的新方法,论文目前已被CVPR 2022接收:

接下来就一起来看看他们到底是如何实现的。

用PS的方式GAN出个人体

如我们开头所说,这是一种将多个GAN拼接起来使用的方法,研究团队将其称之为InsetGAN

共分为两类GAN:

  • 全身GAN (Full-Body GAN),基于中等质量的数据进行训练并生成一个人体。

  • 部分GAN,其中包含了多个针对脸部、手、脚等特定部位进行训练的GAN。

这两类GAN的合作方式类似于PS:全身GAN是一张已经有打底线稿的画布,而部分GAN则是一张一张叠在上面的图层。

但不同边界的“图层”在叠到画布上时,一定会有出现对齐问题。

比如,将一张脸添加到身体上时,在肤色的一致性、衣服边界和头发披散的自然性上可能出现细节的扭曲和丢失,或出现伪影(Artifacts):

如何才能更好地协调多个GAN,让它们产生一致的像素呢?

研究团队设计了这样一种架构:

他们首先引入了一个边界框检测器,检测部分GAN生成的特定区域在底层画布,也就是全身GAN生成的区域中的位置,经过裁剪后再将特定区域嵌入。

这一过程相当于找到了两个区域之间的一种随机潜码 (latent code),使得所选区域的边界能够和嵌入区域相匹配,以实现无缝合成。

同时,他们还会对这两个区域进行下采样(Downsample),再次增加图像像素内容的一致性。

基于这种方法,InsetGAN可以在训练后生成多张完整人像,同时肤色、头发和相关姿势都能作出相应调整:

研究团队也与之前的生成全身人像的方法CoModGAN做了比较,都是基于左侧的人体进行面部的替换,显然,InsetGAN生成的面部更加自然:

上为InsetGAN,下为CoModGAN

作者介绍

论文共有6位作者,5位来自Adobe研究院,还有1位来自阿卜杜拉国王科技大学(KAUST)。

其中有Adobe的首席科学家Jingwan Lu,是PS 2020中智能肖像、皮肤平滑、着色和神经风格化等过滤器的主要算法贡献者,也是RealBrush笔刷合成器的开发者。

她目前领导的团队主要致力于利用大数据和生成性AI(比如GAN)来进行视觉内容的创造。

所以,准备好足不出户换身材了吗?(手动狗头)

论文地址:
https://arxiv.org/abs/2203.07293

参考链接:
[1]https://www.youtube.com/watch?v=YKFYEt5hvOo
[2]http://afruehstueck.github.io/insetgan/

ICCV和CVPR 2021论文和代码下载后台回复:CVPR2021,即可下载CVPR 2021论文和代码开源的论文合集后台回复:ICCV2021,即可下载ICCV 2021论文和代码开源的论文合集后台回复:Transformer综述,即可下载最新的3篇Transformer综述PDF
CVer-Transformer交流群成立
扫描下方二维码,或者添加微信:CVer6666,即可添加CVer小助手微信,便可申请加入CVer-Transformer 微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer等。
一定要备注:研究方向+地点+学校/公司+昵称(如Transformer+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群▲扫码或加微信: CVer6666,进交流群
CVer学术交流群(知识星球)来了!想要了解最新最快最好的CV/DL/ML论文速递、优质开源项目、学习教程和实战训练等资料,欢迎扫描下方二维码,加入CVer学术交流群,已汇集数千人!▲扫码进群
▲点击上方卡片,关注CVer公众号整理不易,请点赞和在看

CVPR 2022 | Adobe把GAN搞成了缝合怪!凭空P出一张1024分辨率全身人像相关推荐

  1. Adobe把GAN搞成了缝合怪,凭空P出一张1024分辨率全身人像 | CVPR 2022

    博雯 发自 凹非寺 量子位 | 公众号 QbitAI 换脸见多了,换身材的见过吗? 给定一张脸,就能自动换一个下半身,服饰.身材.肤色都毫无PS痕迹: 核心技术当然还是我们熟悉的GAN,但不同的是,现 ...

  2. CVPR 2022 | 阿里达摩院新技术,美体塑形一键就成

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 来源丨人脸人体重建 亚洲 四 大 "邪 术",想必大家都早已耳闻 亚 洲 四 大 ...

  3. CVPR 2022|处理速度仅用0.2秒!港科大腾讯AI lab开源基于GAN反演的高保真图像编辑算法...

    作者丨Tengfei Wang 来源丨港科大.腾讯 AI Lab 编辑丨极市平台 论文:https://arxiv.org/abs/2109.06590 代码:https://github.com/T ...

  4. CVPR 2022论文分享会来了!ResNet/Swin/DenseNet等作者重磅嘉宾探讨好论文是怎么炼成的?...

    点击下方卡片,关注"CVer"公众号 AI/CV重磅干货,第一时间送达 4 月 23 日,CVPR 2022 论文分享会等你准时线上赴约!为了让更多感兴趣的朋友参与到精彩的分享会中 ...

  5. 25岁同济硕士生斩获CVPR 2022 最佳学生论文奖

    来源:量子位 从汽车动力学"转行"智能视觉感知,3年斩获2篇CVPR论文. 其中一篇,还是今年CVPR论文的最佳学生论文奖. 奖项颁了二十多届,今年第一次颁给来自中国高校的学生一作 ...

  6. 最新更新的 CVPR 2022 论文66篇

    以下是最新更新的 CVPR 2022 论文,包括的研究方向有:目标检测.预训练语言模型.Transformer.图像修复.模型训练.视觉语言表征学习.对比学习.深度估计.语义分割.动作检测.人脸防伪. ...

  7. CVPR 2022 | 华南理工提出VISTA:双跨视角空间注意力机制实现3D目标检测SOTA,即插即用...

    来源:机器之心 本文提出了 VISTA,一种新颖的即插即用多视角融合策略,用于准确的 3D 对象检测.为了使 VISTA 能够关注特定目标而不是一般点,研究者提出限制学习的注意力权重的方差.将分类和回 ...

  8. CVPR 2022 | 一种有效提升点云语义分割边界性能的学习框架

    Contrastive Boundary Learning for Point Cloud Segmentation (CVPR 2022) 代码地址:https://github.com/Liyao ...

  9. (附链接)CVPR 2022 | 模型难复现不一定是作者的错,最新研究发现模型架构要背锅...

    编者荐语 在不同初始化条件下,同一神经网络经过两次训练可以得到相同的结果吗? 转载自丨量子位 CVPR 2022的一篇研究通过将决策边界 (Decision Boundary)可视化的方法,给出了答案 ...

最新文章

  1. Oculus除创始人之外的第一位员工离职
  2. RDIFramework.NET 中多表关联查询分页实例
  3. java 抽象类与接口区别是什么_JAVA中抽象类与接口的区别,分别在什么情况下使用它们...
  4. G - 水陆距离 HihoCoder - 1478(广搜+队列先进先出性质)
  5. 什么是javax.ws.rs.core.context? [ 第2部分 ]
  6. 人间不值得?250000条数据分析李诞是不是被骂火的
  7. 递归删除.svn文件夹以及文件
  8. [leetcode]Word Ladder
  9. php cannot bind port to socket,PHP基于socket实现客户端和服务端通讯功能
  10. css就近原则_CSS的引入方式和优先级
  11. java学习(java入门)
  12. python模拟别人说话的声音传得最远_谁说话的声音传得最远脑筋急转弯的答案是什么...
  13. UI界面视觉设计之字体要素--安卓-ios-网页常用字体
  14. 如何理解IT、OT、CT?
  15. 2021-2027全球与中国硅胶注塑机市场现状及未来发展趋势
  16. 这个神器让我的 Bug 少了一半
  17. FinTech普惠中国,技术创新智慧杭州
  18. mysql那本书适合初学者_8本书让你成为一个更加开放的领导者
  19. CircRNA–miRNA–mRNA调控网络分析
  20. 最新国内云计算服务商市场占有率排名,阿里云腾讯云华为云谁排名高

热门文章

  1. 简述3D点云配准算法
  2. java gis 矢量数据结构_地理信息系统矢量数据结构.ppt
  3. Apple Pay入门
  4. 《程序员健康指南》作者Joe Kutner:在运动中工作
  5. java8 JDK1.8 API 中文 翻译版 java帮助文档
  6. matlab 包含nan的行,matlab中去除含有NaN的行或者列
  7. 树莓派与GPS模块的那些事儿
  8. 畜生,想你了*_*发信站: BBS 哈工大紫丁香站
  9. 计算机系班级未来展望,关于班级学习委员的工作总结5篇
  10. Scratch源码使用ArduinoConnector.ane与串口通信