选自arXiv

作者:Liqian Ma、Zhe Lin等

机器之心编译

编辑:蛋酱、张倩、杜伟

自拍也能变为他拍,魔幻修图界又出新招式,但效果实在感人。

智能手机的出现,让摄影变成了一项大众艺术,也让越来越多的人爱上「自拍」。但自拍照常常存在构图问题,比如不自然的肩膀姿势、占据一小半镜头的手臂,或者极其诡异的视角。

要想解决这个问题,可以选择随身携带三脚架或自拍杆,也可以选择随身携带一个朋友作为摄影师(该方法对单身狗极其不友好)。

或者,你还可以选择相信后期修图的艺术。近日,来自 Adobe 研究院、UC 伯克利、鲁汶大学的研究者开发了一种「自拍」变「他拍」的新技术,通过识别目标的姿势并生成身体的纹理,在给定的自拍背景中完善和合成人物

在这篇论文中,研究者提出了一种叫做 「Unselfie(非自拍)」的图片转换方法,能够将自拍照中的人物,转变为手臂、肩膀、躯干都比较放松舒展的“他拍图像”。它会把所有举起的手臂调整为向下,然后调整服装细节,最后填充好所有暴露出来的背景区域。

论文链接:https://arxiv.org/pdf/2007.15068.pdf

除了用来修饰社交媒体上的自拍照,这项技术还有很多应用方式,如果你急需一张证件照,而无人能帮你拍摄,那这项技术就能派上用场。

当然,这个方法目前还不太成熟,除了效果一般之外,偶尔还有翻车的时候,比如生成这样的图像:

「自拍」转「他拍」的三大挑战

总的来说,「自拍」转「他拍」存在三大挑战:

  1. 没有成对的训练数据(自拍 - 他拍图像对);

  2. 一个自拍姿势可能对应多个他拍姿势;

  3. 改变姿势会在背景中留下空洞,因此在转换过程中要填补这些空洞。

研究者尝试用之前的几种方法来解决挑战,但实验结果表明,这些方法会产生明显的伪影,其纹理细节也会由于外观信息的高度压缩而丢失。

因此,他们提出借助合成「自拍 - 他拍」图像对和自监督学习的方法来解决上述问题

具体来说,研究者提出了一种利用他拍图像合成对应自拍图像的方法,他们利用非参数化最近姿态搜索模块来检索最接近给定他拍图像的自拍图像,然后合成对应的自拍照。他们还在推理过程中应用了一个最近姿态搜索模块。给定一个自拍姿态输入,模型会检索出与之匹配度最高的他拍姿态,然后利用这个姿态来合成最后的他拍效果。合成的输出的结果不止一个,用户可以从中选择,这就解决了上面提到的挑战 2。

利用上述步骤合成的成对数据可以直接用来训练一个有监督的人像生成网络,但实验结果显示,明显的伪影问题依然没有解决。之前的各种方法对于合成的成对训练数据与真实自拍测试数据之间的像素级 domain gap 非常敏感(如下图 3 所示)。

受到 CVPR 2019 论文《Coordinate-based texture inpainting for pose-guided image generation》的启发,研究者使用基于坐标的修补方法在 UV 空间中修补身体纹理,空间中大部分是不变的原始身体姿态,因此在面临合成数据的瑕疵时更具鲁棒性。此外,基于坐标的修补方法可以重新利用可见像素,从而获得更清晰的结果。

为了应对挑战 3,研究者使用了一个基于合成网络的门控卷积层来完善身体外观和填补背景空白,并保持人体与背景之间的平滑过渡。

总的来说,为了解决「unselfie」任务,研究者提出了下图所示的三段式 pipeline

首先在数据库中搜索最相近的他拍姿势,然后执行基于坐标的身体纹理修补,最后使用合成模块来细化结果,并在背景上合成它们。

实验结果

研究者在定性评估、用户研究和定量评估三方面将他们提出的方法与以往类似方法进行了比较。

下图 7 表明,与之前的 DPIG 和 PATN 方法相比,Unselfie 方法生成了更逼真的人体姿势和背景。

研究者在 Amazon Mechanical Turk (AMT)上对该方法以及 DPIG、VUNET 和 PATN 方法进行了用户研究。结果显示,该方法优于其他方法(如下表 1 所示)。

由于没有对应自拍照的 ground truth 他拍照,因而不能使用 SSIM 之类的指标。所以,为了定量比较该方法与其他基准方法的成像结果,研究者使用了 FID 和 KID 两项指标。结果显示,定量比较中的 FID 和 KID 结果与用户研究保持一致,该方法显著优于其他方法。

方法局限

不过,该方法在以下几个方面依然存在局限。

首先,如下图 10(左)所示,对于具有挑战性的自拍姿势或角度来说,最近姿态搜索模块可能难以找到与之匹配的他拍姿态,这导致合成图像中的手臂或肩膀相较于头部区域过细或过宽。

这一问题在 top-1 结果中出现的比例少于 10%,并且用户通常可以从 top-5 结果中找到良好的兼容姿势。

图 10:失败示例。

此外,图 10 示例也暴露出了背景合成的局限。不过,针对此问题,研究者在下图 11 中也展示了利用已有模型对图像背景进行修复的示例,从而证明了在大规模数据集上训练的图像修复模型的好处。

图 11:背景修复。

最后,系统在 DensePose 检测中容易出错。如上图 10(右)所示,DensePose 没有检测到她的手臂在前方。所以,合成模块在结果中依然保留了她的手臂。

© THE END

转载请联系 机器之心 公众号获得授权

脑洞大开!Adobe等新研究把「自拍」变「他拍」,魔幻修图效果感人相关推荐

  1. java修图sdk_脑洞大开!Adobe等新研究把「自拍」变「他拍」,魔幻修图效果感人...

    自拍也能变为他拍,魔幻修图界又出新招式,但效果实在感人. 智能手机的出现,让摄影变成了一项大众艺术,也让越来越多的人爱上「自拍」.但自拍照常常存在构图问题,比如不自然的肩膀姿势.占据一小半镜头的手臂, ...

  2. 「网络创业家」变「网络发明家」的3个新网站实例

    「发明家」是那位名垂千古的伟大爱迪生,而「创业家」只是隔壁那个中辍找不到工作只好开点的阿狗,我们只敢认自己为「创业家」,不敢「升级」为「发明家」 .但,网络其实还蛮适合「发明」的. 周末看到一个我认为 ...

  3. unity shader 后处理实现水墨风格渲染「Low Poly 」变「水墨画 」

    #水墨风格渲染 这次学校的比赛打算做一个中国古代背景的游戏,所以尝试做了水墨风格的渲染. 主要按以下四步来实现的效果: 根据色调和饱和度调整饱和度. 对图像进行模糊 水墨风格的物体边缘 物体内画笔笔触 ...

  4. Adobe放出P图新研究:就算丢了半个头,也能逼真复原

    乾明 郭一璞 发自 凹非寺  量子位 报道 | 公众号 QbitAI 糟糕. 一张照片被挖了一个"洞". 不好不好,这可是限量版24k纯金足球纪念勋章挂坠的唯一存世照片,要是没了, ...

  5. MIT新研究给量子计算机「泼冷水」:自然界辐射会干扰它,需要研究新对策 | Nature...

    金磊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 谷歌去年提出的「量子优越性」,在业界引起了不小的轰动. 毕竟,量子运算200秒,相当于地球最强超算100年. 看似前景一片大好. 然而,MI ...

  6. 照片你随便拍,「光影」我任意调,MIT谷歌新研究,器材党老法师看了会沉默...

    金磊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 在摄影这件事上,「光影」简直不要太重要. 毕竟大师们摄影作品,大多都是对「光」和「影」的拿捏. △来自俄罗斯摄影师George Mayer ...

  7. 微软旷视人脸识别100%失灵!北京十一学校校友新研究「隐身衣」,帮你保护照片隐私数据...

    萧箫 鱼羊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 左图,右图,你能看出区别吗? 其实,算法已经悄悄给右边的照片加上了微小的修改. 但就是这样肉眼根本看不出来的扰动,就能100%骗过来自 ...

  8. 灾难性遗忘_谷歌大脑新研究:单一任务强化学习遇瓶颈?「灾难性遗忘」的锅!...

    鱼羊 发自 凹非寺量子位 报道 | 公众号 QbitAI 雅达利游戏,又被推上了强化学习基础问题研究的舞台. 来自谷歌大脑的最新研究提出,强化学习虽好,效率却很低下,这是为啥呢? --因为AI遭遇了「 ...

  9. MIT视频新研究:让7000多人看了48个广告,发现「眼见为实」并不成立

      视学算法报道   编辑:David [新智元导读]「眼见为实」真的靠得住吗?MIT新研究表明,在说服力和可信度两个方面,视频并没有比纯文字有多少优势.人人都爱看视频,并不能说明文字的说服力比视频差 ...

最新文章

  1. [JAVA EE] 拦截器
  2. linux python3安装包_Linux下安装python3及相关包
  3. oracle数据物理结构包括,Oracle数据库的物理结构介绍
  4. 谷歌开源下一代推荐系统模拟器:RecSim NG
  5. 干货总结:I2C总线详细要点
  6. 经常需要在开发中使用Excel COM,为简化使用写了这个类,感觉还是不太方便
  7. mysql 5.7.14-winx64_mysql-5.7.14-winx64 解压版本安装
  8. 如何阅读MySQL源码
  9. 浅析C/S、B/S与P2P架构
  10. 无法在linux下启用ttysac0串口 终端只打印信息,启动出现mmc0: error -110 whilst initialising SD card该如何解决?...
  11. vue读取excel表格数据_vue 利用 js-xslx 读取 excel 表格文件
  12. 保障出行安全|科力锐助力长沙黄花国际机场灾备建设
  13. KingbaseES人大金仓学习
  14. 【OpenMMLab AI实战营 学习笔记 DAY(四)-- 目标检测基础知识及评估方法】
  15. 30岁软件测试,目前已失业4个月,迷茫不知该怎么办?
  16. 《F4+2》——团队项目的原型设计与开发
  17. matlab hobject,GUI中更新句柄guidata(hObject,handles)问题!!!
  18. 关于励志的名人名言----做人的名言
  19. 个人对latch的一些个理解
  20. 反病毒引擎设计(二):虚拟机查毒

热门文章

  1. LeetCode实战:不同路径
  2. 《C#精彩实例教程》小组阅读05 -- C#变量与常量
  3. Matlab与线性代数 -- 矩阵的复制
  4. 【数据结构】最小生成树 Prim算法 Kruskal算法
  5. 上海交大发布 MedMNIST 医学图像分析数据集 新基准
  6. 实战:基于技术分析的Python算法交易
  7. 百度与华为重磅合作!李彦宏:技术是百度的信仰
  8. 深度分析蔡徐坤的百万流量数据,揭底哪些是假的!
  9. 如何将三万行代码从Flow移植到TypeScript?
  10. 机器学习大神迈克尔 · 乔丹:我讨厌将机器学习称为AI