鱼羊 发自 凹非寺
量子位 报道 | 公众号 QbitAI

换脸这件事,从未如此高清。

最流行的开源deepfake模型DeepFakeLab,在今年的更新中,最大分辨率也只达到了320×320。

而这只来自迪士尼和ETHZ的全新deepfake,在保持高度流畅这一优良传统的同时,还一举把分辨率拉高到了1024×1024的水平。

这也是deepfake的分辨率水平首次达到百万像素。

这下,换脸之后,每一根眉毛都仍然清晰可见。

动图画质略有损失,用静态图来感受一下这个清晰度:

难怪网友忍不住惊呼:鹅妹子嘤。

为特效而生的高分辨率deepfake

在此之前,deepfake技术的改进重点主要在平滑换脸效果,而不是提高分辨率。

但320×320这样的分辨率下,手机上看换脸效果可能行云流水看不出破绽,换到大屏幕上,缺陷就会很明显。

为了提高分辨率,迪士尼的这项研究主要引入了逐步训练的多向梳状网络,并提出了一个完整的人脸交换管道,包括保留光线和对比度的混合方法,以减少视频常出现不真实的抖动,生成时间上稳定的视频序列。

具体而言,分为以下几个步骤:

  • 首先,对输入人脸进行裁剪和归一化预处理,将人脸归一化为1024×1024分辨率,并保存归一化参数。

  • 而后,预处理过的图像会被输入到通用编码器中,用相应的解码器Ds进行解码。

  • 最后,用多频段混合方法来交换目标人脸和源人脸。

渐进式训练的多向梳状网络

在网络架构上,迪士尼采用了单个编码器、多个解码器的方案,称作“梳子模型”。

即,网络的编码部分是共享的,而解码路径则分成P个域。

这样一来,一个模型就能同时处理多个源-目标对。

并且,实验表明,与双向模型相比,多向训练模型可以提高表达的保真度。

由于多向编码器允许生成不同的输出,这些输出既可以对应不同的身份,也可以对应不同照明条件下的同一张脸。

此外,还有一重优势是,相比于双向网络,使用单一网络的训练时间能明显减少。

网络的训练,则采取渐进式机制

首先,对高分辨率输入数据进行下采样,形成粗糙的低分辨率图像,先用这些低分辨率图像进行训练。此后,逐步在训练中加入高分辨率图像,逐渐扩大网络的容量。

消除时间伪影

为了消除可见的时间伪影,研究人员还提出了一种稳定标志物定位算法的方法。

具体而言,是对人脸进行初始检测和对其,并标记人脸边界框的宽度w 。

然后,通过在图像平面的不同方向上扰动βw个像素,来重新初始化原始边界框n次。

研究人员发现,在1024×1024分辨率下,β=0.05和n=9时,可以消除所有可见的时间伪影。

保留光线和对比度的混合方法

不过,即使人脸已经完全对齐,姿势和面部表情也完全匹配,光度失准等问题,依然会造成换脸效果的不和谐。

比如出现明显的接缝。

针对这个问题,研究人员采用了保留光线和对比度的多频段混合方法,并强制要求边界平滑效果只传播人脸内部,确保外侧的人脸轮廓不会被平滑掉。

与常用的泊松混合(Poisson blending)方法相比,在目标人脸图像和源人脸图像光照不同的情况下,该方法消除伪影的效果更好。

所以,这个高清deepfake的效果应该如何评价?

直接看对比:

deepfake登上大荧幕,指日可待

不过,研究人员也指出,这个高清deepfake仍有局限性。

从展示的示例中可以看出,大部分人脸图像都是正对镜头的。

夸张的表情、极端的角度和光线,仍然会导致模糊和伪影。

但分辨率的提升,依然给deepfake带来了全新的商业可能性。

迪士尼就曾经在《星球大战》系列电影《侠盗一号》里,用特效换脸技术让已故演员Peter Cushing和Carrie Fisher重返荧幕。

不过,采用传统特效技术,通常要花费数月时间,才能获得几秒钟的画面,成本十分高昂。

相比之下,构建原始模型之后,deepfake在数小时之内就能完成换脸视频的制作。

看来,deepfake技术登上大屏幕,或许离实现不远了。

参考链接:

论文地址:
http://studios.disneyresearch.com/2020/06/29/high-resolution-neural-face-swapping-for-visual-effects/

https://www.theverge.com/2020/6/29/21306889/disney-deepfake-face-swapping-research-megapixel-resolution-film-tv

本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容,未经账号授权,禁止随意转载。

深入解析OceanBase数据库 | 免费报名

在阿里体系内,OceanBase数据库支撑了支付宝、网商银行等重要业务,已成为世界领先的数据库产品。那么其背后有哪些核心技术?

7月2号第三期直播,蚂蚁集团OceanBase数据库资深专家--韩富晟(颜然)将介绍数据库发展演进历史,并深入解析OceanBase实现数据库的机制。

扫码报名,可加入直播交流群,还可获取系列课程直播回放、分享PPT:

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「在看」吧 !

用deepfake拍电影可以安排了:迪士尼发布首个百万像素高分辨率换脸算法相关推荐

  1. HTML5期末大作业:电影个人介主题——迪士尼影视电影(6页)带音乐 HTML+CSS+JavaScript 学生DW网页设计作业成品 web课程设计网页规划与设计 计算机毕设网页设计源码

    HTML5期末大作业:电影个人主题网站设计--迪士尼影视电影(6页)带音乐HTML+CSS+JavaScript 学生DW网页设计作业成品 web课程设计网页规划与设计 计算机毕设网页设计源码 常见网 ...

  2. 迪士尼业务部门大变革,即将强推流媒体

    欢迎关注"创事记"的微信订阅号:sinachuangshiji 文/富贵兔 迪士尼(Walt Disney)日前召开了年度股东大会,在美国当地时间本周二宣布了战略性业务重组计划,将 ...

  3. X战警大战复联要来了?迪士尼收购21世纪福克斯后开始狂秀IP...

    迪士尼中国刚刚在官微宣布,华特迪士尼公司对21世纪福克斯的收购正式生效,此次收购包括21世纪福克斯电影制作业务.电视创意业务.国际电视业务等. 随后,迪士尼官网界面火速更新狂秀IP:阿凡达.惊奇女侠等 ...

  4. 「视频」迪士尼研发机器人皮肤,能做个大白吗?

    迪士尼近日展示了一种机器人皮肤,目的是让人类和机器人更好的互动,感觉这皮肤都能做个大白了呢. 机械机器人一直给我们一种冰冷和尖锐的感觉,而如何让机器人拥有仿真的皮肤也是科学家们一直在探索的事情.近日, ...

  5. 图解迪士尼发展史:华特·迪士尼建立的动画王国

    华特·迪士尼是个教科书案例一般的博学者.他集创新者,企业家,漫画家,配音员,动画师,工作室老板,主题公园的创建者兼所有者和电影制片人众多头衔于一身.他的抱负随着公司(由和哥哥罗伊一起成立于1923年的 ...

  6. Q3流媒体付费用户超1亿,迪士尼迈过“鼠年关”有戏?

    北京时间8月5日美股盘后,迪士尼对外发布新一季度的财报.作为全球最大的娱乐公司之一,迪士尼算是这次疫情里的典型"受害者".虽然三月底以来,美股大盘已经大幅上涨,但是迪士尼的表现仍然 ...

  7. 迪士尼机器人芭蕾舞_迪士尼公园只有卡通公主?内含大量惊人科技感机器人

    提到迪士尼,人们大概会想到人满为患的主题公园或各具美色的卡通公主...然而真相却是,Disney这几年还造了不少科技感满满的机器人!有的还挺萌!一起来瞅瞅: 01.像素机器人战队 2014年,迪士尼的 ...

  8. 上海迪士尼盛大开幕 高德地图带你玩转迪士尼

    16日,上海迪士尼旅游度假区就要正式开园啦!作为内地首座迪士尼乐园,上海迪士尼乐园的开幕吸引了全球迪士尼粉丝的目光,首日及开幕期间就迎来了大量来自全国各地的游客,而随着6月下旬学生考试结束放假后,上海 ...

  9. 高德地图发布上海迪士尼出行攻略 独家上线智慧景区解决方案

    本月16日,让国人翘首以盼的上海迪士尼乐园即将开园迎客,大量游客将从全国各地涌入上海迪士尼乐园.为了让全国各地游客在迪士尼都能玩得开心顺利,上海交警特别联合高德地图于近日发布<上海迪士尼开园首周 ...

最新文章

  1. ZOJ1563 (动态规划)
  2. 重识设计模式-建造者模式(Builder Pattern)
  3. 【错误记录】Android 应用运行报错 ( java.lang.VerifyError: Verifier rejected class androidx. | 逆向中遇到的问题 )
  4. 2021年第十二届蓝桥杯 - 省赛 - C/C++大学C组 - D.相乘
  5. Redis(十四):Jedis
  6. Flutter中消息传递
  7. Mellanox能给英伟达带来什么?
  8. html转义字符及css清除
  9. @Inner使用及原理
  10. 日志存储 elasticsearch vs clickhouse
  11. eclipse svn 忽略 target/.project /.classpath /.settings等 目录
  12. java创建ssh链接池_HttpClient实战三:Spring整合HttpClient连接池
  13. 最新安卓版本对照表,API对照表,持续更新
  14. HashMap HashTable和CurrentHashMap的区别
  15. 人活着就是为了改变世界,不要把时间浪费在重复其他人的生活上。————乔布斯
  16. 高中计算机教学心得,高中教学心得随笔
  17. 弧形玻璃清洁机器人_带弧度的玻璃可以用自动擦玻璃机器人吗?无框玻璃擦窗机器人能用吗?磨砂玻璃用哪种擦窗器...
  18. typora实现上划线等操作
  19. deep deepfm wide 区别_FM算法和DeepFM算法
  20. BUUCTF:[DDCTF2018](╯°□°)╯︵ ┻━┻

热门文章

  1. 如何在Git中更改多次提交的作者和提交者名称以及电子邮件?
  2. #2002 Cannot log in to the MySQL server, PHPMyAdmin/MySQL
  3. css绝对定位如何在不同分辨率下的电脑正常显示定位位置?
  4. 三十八,反射的应用:工厂模式
  5. 1 关于数据仓库维度数据处理的方法探究系列——维的概述
  6. 简释iptables防火墙
  7. c语言一输入运算就显示错误,大咖都会犯的18个c语言入门错误
  8. php中int()强制转换,php下intval()和int强制转换使用的区别是什么
  9. NSNotificationCenter 线程相关
  10. Xamarin Essentials教程地理定位Geolocation