视学算法报道

转载自:机器之心

编辑:维度

人脸风格迁移出现新玩法!捷克理工大学联合 Snap 公司创建了一个用于视频中人脸风格实时迁移的框架,既不需要大型数据集和冗长训练周期,更能够在移动端运行。

今年,人脸视频特效在全球又大火特火了一把。年初的「蚂蚁牙黑」(人脸唱歌),还有不久前让老照片动起来的特效,效果都十分惊艳。

风格迁移一直是图像领域的热门方向。那么在视频上做实时人脸画风迁移效果怎么样呢?

是这样的:

当然,视频画风迁移并不是什么新鲜技术了。但这项研究最大的特点在于:移动端、实时,由布拉格捷克理工大学和 Snap 公司的研究者联合完成。目前已经放出了完整论文,相关代码将于下月发布。

  • 项目地址:https://ondrejtexler.github.io/faceblit/

  • 论文地址:https://ondrejtexler.github.io/res/faceblit-paper.pdf

具体而言,研究者提出了一种基于实例的实时视频人脸风格迁移框架 FaceBlit,该框架通过语义上有意义的方式保留了风格的纹理细节,也就是说,用于描绘特定风格特征的笔画出现在目标图像的适当位置。

与以往风格迁移方法相比,该框架不仅保留了目标对象(target subject)的身份,而且不需要大型数据集和冗长训练周期即可实现实时运行。

为此,研究者修改了 Fišer 等人(2017 年)的人脸风格化 pipeline,这样快速生成一组指引通道(guiding channel),不仅可以保留了目标对象的身份,还兼容 Sýkora 等人(2019 年)的基于 patch 合成算法的速度更快变体。

得益于这些方法上的改进,研究者创建了首个即使在移动端,也可以将单个肖像的艺术风格实时迁移至目标视频中人脸的系统框架

完整生成效果详见以下视频:

实时视频人脸风格迁移方法介绍

该研究方法的输入是人脸的风格范例图像????以及目标人脸视频序列 T。研究假设脸部表情的改变以及移动都是基于受试者注视摄像头,并且不被其他物体遮挡。该研究的输出是一个风格化的序列????,它保留了????的重要艺术特征,同时保留了目标主体的身份。尽管已经可以使用 Fišer 等人 [2017] 的方法产生这种输出,但这里的一个主要缺点是,他们的方法仅适用于离线处理。

为了实现实时性能,研究者需要改变计算指引通道的方式,并用 Sýkora 等人 [2019] 提出的更快的变体取代 Fišer 等人 [2016] 的基于缓慢 patch 的合成算法。

在 Fišer 等人提出的方法中,四个指引通道用于驱动合成。分割指引????_seg,通过将面部细分为一组区域(头发、眉毛、鼻子、嘴唇、口腔、眼睛和皮肤)来描绘重要的面部特征;位置指引(positional guide)????_pos,对源面部和目标面部之间的空间对应关系进行编码。这两个通道确保语义上有意义的迁移。

为了保持目标对象的身份特征,Fišer 等人采用了一种外观指引(appearance guide)????_app 方法,通过使用 Shih 等人的摄影风格迁移方法使源图像和目标图像的外观均衡,从而减少了源图像和目标图像之间的域间隙。最后,时间指引????_temp 来执行时间一致性,而????_temp 由风格化帧的运动 - 补偿版本表示。

由于上述指引通道的计算需要几十秒的时间,因此在实时场景下使用它们是不容易处理的。相反,该研究将四通道简化为两个基本的通道????_pos 和 ????_app(图 2 所示),改变底层生成算法,将准备时间减少到几十毫秒。最后,该研究演示了如何将这两个新的指引通道融入到 Sýkora 等人 [2019] 的快速合成算法中。

优势

研究者表示,与其他风格迁移方法相比,生成效果如此好的关键在于三个方面:位置指引、外观指引和直方图匹配。下图为有无位置和外观指引的生成效果图对比,可以看到在无位置指引或外观指引的情况下,生成的动态效果图都不同程度地存在着瑕疵:

此外,在生成目标外观指引 G^T_app 时,直方图匹配也非常重要。从技术上来看,如果不匹配外观指引的直方图,则误差 E 会很快超过阈值 t,这会导致 chunk 明显变小,结果看起来可能会变得模糊。如下图 8a 所示,无直方图匹配时,目标对象的身份无法很好地保留,生成效果比较模糊;而如图 8b 所示,在进行直方图均衡化之后,生成效果有了明显改善,更清晰了。

有无直方图匹配的动态生成效果对比如下:

‍最后,研究者使用一种混合方法,使得目标肖像画栩栩如生,「复刻」视频中人脸的各种表情神态。

神奇的一幕出现了,古雕像画「活了」:

© THE END

转载请联系机器之心公众号获得授权

投稿或寻求报道:content@jiqizhixin.com

点个在看 paper不断!

实时风格迁移,移动端运行,人脸特效又有了新玩法相关推荐

  1. ipad android tv,先河私有云持续大动作:继iPad/Android TV端/系统分享功能后,还有新玩法?...

    原标题:先河私有云持续大动作:继iPad/Android TV端/系统分享功能后,还有新玩法? 由5.1劳动节伊始,勤劳的先河小蜜蜂们(先河研发人员)可是忙疯了! 首先是经过连日来的挑灯夜战,5月18 ...

  2. 智能计算系统实验4-2实时风格迁移

    一.实验目的 学习掌握使用TensorFlow定义完整网络结构的方法,掌握使用TensorFlow恢复模型参数的方法,以实时风格迁移算法为例,掌握在CPU平台上使用TensorFlow进行网络推断的方 ...

  3. 2021年国庆节假期三亚游客离岛免税购物热情高涨、偏爱高端酒店与景点新玩法...

    三亚2021年10月9日 /美通社/ -- 暑期国内局部疫情反复对三亚旅游市场带来较强冲击,2021年国庆节假期三亚迎来传统旺季的出行高峰,三亚市旅游推广局结合大数据平台与旅游统计数据,通过分析研究发 ...

  4. cocos creator 2.4.5消除小游戏新玩法消星星源码H5+安卓+IOS三端源码

    cocos creator 2.4.5消除小游戏新玩法消星星源码H5+安卓+IOS三端源码,开发脚本为typeScript方便扩展和阅读,支持cocos creator2.X版本,完整的源码可直接运营 ...

  5. 基于感知损失的实时风格迁移与超分辨率重建

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 方法概述 许多经典的图像问题都可以被看成是图像变换任务,算法接受一 ...

  6. 实时把你的脸变成名画,手机摄像头新玩法

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 梦晨 发自 凹非寺 量子位 报道 | 公众号 QbitAI 这款叫做 ...

  7. 实时音视频直播新玩法中的混音技术

    作者|冼牛 编辑|覃云 最近半年,视频直播领域中产生不少创新玩法,其中包括 K 歌直播和合唱直播.这些创新玩法都用到实时音频混音技术.今天我们来聊一下混音技术的实现,及其在创新玩法中的应用. 混音的应 ...

  8. 【里程碑】牛X的一塌糊涂,不需要目标板额外做任何代码,实时检测RTOS的任务执行情况,支持在线和脱机玩法

    H7-TOOL详细介绍: https://www.armbbs.cn/forum.php?mod=viewthread&tid=89934 [说明] 这几天一直在思考如何方便的使用SWD接口实 ...

  9. 输出结果 配置_经典架构新玩法:用单端仪表放大器实现全差分输出

    问:我们可以使用仪表放大器生成差分输出信号吗? 答:随着对精度要求的不同提高,全差分信号链组件因出色的性能脱颖而出,这类组件的一个主要优点是可通过信号路由拾取噪声抑制.由于输出会拾取这种噪声,输出经常 ...

最新文章

  1. 怎样使phpnow1.5.6-1支持firebird
  2. 2018年人工智能13大预测
  3. 数据结构——基本概念
  4. 机器学习入门学习笔记:(4.2)SVM的核函数和软间隔
  5. 信号与系统奥本海姆第二版_【中山大学电通信通信号与系统考研】自编的两张小卡片带大家整理一下《奥本海姆·信号与系统》的知识架构...
  6. 201671010144 2016-2017 《java程序设计》--对象与类!
  7. Python 没有函数重载?如何用装饰器实现函数重载?
  8. 苹果调整App Store政策;国内首个5G+8K超高清国产化白皮书发布;Windows计算器移植到到 Linux|极客头条
  9. 四川大学计算机应用基础第二次作业,四川大学川成教2017年秋季《计算机应用基础》第二次作业...
  10. 数据结构(一):并查集
  11. 在线考试系统设计+源码
  12. bootdo定时任务
  13. Linux应用开发环境搭建
  14. excel数据导入matlab失败,Excel数据导入matlab
  15. ORACLE--面试知识点
  16. GPS测量误差来源分析
  17. 第四天作业发布时间:2021-05-31 09:57:49相关课程:RHCSA2021-05-22 
  18. 运维派 企业面试题6 防dos攻击
  19. 使用visDrone数据集训练yolov5检测器
  20. 搜索引擎关键字智能提示实践

热门文章

  1. What Are Words(一诺千金)
  2. (转载)新年——顺民的牢骚
  3. Task04:青少年软件编程(Scratch)等级考试模拟卷(一级)
  4. 软件中常用的“发送邮件”、“打印文档”,其本质是“队列”!
  5. 行列式求值、矩阵求逆
  6. iPhone 隐私新规下的“大地震”:四大平台损失近百亿美元,“连用户是男是女都分不清……”
  7. 算法也是颜值控,Twitter AI更青睐肤白貌美图
  8. AI开源评测基准AI-Rank,为开源建立标准
  9. “我,懂数据,不怕被裁”:这项核心能力到底有多香?
  10. 5大典型模型测试单机训练速度超对标框架,飞桨如何做到?