大家好,我是阿潘

之前 ”蚂蚁呀嘿“ 的算法 火的不行。今年的CVPR 2022 ,又有一个新算法,效果更加炸裂!相比之前,现在对于动漫头像的驱动效果也可以做到非常的逼真!

按照惯例,先看效果视频:

论文:Depth-Aware Generative Adversarial Network for Talking Head Video Generation

资料汇总:

https://arxiv.org/pdf/2203.06605.pdf https://github.com/harlanhong/CVPR2022-DaGAN https://harlanhong.github.io/publications/dagan.html

摘要

talking head 视频生成旨在生成合成人脸视频,其中包含分别来自给定源图像和驱动视频的身份和姿势信息。这项任务的现有工作严重依赖从输入图像中学习的 2D 表示(例如外观和运动)。然而,密集的 3D 面部几何(例如像素深度)对于这项任务非常重要,因为它对我们从本质上生成准确的 3D 面部结构并将噪声信息与可能杂乱的背景区分开来特别有益。然而,密集的 3D 几何标注对于视频来说成本高得令人望而却步,并且通常不适用于此视频生成任务。在本文中,我们首先介绍了一种自监督几何学习方法,可以自动从人脸视频中恢复密集的 3D 几何(即深度),而不需要任何昂贵的 3D 标注数据。基于学习到的密集深度图,我们进一步建议利用它们来估计捕捉人头关键运动的稀疏面部关键点。以更密集的方式,深度还用于学习 3D 感知的跨模态(即外观和深度)注意力,以指导生成运动场以扭曲源图像表示。所有这些贡献构成了一个新颖的深度感知生成对抗网络(DaGAN),用于talking head 生成。进行的大量实验表明,我们提出的方法可以生成高度逼真的人脸,并在看不见的人脸上取得显着效果

Talking Head Generation 是什么

Talking Head Generation 的目的是合成一个人脸视频,这个合成视频的身份和姿态信息分别来源一个给定的source图片和驱动视频

相关方法

Xface

FOMM(目前最流行的方法,之前爆火)

Face-vid2vid 等等

主要挑战

1、现有的工作严重依赖于 2D 表征

2、现有方法确实人脸细节

3、3D 几何标注不可用

然而密集的 3D 面部几何结构对于这项人物非常重要,因为它对我们生成准确的3D面部结果特别又帮助。密集的 3D 几何标注对于视频来说成本很高,并且通常不适用于此视频生成任务。

主要贡献:

1、引入自监督学习方法来从面部视频中恢复显式密集 3D 几何以生成说话头视频的方法

2、提出了一个与深度图合作的框架来解决说话头的生成问题

3、与现有方法相比,我们的方法可以产生更好的结果

模型框架

我们首先引入了一种自监督的几何学习方法,可以自动从人脸视频中恢复密集的 3D 几何,而不需要任何昂贵的 3D 标注数据。

基于学习到的密集深度图,进一步使用深度图来估计稀疏的面部关键点,以捕捉人体头部的关键运动。以更密集的方式,深度还用于学习 3D 感知的跨模态注意力以改进生成结果。

在自监督人脸深度学习模块中,我们使用估计的深度图、源视图和相机矩阵通过公式 3 重构目标视图。

因此,我们可以通过重构损失学习一个满意的人脸深度网络。

从人脸深度网络获得深度图后,我们采用特征扭曲策略来捕捉源图像和目标图像之间的头部运动。

重要的是,在这个模块中预测了一个运动流掩码和一个遮挡图。运动流掩码为估计的密集 2D 运动场分配不同的置信度值,而遮挡图旨在掩盖由于头部旋转变化而应修复的特征图区域,有效嵌入学习的深度图 ,以更密集的方式促进生成。。

我们提出了一种跨模态注意机制,使模型能够更好地保留面部结构并生成与表情相关的微面部运动,因为深度可以为我们提供密集的 3D 几何,这对于保持 面部结构和识别关键动作我们首先展示了从所提出的面部深度网络中恢复的人脸深度图。

我们将学习到的人脸深度图及其对应的 3d 点云可视化。学习到的密集 3D 面部结构显然非常有益,并有显着改善。

此外,我们将密集的深度感知注意力图可视化。

每个查询点的高激活区域主要位于人脸表情相关的部分。

这些可视化结果表明,我们设计的跨模态注意力模块,确实可以解决人脸的微运动,从而在生成过程中产生更生动的表情

另外代码部分作者已开源,感兴趣的可以去尝试哈:

今天的分享就到这里,大家喜欢的话,可以多多支持,感谢!

推荐阅读

Arxiv论文这样子下载!是真的快!

用 AI 做了一个体感游戏!真人拳皇搞起!

杀疯了!本科大神毕设:3D虚拟主播软件!独创AR直播!支持OBS!开源!

CVPR2022 | 曾经火爆全网的算法!升级版来袭,支持卡通形象!相关推荐

  1. 火爆全网!《算法刷题宝典》资源,免费下载!(含代码数据)

    今天给大家推荐一份曾经火爆全网的算法中文小册,据说有不少小伙伴靠这份指南成功掌握了算法的核心技能,成功拿到了 BAT offer. 1. 进入公众号「深度学习技术前沿」: 2. 在消息对话框回复关键词 ...

  2. 直播预告更新 | 火爆全网的ChatGPT为什么这么强?

    点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! ChatGPT  火爆全网的ChatGPT究竟是什么?为什么这么强? ChatGPT会取代搜素引擎吗? ChatGPT凸显的能力会是me ...

  3. 短视频火爆全网也难逃一死

    短视频火爆全网之时,头部IP的大爆发相比于投资者的饥不择食,正在以比图文自媒体运营时代更快的速度吹起一个风口.然而,平台的分成大部分流向了金字塔顶端的头部内容,即便如此也难覆盖其高昂的生产成本.而对于 ...

  4. 这竟然不是阿汤哥?这个「真的吓人」视频火爆全网

    ????????关注后回复 "进群" ,拉你进程序员交流群???????? 机器之心报道 作者丨杜伟.魔王 好莱坞影星「阿汤哥」又一次成为深度造假视频的主角. 近年来,人们对深度造 ...

  5. 卧槽,这竟然不是阿汤哥?这个「真的吓人」视频火爆全网

    (给机器学习算法与Python学习加星标,提升AI技能) 机器之心报道 近年来,人们对深度造假(deepfaking)既着迷又担忧.这项技术可以替换视频中的人脸,并利用机器学习使最终生成效果看起来非常 ...

  6. 生成式 AI:百度“文心一言”对标 ChatGPT?什么技术趋势促使 ChatGPT 火爆全网?

    文章目录 前言 一.生成式 AI 的发展和现状 1.1.什么是生成式 AI? 1.2.生成式 AI 的发展趋势 1.3.AI 生成内容的业务场景和分类 二.生成式 AI 从分析领域到创作领域 2.1. ...

  7. 震惊!火爆全网的ChatGPT背后使用的数据库居然是……

    摘要:ChatGPT承认了自己背后使用的数据库是Cassandra. OpenAI最近发布的AI驱动的智能聊天机器人ChatGPT在互联网上掀起了一阵风暴,热衷于尝试这一新AI成果的网民不在少数.Ch ...

  8. 快手火爆背后的算法逻辑分析

    文中涉及到的推荐算法,大家可以关注下我博文中的推荐算法原理.有需要的可以关注下快手号:SYDLQSCC 营销技巧之快手火爆背后的算法逻辑分析.作为最早一批拿到短视频船票的产品,快手从默默无闻到饱受诟病 ...

  9. 【火爆全网,好评如潮】DS100手持示波器现货发售拉,附原子哥发布会详细讲解视频以及宣传视频...

    关注.星标公众号,直达精彩内容 原子哥发布会讲解DS100视频 DS简要介绍视频 正点原子DS100手持示波器,预售一个月火爆全网,咨询者无数.第一批1000套已经售完.现在是第二批现货发售. 我们截 ...

最新文章

  1. 模板 - 二分图(包含全套常用定理性质)
  2. 如何设计系统的错误码及错误信息
  3. vc c语言图片处理,大佬们,小菜鸟想问一问用vc编译器做简易画图软件
  4. 同一个电脑安装两个jdk版本
  5. GitHub 发布重磅更新:你电脑上的 IDE 可以删了?!
  6. 信息学奥赛一本通(1162:字符串逆序)
  7. Solr7 安装部署 管理界面介绍 1
  8. 全Flash网站和单个Flash作品制作的区别
  9. calendar操作详解
  10. 基于simulink的模糊PID控制器设计与仿真
  11. html css下拉菜单居中,css如何设置下拉菜单?
  12. (一)Python基础语法
  13. python 离群值_如何从Numpy数组中删除离群值
  14. 复数基础——复数的基本运算_2
  15. AndroidUSB—OTG通信
  16. nodejs生成唯一uuid
  17. 小米pro显示无服务器,【解决】小米WiFi放大器pro连接不稳定/连接后无网络的问题!!!...
  18. MySQL中的各种锁(行锁、间隙锁、临键锁等等LBCC)
  19. 亚特兰蒂斯【线段树+扫描线+离散化】
  20. POS机钱箱的安装与驱动

热门文章

  1. 榆熙电商:商家如何做好店铺运营?
  2. CSS中的z-index属性的使用
  3. 霍涛的HashMap由 数组 + 链表 组成
  4. 通过电影票房预测来一览机器学习一般流程
  5. 大疆技术总监:如何用六年成为一个全能的机器人工程师(转载)
  6. 导航窗格里计算机在桌面下,电脑桌面工具栏如何调到下方
  7. Teamviewer 15.0 中文版 — 远程控制软件
  8. 永久免费oa办公系统到底靠不靠谱?免费oa办公系统市场分析
  9. Error creating bean with name 'sqlSessionFactory' defined in URL
  10. 【雕爷学编程】Arduino动手做(47)---七段LED数码管模块