一说起VR头像,比较常见的形式就是卡通风格的各类虚拟角色,尽管为用户提供各种自定义选项,但重复率高,而且难以代表真人独一无二的外观。

因此,也有一些根据真人照片、视频生成的3D头像,比如ReadyPlayerMe,特点是成本低、简单易用而且在主流AR/VR平台通用。尽管如此,这样的3D头像依然不够保真,模型的细节渲染并不理想。而近期Meta公布的高保真虚拟头像Codec Avatar的最新进展,让我们看到了在VR中重现真人动态形象的可能。

3D人像捕捉成本高?

实际上,通过3D动捕/容积捕捉技术,已经可以制作高分辨率、高保真的3D头像/虚拟化身。比如,Meta研发的Codec Avatar方案就通过由171个摄像头的动捕工作室MUGSY来捕捉人脸和全身3D数据,然后生成可在VR头显中运行的高保真3D形象,在VR中还可以通过额外的眼球和面部追踪摄像头来驱动动态表情变化。

不过,这种方案缺点是依赖线下工作室,成本高昂,不利于在线上广泛应用。我们知道,如果可以用手机摄像头来捕捉3D人脸数据,将大大降低高保真虚拟化身的成本和使用门槛,因此市面上已经有科研人员对此进行探索。

在2020年,德国一组科研人员也曾研发了一种利用单目摄像头捕捉,并自动生成3D形象的低成本移动方案(计算过程大约20分钟)。不过,目前市面上的各类方案效果并不理想,尤其是保真度、表情动作模拟等方面更是无法与Codec Avatar相媲美。

而在2021年,俄罗斯Skoltech也曾公布一款移动端3D头像捕捉方案,其整体保真度足够高,主要特点是支持动态光渲染,但头发、手指、布料纹理等细节难以模拟。

今年四月,在MIT举办的Virtual Beings&Being Virtual研讨会上,Meta展示了全新的Codec Avatars 2.0系统,特点是比1.0版模型更小、更高效,在Quest 2上可以50Hz刷新率同时渲染五个高保真Avatar。

解决了在VR头显上运行Codec Avatar的问题,那么接下来Meta的目标则是降低3D头像捕捉的门槛,让每个人用手机就能收集并生成逼真的虚拟人像,这些人像甚至还能渲染合成多种逼真的表情变化。

用手机制作3D头像

据了解,这是一种移动版Codec Avatar方案,在降低成本的同时,效果却足够好,表情和细节渲染足够自然。

这项方案兼容iPhone 12等配备RGBD相机的手机(也就是前置Face ID模组),可从多个角度来捕捉静止的3D面部表情,也可以捕捉一系列面部表情变化。利用3D面部数据和动态表情数据,便可生成高保真3D头像,特点是符合面部的几何结构和外观,并且可渲染高保真的全新视角和表情。而通过修改条件数据,甚至可以定制高保真面部特征,创建全新的人脸头像。

细节方面,该方案采用了通用先前模型,针对每一个用户的特征来解码面部容积数据(可看作是一种神经网络解码模型)。

利用经过训练的通用先前模型,科研人员可为每个独立的用户创建个性化、可定制的头像模型。模型中将包含用户静止表情数据中的几何结构和纹理。科研人员表示:该模型会在RGB相机捕捉的每一帧图像上,运行面部节点识别和人像分割算法,然后在输出的数据上匹配模板网格,与检测到的面部节点叠加,并分割面部轮廓,以及输入的深度地图。

值得注意的是,通用先前模型也是一种超网络,可看作是另一个神经网络生成权重的神经网络。Meta培训先前模型使用的数据来自于此前的Codec Avatar研究,包括用3D动捕工作室捕捉的多视角3D面部数据。据悉,这个Codec Avatar数据集包含大量高保真动态表情数据(包括255个人脸数据、覆盖多样化的年龄、性别和人种)。在此前公布的成果就可以发现,Codec Avatar的数据效果足够逼真自然。

接着,模型会拆解每一帧RGB图像的纹理,并将这些纹理数据整合、输出为完整的面部纹理。Meta还通过RayMarching技术进一步优化3D头像建模,这是一种快速的实时场景渲染方式,即通过射线触碰虚拟物体,来测量深度信息,以实现更准确的建模。

动态表情模拟

该方案不仅可渲染逼真的静态面部细节,也可以合成多种自然表情变化。比如结合了由语义定义的控制选项,可独立控制/分割头像的注视点信息,以直接支持眼球追踪。

而静止面部集合结构和纹理,可用于调节通用先前模型的参数,并将这些参数输入到表情编码器,来渲染定制的头像。为了提升虚拟头像对动态面部表情的模拟效果,还需要结合对人脸表情变化的RGB扫描数据(正面表情)。然后利用通用先前模型,可生成全新的表情和全新的任意视角。

经过验证,利用手机捕捉并合成的3D头像,质量足够接近动捕工作室捕捉的数据。而与市面上其他的3D头像生成系统相比,Meta的方案的合成效果细节更佳。

研究人员还称,用手机扫描的过程平均需要3分半钟,可捕捉65种面部表情。不过,渲染/合成3D头像则需要在配备4个高端GPU的计算机上完成,整个过程需要6小时。如果这个任务交给VR头显,那么可能将需要云计算或PC VR等方式来获取额外的算力。

当然,该方案目前还存在需要优化的问题,比如只能捕捉和合成面部表情,还无法处理眼镜或长发等细节。

宗旨,Meta在Codec Avatar上的科研进展让人兴奋,尽管如此VR虚拟化身/头像技术还有很长的路要走。目前,Meta Avatars还是采用基础的卡通艺术风格,随着时间推移,人们将不再满足于这种简易的头像。而在高保真远程3D通话、社交等场景,为了实现沉浸感、临场感体验,将需要更能代表每个人的形象系统。参考:Meta

用iPhone前摄3D人像建模,Meta:我看行相关推荐

  1. 转行学习3D游戏建模多久能入行?

    对于多数想转行的人来说,最直接的原因主要是:对自己的职业现状感到不满意或者对目前所从事工作行业的感到无望. 而对于想找一份与自己专业不相关的工作的人来说,主要是因为自己不喜欢所学的专业,不想长期从事与 ...

  2. MAYA软件安装全过程!3D游戏建模新手,看一个,会一个!

    MAYA软件你装了吗?不会装?请看这里 MAYA通用安装教程 首先我们打开文件夹,找到这个文件,双击打开 MAYA通用安装教程 打开后就看见这个初始化的页面,点击"安装" MAYA ...

  3. 3D游戏建模难学吗?

    怎么说,其实自学顶多算预习. 不会现在还有人认为3D游戏建模仅仅只要看几本书,再在网上找点视频看就能学会吧,不会吧,不会吧. 这个想法太天真了,对于从未接触过的知识,甚至你不知道它的系统体系,以及要学 ...

  4. 3D游戏建模需要学历吗?有人无学历靠作品找工作的吗?

    随着国内游戏产业的发展,每年都会有大量的游戏为第一次在线游戏做准备.随着移动端游戏的兴起,独立端游戏也不甘于落后,这使得游戏建模变得炙手可热.正因为如此,学习游戏建模的人越来越多. "你想要 ...

  5. 手机实现人体扫描建模 快速生成全彩3D人像模型

    在元宇宙.AR/VR娱乐.虚拟社交.真人动漫虚拟化.整形美容等场景中,都需要创建人像3D模型,因此各种各样的虚拟数字人慢慢进入到我们的视野.那么想要一款属于自己的3D虚拟形象,该如何制作呢?就目前市面 ...

  6. 3D人物建模到底需要掌握哪些技术,大佬年薪百万前都在学习这些知识

    3D人物建模需要的美术基础包括:造型+色彩+审美 造型,决定你的模型做出来的型是否好看:色彩,决定你的贴图和材质是否出彩: 审美,更高层次对美术的理解和美感.空间造型能力简单来讲就是要在3D空间里准确 ...

  7. 转行3D游戏建模前一定要思考的3大问题,很多人就这样被耽误了!

    有很多人在找到自己热爱的愿意毕生从事的事情后,整个人生都仿佛焕发出了新的光彩,其中更有不少人获得了巨大的成就. 很多人在想要转行的时候却会有很多顾虑和担心: "我现在要不要.该不该转行?&q ...

  8. 真的有这么丝滑:3D头发建模新方法NeuralHDHair,浙大、ETH Zurich、CityU联合出品...

    作者丨蛋酱 来源丨机器之心 让数字人更接近真人质感,关键还要在头发丝上下功夫. 近年来,虚拟数字人行业爆火,各行各业都在推出自己的数字人形象.毫无疑问,高保真度的 3D 头发模型可以显著提升虚拟数字人 ...

  9. 零基础学习次世代,3D游戏建模要美术基础吗?

    1.了解什么是游戏3D建模 在大型的游戏研发公司,3D建模是一个非常大的职能,分为4个岗位:3D角色低模手绘,3D场景低模手绘,次世代角色高模,次世代场景高模.通常我们所说的3D建模是指低模手绘. 2 ...

最新文章

  1. KNN分类器、最近邻分类、KD树、KNN分类的最佳K值、基于半径的最近邻分类器、KNN多分类、KNN多标签分类、KNN多输出分类、KNN分类的优缺点
  2. Hyper-v3.0里无法压缩虚拟硬盘!虚拟机为Linux,硬盘为VHDX
  3. java程序编译_Java程序的编译过程
  4. 从1到N迈向从0到1:华为创新理念升级详解
  5. android环境搭建—— 工欲善其事必先利其器
  6. arduino动态刷新显示_2019 台北电脑展:华硕显示器产品精锐尽出
  7. 「leetcode」56. 合并区间【贪心算法】详细图解!
  8. wince中实现SQLite数据库及二进制文件保存与读取
  9. 用python实现传染病模型传染病模型
  10. 7-5 分段函数计算 (15 分)
  11. 拼多多砍价群大王:砍价界的扛把子
  12. MySQL 日期计算
  13. 【亚马逊广告策略】探索自动投放和手动投放的选择并做到广告一致性你都懂吗?
  14. 用 Python 制作商品历史价格查询,别踩坑!
  15. 利用go语言创建钱包并遍历钱包(wallet)
  16. Java基础eclipse版(二)——JDK、Eclipse的下载与安装
  17. 华为S7706升级到S7700-V200R008C00SPC500版本快速配置记录
  18. 数组的push()、pop()、shift()和unshift()
  19. CAD处理控件Aspose.CAD功能演示:在 C#中以编程方式搜索 DWG 图形文件中的文本
  20. [32位汇编系列]004 - 对话框资源的使用(2)

热门文章

  1. 宝塔怎么看蜘蛛爬取日志
  2. 计算机双语论文,计算机双语教学初探论文
  3. 中国首个进入谷歌 GSoC 的开源项目: Casbin, 2022 年预选生招募~
  4. 《动手学深度学习》环境搭建全程详细教程 window用户
  5. Android扫描系统文件,安卓文档扫描仪
  6. 图形界面介绍Summary Report
  7. 博客从wordpress迁移到hexo
  8. scratch传说之下素材_《故事新编》:在古老传说和寓言故事上丰富情节和赋予意义...
  9. 笔记本电脑f11功能键_笔记本电脑F1~F10键原来还有这些功能,以前都不知道!
  10. [从头读历史] 第309节 星球战争 BC2499 至 BC2400(公元前25世纪)