你的数字人处在哪个阶段？

Mixlab

如果你拥有了自己的数字人，会将如何使用ta？

小杜

我需要一位虚拟主播来播报我的推送文章～

最近正好尝试了一种虚拟人的解决方案

shadow

小杜

厉害了，制作用到了什么技术？

TTS+一张图片+一段驱动动作（first order motion）

shadow

小杜

查阅了下资料，这种驱动数字人属于 First order motion model

- First Order Motion Model for Image Animation

‍

# 功能 & 自评

无需对目标图像进行任何加注或者信息预处理，就可依据动画驱动数据源的动画轨迹来生成动画。

Our framework scores best on diverse benchmarks and on a variety of object categories.

#项目 & 论文地址

aliaksandrsiarohin.github.io/first-order-model-website

github.com/AliaksandrSiarohin/first-order-model

- TTS 技术

Test-To-Speech 使用语音 API 将书面文本转换为具有多种声音和语言的自然语音。用生成的语言与世界各地的客户交谈，创造更好的客户体验。

# vonage 专业文本转语音工具

# Synthesia 运用TTS + first order motion 的数字人视频生成工具

ML1726

上述案例多用于“离线式”的数字人应用场景。如果需要与数字人进行实时的交流沟通，有项目采用的是 ASR+TTS+Audio2face 方案。

ASR 自动语音识别 + TTS 文本转语音 +Voice2Face 语音控制驱动模型（声音数据对应的标签是模型动画的 blendshape 权重）

小杜

可以上手体验下开源项目，自己制作数字人

- FACEGOOD

FACEGOOD 将音频转换为混合权重（blendshape 权重），并在 UE 项目中驱动数字人小美。FACEGOOD为小美打造的Test部分和UE项目不提供商业用途，仅供测试使用。

#项目地址

github.com/FACEGOOD/Voice2Face

ML1593

举手

你的数字人处在哪个阶段？相关推荐

2023年虚拟数字人行业研究报告
第一章行业概况虚拟数字人指存在于非物理世界中,由计算机图形学.图形渲染.动作捕捉.深度学习.语音合成等计算机手段创造及使用,并具有多种人类特征(外貌特征.人类表演能力.人类交互能力等)的综合产物. ...
从冬奥看中国科技（三）：数字人的觉醒与进化
冬奥赛事已过半,我们的情绪也在酣畅淋漓的竞技中跌宕起伏.在谷爱凌自由式滑雪的比赛中,武大靖代表的短道速滑团体赛的金牌中激昂:也为年轻单板滑雪小将苏翊鸣的银牌成绩判罚不停争论,为顶级花滑运动员羽生结弦的 ...
阿里小蜜数字人多模态交互实践
来源:DataFunTalk本文约7000字,建议阅读10分钟本次分享主要围绕多模态与人机交互技术在电商直播中的应用. 分享嘉宾:赵中州阿里巴巴高级算法专家编辑整理:贾惠然北京理工大学出品 ...
明年将突破2000亿元大关，中国母婴行业处在哪个阶段？企业如何应对“危”与“机”？...
北京2021年9月28日 /美通社/ -- "2016-2020年中国新生儿数量由1786万逐年下降至1003.5万人,2020年达历史新低: 自2005年开始,我国母婴市场规模持续扩展,预 ...
DNSPod十问林洪祥：顶级带货主播，其实是数字人？
本期嘉宾林洪祥风平智能CEO 林洪祥,风平智能CEO.风平智能拥有全球领先的数字人AIGC预训练大模型技术,利用数字人+AI知识大模型打造视频版ChatGPT,实现数字人名师.数字人医生.数字 ...
去年押中数字人爆发，今年看好什么？百度研究院2022十大科技趋势预测出炉
梦晨发自凹非寺量子位 | 公众号 QbitAI "这不过是将来之事的前奏,也是将来之事的影子." AI之父阿兰·图灵,留下过这样一句经典名言,讲的是对科技趋势未来的笃信,但从 ...
12张PPT看懂中国虚拟数字人产业现状：应用不止于虚拟偶像，2030年市场达2700亿｜量子位智库（附下载）...
荣伟发自凹非寺量子位报道 | 公众号 QbitAI 这位小姐姐,真不是人. 仅仅出道一年,已经拍了VogueMe杂志,上了央视综艺,还接了特斯拉的代言. (卑微的打工人看着她的履历,流下了委屈 ...
“全息数字人”——健康医疗大数据应用的新模式
"全息数字人"--健康医疗大数据应用的新模式金小桃,王光宇,黄安鹏北京大学健康医疗大数据国家研究院,北京 100871: 中国卫生信息与健康医疗大数据学会,北京 100048: ...
基于DINet的虚拟数字人
这个可以是一个简单的用自己脸型进行训练的虚拟数字人项目,机器需求配置有点高需要24G显存,如果没有的话看看就行了,跑不起来,当然效果和之前介绍的wav2lip相似,生成速度稍微会快一些,根据自己实际情 ...

你的数字人处在哪个阶段？

你的数字人处在哪个阶段？相关推荐

最新文章

热门文章