Mixlab

如果你拥有了自己的数字人,会将如何使用ta?

小杜

我需要一位虚拟主播来播报我的推送文章~

最近正好尝试了一种虚拟人的解决方案

shadow

小杜

厉害了,制作用到了什么技术?

TTS+一张图片+一段驱动动作(first order motion)

shadow

小杜

查阅了下资料,这种驱动数字人属于 First order motion model

- First Order Motion Model for Image Animation

# 功能 & 自评

无需对目标图像进行任何加注或者信息预处理,就可依据动画驱动数据源的动画轨迹来生成动画。

Our framework scores best on diverse benchmarks and on a variety of object categories.

#项目 & 论文地址

aliaksandrsiarohin.github.io/first-order-model-website

github.com/AliaksandrSiarohin/first-order-model

- TTS 技术

Test-To-Speech 使用语音 API 将书面文本转换为具有多种声音和语言的自然语音。用生成的语言与世界各地的客户交谈,创造更好的客户体验。

# vonage 专业文本转语音工具

Synthesia 运用TTS + first order motion 的数字人视频生成工具

ML1726

上述案例多用于“离线式”的数字人应用场景。如果需要与数字人进行实时的交流沟通,有项目采用的是 ASR+TTS+Audio2face 方案。

ASR 自动语音识别 + TTS 文本转语音 +Voice2Face 语音控制驱动模型(声音数据对应的标签是模型动画的 blendshape 权重)

小杜

可以上手体验下开源项目,自己制作数字人

FACEGOOD

FACEGOOD 将音频转换为混合权重(blendshape 权重),并在 UE 项目中驱动数字人小美。FACEGOOD为小美打造的Test部分和UE项目不提供商业用途,仅供测试使用。

#项目地址

github.com/FACEGOOD/Voice2Face

ML1593

举手

你的数字人处在哪个阶段?相关推荐

  1. 2023年虚拟数字人行业研究报告

    第一章 行业概况 虚拟数字人指存在于非物理世界中,由计算机图形学.图形渲染.动作捕捉.深度学习.语音合成等计算机手段创造及使用,并具有多种人类特征(外貌特征.人类表演能力.人类交互能力等)的综合产物. ...

  2. 从冬奥看中国科技(三):数字人的觉醒与进化

    冬奥赛事已过半,我们的情绪也在酣畅淋漓的竞技中跌宕起伏.在谷爱凌自由式滑雪的比赛中,武大靖代表的短道速滑团体赛的金牌中激昂:也为年轻单板滑雪小将苏翊鸣的银牌成绩判罚不停争论,为顶级花滑运动员羽生结弦的 ...

  3. 阿里小蜜数字人多模态交互实践

    来源:DataFunTalk本文约7000字,建议阅读10分钟 本次分享主要围绕多模态与人机交互技术在电商直播中的应用. 分享嘉宾:赵中州 阿里巴巴 高级算法专家 编辑整理:贾惠然 北京理工大学 出品 ...

  4. 明年将突破2000亿元大关,中国母婴行业处在哪个阶段?企业如何应对“危”与“机”?...

    北京2021年9月28日 /美通社/ -- "2016-2020年中国新生儿数量由1786万逐年下降至1003.5万人,2020年达历史新低: 自2005年开始,我国母婴市场规模持续扩展,预 ...

  5. DNSPod十问林洪祥:顶级带货主播,其实是数字人?

    本期嘉宾  林洪祥  风平智能CEO 林洪祥,风平智能CEO.风平智能拥有全球领先的数字人AIGC预训练大模型技术,利用数字人+AI知识大模型打造视频版ChatGPT,实现数字人名师.数字人医生.数字 ...

  6. 去年押中数字人爆发,今年看好什么?百度研究院2022十大科技趋势预测出炉

    梦晨 发自 凹非寺 量子位 | 公众号 QbitAI "这不过是将来之事的前奏,也是将来之事的影子." AI之父阿兰·图灵,留下过这样一句经典名言,讲的是对科技趋势未来的笃信,但从 ...

  7. 12张PPT看懂中国虚拟数字人产业现状:应用不止于虚拟偶像,2030年市场达2700亿|量子位智库(附下载)...

    荣伟 发自 凹非寺 量子位 报道 | 公众号 QbitAI 这位小姐姐,真不是人. 仅仅出道一年,已经拍了VogueMe杂志,上了央视综艺,还接了特斯拉的代言. (卑微的打工人看着她的履历,流下了委屈 ...

  8. “全息数字人”——健康医疗 大数据应用的新模式

    "全息数字人"--健康医疗大数据应用的新模式 金小桃,王光宇,黄安鹏 北京大学健康医疗大数据国家研究院,北京 100871: 中国卫生信息与健康医疗大数据学会,北京 100048: ...

  9. 基于DINet的虚拟数字人

    这个可以是一个简单的用自己脸型进行训练的虚拟数字人项目,机器需求配置有点高需要24G显存,如果没有的话看看就行了,跑不起来,当然效果和之前介绍的wav2lip相似,生成速度稍微会快一些,根据自己实际情 ...

最新文章

  1. Java 利用接口实现回调
  2. 零基础自学python教程-零基础5个月快速学会Python的秘诀
  3. word保存时标题变成黑框(mac版本)
  4. 数据库2.1.1mysql的特点
  5. 堆排序,为什么升序排列要建大堆,降序排列要建小堆
  6. 第一周例行报告(补)
  7. 判断一段程序是由C 编译程序还是由C++编译程序编译的
  8. Django 系列博客(十一)
  9. RHEL5下编译ACE 5.5
  10. 坚果云忽略同步文件的设置
  11. Ghostscript介绍和移植
  12. 【tool】番茄时间管理法
  13. 通达信手机版分时图指标大全_手机炒股神器通达信公式手机版安装方法
  14. 计算机控制中的pid是什么意思,PID 是什么意思
  15. 柴静十年看见了什么——一个央视记者的心灵史
  16. 随机梯度下降法 SGD
  17. jqGrid简单使用、json格式和jsonReader介绍
  18. Linux signal、sigaction的使用总结
  19. powermock跳过某方法_PowerMock使用详解
  20. 服务器机架的型号,机架式服务器的机柜尺寸定义

热门文章

  1. python音乐爬取
  2. lightroom_如何在Lightroom中创建新目录
  3. 通达信自带公式 阶段强于大盘(C124)
  4. c++中cin缓冲区
  5. java强制下线 session_Session管理之超时设置和强制下线
  6. matlab 蒙特卡洛工具箱_量化投资_轻松实现MATLAB蒙特卡洛方法建模
  7. RedHat Linux6.7系统安装JDK1.8
  8. resip协议栈下的TLS使用
  9. 【微信小程序】理论学习笔记
  10. 2017大二上期末总结