允中 发自 凹非寺
量子位 | 公众号 QbitAI

全身动作捕捉,现在无需昂贵的动捕设备,只要一个摄像头就能轻松实现。

并且就在抖音上,人人都能上手体验。

上面这段虚拟数字形象跳舞的视频采用了抖音直播伴侣功能背后的全身驱动技术,主播仅需要单个普通摄像头并开始跳舞,就可以实时、精准地驱动虚拟形象。

相较于以往的轻量化动作捕捉,这项来自字节跳动智能创作团队的全身驱动技术具有高真实性,可以体现空间的距离感和地面感。

并且具有更高的鲁棒性,能够在复杂的环境、穿戴等场景下实现良好的结果。

同时,还具备更高的还原性,人物的姿态、手势和动作的姿态、速度都能更加准确地还原。

值得一提的是,普通的惯性动捕手套在一定时间后就会产生漂移损耗,无法支持长时间的直播,而全身驱动技术则可以有效规避这一问题,能够更好地适应直播场景。

据介绍,全身驱动技术的技术方案包含了数据、估计、修正以及驱动四个步骤,具体的实现方案如下:

全身驱动技术方案全流程

构建高精度3D数据供应链

技术团队使用了混合3D数据构建方式,其来源包括自建多目工装动捕系统、2D数据、伪标签3D数据,基于此,团队构建了包含800万以上高精3D标签的数据集。

为了获取接近业务场景的高精度3D人体数据,团队搭建了一套完整的基于多目摄像头的无标记物视觉动捕系统,并基于自研的人体重建算法,实现了对人体的位置,姿态和体型的准确估计。

尽管在多数情况下,自动化的重建算法能够给出精度满足要求的重建结果,但对于一些遮挡严重,运动过快导致模糊的样本,仍需要通过人工筛选修正的方式进行数据清洗。通过搭建3D数据筛选标注系统,可以实现高效的半自动化数据生产,并通过将人工审核后的样本用于相关模型的训练,持续优化数据产线相关模型的性能,最终实现数据质量的自举式提升。

高精度3D数据构建流程

高还原性与高鲁棒性的全身估计模型

据介绍,通过上述步骤,团队积累了样本量高达近千万的大规模数据集。

在此基础上,团队训练了一个基础特征表示底座进行3D-Aware的共享特征抽取,基于共享特征构建了姿态估计分支、相机估计分支、Root点估计分支。

其中,姿态估计分支负责为表演者的关节点进行局部3D坐标估计,相机估计分支以及Root点估计分支为当前表演者的全局位置进行估计。

基于多分枝的估计模块结合积累的大量自有数据,人体估计模型可以在较少的计算量下取得高还原性与高鲁棒性的结果。

另外,针对全身场景下的手部姿态估计,团队统计了手腕关节旋转的先验分布辅助模型训练,保证模型输出符合人体结构约束;设计了手腕关节的时序模型,保证手腕姿态的稳定性;对关键点预测进行概率建模从而预测模型输出的置信度进行难样本过滤;将以上优化点与大量的自有手部数据结合,智能创作团队的手部姿态算法模型在复杂遮挡模糊场景下结果仍可有不错的表现。

以下为人体在复杂遮挡服饰场景下的优化对比。左边为原始预测结果,右边为异常遮挡优化结果。

再来看看手腕在旋转动作下的优化对比。左边为原始预测结果,右边为手部姿态还原性&鲁棒性优化结果。

时空关联建模强化鲁棒性

在身体估计模块获取了基本的3D关节点信息后,技术团队训练了时序完整性模块对原始结果进行修正。

在时序完整性模块中,引入关节点在时序上的关联关系以及同时刻关节点的空间关联关系,同时引入了关节点位置感知模块,使得具体关节点位置可以被显式编码为高维向量加入训练。

在时序建模的基础上,团队同时设计了异常检测模块对分布外的姿态结果进行过滤修正。时空关联建模的设计保证了人体估计算法可以进一步获得高鲁棒性的驱动信号。

人体在复杂遮挡服饰场景下的优化对比(左为原始预测结果,右为时空关联建模修正后结果):

自研算法,实现高真实感驱动

在通过一些算法模型计算后,团队获得了精准且可靠的人体关节点输出,但这距离驱动一个活灵活现的虚拟人仍然还有最后几个步骤,需要通过IK算法获取特定虚拟角色的旋转角以对其完成驱动。

对此,团队自研了EasyIK算法,其可以对大臂小臂、大腿小腿等容易出现自旋错误的关节提供合理姿态。

同时,为了保证驱动虚拟角色的真实感,团队研发了接地算法,对驱动虚拟角色的地面进行估计,并为单脚以及双脚姿态在地面上自然姿态以及移动的距离进行估计。

EasyIK以及接地算法的引入使得虚拟人驱动可以获得更好的真实感。

足部稳定性优化对比(左为原始预测结果,右为高真实感驱动效果):

随着虚拟数字人技术的发展和虚拟偶像的兴起,虚拟数字人在游戏、虚拟社交,在线健身、在线教育、虚拟主播等领域都将有更加广阔的应用空间。更加实时、轻量化、低成本的动作捕捉技术也将成为行业的趋势。

全身驱动技术方案能大大降低了真人驱动虚拟数字人的应用门槛,助力打造更加趣味、沉浸式的交互体验。

关于字节跳动智能创作团队:

智能创作团队通过建设领先的计算机视觉、音视频编辑、特效处理等技术,支持抖音、剪映、头条等公司内众多产品线;同时通过火山引擎为外部ToB合作伙伴提供业界前沿的智能创作能力与行业解决方案。

体验抖音直播伴侣,可访问:https://streamingtool.douyin.com/

一个摄像头就能让虚拟人唱跳rap,抖音即可玩相关推荐

  1. 抖音一个老人和一个机器人歌曲_抖音歌曲少年是谁唱的 最近抖音非常火的一首歌曲...

    原标题:抖音歌曲少年是谁唱的 最近抖音非常火的一首歌曲 最近抖音非常火的一首歌曲<少年>,我还是从前那个少年,大家都非常想知道<少年>谁唱的?今天我们就来为大家整理一下梦然的个 ...

  2. 一行代码实现网页直接跳转抖音,2023年6月新方法

    之前 发的文章 方法已经失效,以下为新版本方案! 背景 大家可能都发现在一些APP中无法直接打开抖音的链接,就连抖音官方的分享链接在浏览器打开都无法直接唤醒APP.需要我们手动点击,如果我们在自己网站 ...

  3. QQ短暂支持跳转抖音淘宝又封禁 今天可是最后期限!

    文/江丽雯  来源:IT时报(ID:vittimes) QQ短暂解除外链,又无法跳转了 上午9:48,记者打开抖音获取一个视频链接,再到QQ的对话框中打开,对话框中显示"乱码+链接+乱码&q ...

  4. Android 学习之跳转抖音账号主页或者某一视频页

    一.需求来源 当我们开发的应用功能上使用起来门槛较高,或者交互设计不够友好,用户使用起来存在困难,我们就需要提供教程,可以是文字描述,图文结合或者是视频,其中最为有效的当属视频啦. 为了方便管理和推广 ...

  5. TikTok是下一个流量蓝海吗?用户规模超抖音?

    随着抖音在国内高调宣布,它的日活跃用户已经超过了4亿,平台大V,网红频出的时候,抖音的海外版"TikTok",也取得了飞速的发展.据最新数据,抖音的海外版TikTok已经以15亿的 ...

  6. 计算机弹歌你的答案,方宇杰翻唱答案 答案抖音你的方宇杰

    说到方宇杰可能有些人没听过,但是肯定很多人听过他翻唱的答案这首歌.今日在抖音上有个用户名叫你的方宇杰的人弹着尤克里里翻唱郭采洁和杨坤的答案而成为抖音上的新一代网红.下面就给大家介绍抖音翻唱答案的方宇杰 ...

  7. 一个简单又诡异的互联网变现思维(抖音赚钱)

    程序员的成长之路互联网/程序员/成长/职场  关注 阅读本文大概需要 4 分钟. 假期不发技术文章,祝大家假期愉快~ 我们都知道互联网是赚钱最容易的地方,并且是赚钱最多的地方,同时也是赚钱最快的地方. ...

  8. 用计算机谈狂狼,抖音狂狼原唱是谁 抖音狂狼完整版歌词

    <狂狼>这首歌相信大家都十分熟悉,起个头都可以五音俱全的来哼唱几句,歌词更是直达心底,波涛汹涌的想要释然.那么大家知道这首歌的原唱是谁吗?下面就快和小编一起看看吧! 抖音<狂狼> ...

  9. 又一个万亿级市场迎来新玩家?抖音内测网络拍卖功能

    随着互联网科技越来越发达,它让我们可以足不出户就能体验到方便快捷的生活,我们生活中很多事情都会选择在网络上完成,比如购物等.除了平常的电商购物,现在还有一些拍卖活动也会在网上完成. 近日,有媒体报道称 ...

最新文章

  1. git 内网搭建_搭建GitLab(Github) 简易教程
  2. KMP算法---字符串匹配
  3. IOS使用MessageUI Framework 发送短信息
  4. 失望时想起了你是什么歌_你是空你是空是什么歌 你是风你是风什么歌
  5. python自然场景文字识别_chineseocr
  6. 生产调度java程序原码_Rxjava的线程调度源码解析
  7. spss主成分综合得分_权重赋值之“主成分分析法”
  8. 盘点微信的前世今生,微信成功的必然和偶然
  9. 简述电子计算机发展五个阶段,简述erp发展的5个阶段
  10. SplitContainer控件扩展之收缩面板
  11. 免ROOT的计算机隐藏应用软件,AppHider隐藏应用
  12. macd底背离的python_Python量化交易之MACD'顶底背离'形态的实现,自动化交易!
  13. selenium借助pywinauto工具上传附件
  14. 中国水疗产品行业市场供需与战略研究报告
  15. Android应用--简、美音乐播放器原型放送(作者:小巫)
  16. Bonobo.Git.Server 401 Error
  17. Ground Truth是什么意思
  18. 集训笔记---扩展欧几里德算法(POJ NO.1061 青蛙的约会 有点烦人小跳蛙gcd)
  19. 去金坛长荡湖吃船菜,原来1947年就有前辈在努力发展中国的计算机产业
  20. (二)Druid数据库连接池如何获取Connection原理和源码分析?

热门文章

  1. gcc编译c语言多线程程序的步骤,GCC分步骤编译C语言程序
  2. 【工程化】Android开发电脑中都装了哪些软件
  3. fatal: unable to access ‘https://github.com/.../.git‘: Could not resolve host: github.com解决方法【亲测有效】
  4. JavaScript反防审查强制开控制台方法(反防f12必开控制台)
  5. 席慕容 一棵开花的树
  6. SecureCRT 使用pem
  7. 按产品经理能力划分,我们需要看哪些书?
  8. [NeurIPS 2021] TokenLearner:自适应学习 token 个数和位置 - What Can 8 Learned Tokens Do for Images and Videos?
  9. bat脚本中For /f 中的Delims、Tokens、skip、eol、goto使用总结
  10. 有向图,无向图的邻接矩阵和邻接表模板