来源 | Jack Cui

今天分享一个算法 KalidoKit,我们看下效果:

根据真实的人物肢体、面部、手的动作,来驱动虚拟形象。

KalidoKit 是整合了多种算法实现的,Facemesh、Blazepose、Handpose、Holistic。

这个技术的主流应用方向就是。

可以驱动虚拟人物跳舞:

也可以像开头的动图那样,捕捉全身的动作,面部表情、手势等。

除了这种驱动虚拟形象类型的,还可以发挥自己的想象力,做一些有趣的小应用。

KalidoKit

该项目是基于 Tensorflow.js 实现的。

项目地址:

https://github.com/yeemachine/kalidokit

捕捉的关键点信息,可以用来驱动 2D 和 3D 的虚拟形象,结合一些虚拟形象的驱动引擎,即可实现文章开头所展示的效果。

既可以驱动 Live2D 形象,又可以驱动 3D VRM 形象。

这里涉及的技术点一篇文章讲不完,今天主要讲述基础的关键点检测技术:人脸关键点检测、人体姿态估计、手势姿态估计。

人脸关键点检测

人脸关键点检测,有稀疏的,有稠密的。

像基础一点的,68 个关键点检测。

一般来说,一些闭眼、头部姿态、张闭嘴的检测,用这种简单的 68 个关键点就够了。

当然,也有更加稠密的关键点检测。

对于一些皮肤美容类的应用场景,就需要稠密的关键点检测算法了,成千上万的那种。

不过算法的思想都是一样的,回归出这些关键点的位置坐标,通常搭配人脸检测算法使用。

想要学习人脸关键点检测算法的,推荐两个入门项目:

https://github.com/1adrianb/face-alignment

https://github.com/ChanChiChoi/awesome-Face_Recognition

一个是基础的入门项目,一个整合了人脸关键点的主流算法。

人体姿态估计

人体姿态估计也是计算机视觉中一个很基础的问题。

从名字的角度来看,可以理解为对“人体”的姿态(关键点,比如头,左手,右脚等)的位置估计。

一般可以分为 4 种任务:

  • 单人姿态估计 (Single-Person Skeleton Estimation)

  • 多人姿态估计 (Multi-person Pose Estimation)

  • 人体姿态跟踪 (Video Pose Tracking)

  • 3D人体姿态估计 (3D Skeleton Estimation)

简单来说,就是对于人体骨骼关节点进行检测,定位人体的姿态。

人体姿态估计,应用范围宽广,比如在自动驾驶行业进行街景中行人的姿态检测、动作预测;在安防领域的行人再识别问题,特殊场景的特定动作监控;影视产业的电影特效等。

想要学习的小伙伴,可以看这整理的论文:

https://github.com/cbsudux/awesome-human-pose-estimation

手势姿态估计

手关节更加灵活,动作敏捷和存在自我遮挡,因此略复杂一些。

不过原理和人体姿态估计类似。

除了这种常规的手势识别,也可以用来做一些特效。

其实,很多这种人体特效,位置的定位,都是借助这些关键点实现的。

同上,想要学习,可以看这份整合的资料:

https://github.com/xinghaochen/awesome-hand-pose-estimation

总结

本文介绍了一些基础的算法,并推荐了一些学习资料,比较基础。


1. 回复“m”可以查看历史记录;

2. 回复“h”或者“帮助”,查看帮助;

开发者已开通多个技术群交流学习,请加若飞微信:1321113940  (暗号k)进开发群学习交流

说明:我们都是开发者。视频或文章来源于网络,如涉及版权或有误,请您与若飞(1321113940)联系,将在第一时间删除或者修改,谢谢!

开发者:KaiFaX

面向全栈工程师的开发者
专注于前端、Java/Python/Go/PHP的技术社区

虚拟主播?这个项目,我能玩一年!相关推荐

  1. B站又备战虚拟主播了

    配图来自Canva可画 随着技术的不断发展,虚拟主播越来越为人所熟知.实际上,虚拟主播是虚拟人下沉的结果,是新兴形式与现有媒介融合的产物,同时也是技术进步.成本降低.消费者对其理解愈发深入所致的必然趋 ...

  2. 二次元“爱豆”走上前台,虚拟主播商业化依然依赖“口红效应”

    文|编程浪子 来源|螳螂财经(ID:TanglangFin) 希腊神话中,在塞浦路斯有位名为"皮格马利翁"的雕塑家,他同时也是一位雕塑家,他在用象牙雕刻了一位现实中不存在的美女之后 ...

  3. 【Paddle笔记】体验PaddleBoBo虚拟主播自动播报快速生成项目

    @[TOC] [Paddle笔记]体验PaddleBoBo虚拟主播自动播报快速生成项目 1.下载PaddleBoBo 1.1 HTML下载 Github 软件仓下载 PaddleBoBo 1.2 Gi ...

  4. 抖音虚拟主播进行直播无人值守直播(1:项目展望与演示)

    自从FB公司All IN 元宇宙后,怎么个互联网都不好了!现在一切都卷的不行,连老罗还清的债务准备新的创业项目打算从元宇宙开始.我们小白板砖的coder只能做一些力所能及的事情. 对于元宇宙在当前应用 ...

  5. 网页中加载二次元3D虚拟主播源码(1:项目介绍和源码)

    vrm格式的二次元3D虚拟主播在日本实际上已经盛行多年,由于文化和差异的原因,在我们这只有年轻人比较喜爱.今天我们讲的是如何加载这种模型,然后实现一些动画. 别的不说,我们先上效果视频: 3D二次元虚 ...

  6. 【开源项目】AI Vtuber 一个由多LLM驱动的虚拟主播,可以在Bilibili/抖音 直播中与观众实时互动或本地聊天。使用多种TTS技术并可进行AI变声。通过特定指令协同SD绘图。并有循环文案

    AI Vtuber ✨ AI Vtuber ✨ AI Vtuber是一个由 ChatterBot/GPT/Claude/langchain本地or云端/chatglm/text-generation- ...

  7. 巴比特 | 元宇宙每日必读:一千块就能买一个虚拟主播?这是小企业的直播福音还是在“割韭菜”?...

    摘要:随着元宇宙的火爆,淘宝.京东.快手等平台纷纷推出了虚拟人(数字化主播),并联合品牌做起了直播.卖起了商品.虚拟人具备的新鲜感.科技感,吸引了不少用户观看并下单,让不少中小品牌很是羡慕,却又望而却 ...

  8. 用 ZEGO Avatar 做一个虚拟人|虚拟主播直播解决方案

    虚拟直播既可以实现单人视频直播,也可以邀请观众上麦.与虚拟主播进行多人连麦互动. 虚拟直播场景架构设计 虚拟直播场景的主要架构如下图所示(以多人连麦直播互动为例): 虚拟人直播体验 App 源码 ZE ...

  9. 虚拟主播上线:多模态将改变人机交互的未来

    现在,看在线视频已经成为很多人的一种生活习惯,人们乐于在忙完一天的工作和家庭生活后抽空看视频放松娱乐一下.然而,由于在线视频平台众多,视频资源丰富,现在的观众们已不满足于视频本身好不好看和视频资源的丰 ...

  10. 虚拟主播甜妹小给给戏腔演绎国风佳作,引爆抖音直播浪潮

    抖音2022嘉年华引爆国风新浪潮 12月10日,2022年度直播嘉年华在抖音拉开帷幕.抖音一直以来都致力于为观众输送优质内容,此次直播活动的主播更是现实虚拟两开花.来自国风舞蹈.传统文化.户外旅游等垂 ...

最新文章

  1. 那些年,我们一起刷过的计算机视觉比赛
  2. nodejs下载安装教程(XP版)
  3. python实现WebsocketServer 服务端
  4. JStrom 入门(三) 上传jar文件并启动流程
  5. 使用echo输出一绝对路径,使用egrep取出其基名
  6. 中石油训练赛 - 小A进学校(唯一分解定理)
  7. Flask Web表单
  8. java构造函数_JAVA的构造函数是怎么写的。万分感谢。路过的请不要嘲笑%_%
  9. java整型缓存_JAVA整型包装类的缓存策略
  10. 地址解析协议 (ARP) 是什么
  11. Eclipse下如何导入jar包
  12. 为什么计算机休眠风扇还转,Win7系统进入睡眠模式后电脑风扇还在转的解决方法...
  13. 小程序开发中遇到的问题
  14. 磁盘文件排序-编程珠玑
  15. 图片服务器 文件系统,调研分享:图片文件在各文件系统上的访问性能对比
  16. Bitmap,Drawable转换
  17. 24X24 黑体简体中文点阵字库
  18. 仿腾讯QQ空间登录的css代码
  19. 《走出强迫的泥潭——森田疗法指导集锦》
  20. Java常用英语单词(笔记整理)

热门文章

  1. 《趣味知识博文》小W与小L带你聊天式备考CDA Level Ⅰ(三)
  2. 关于对比学习在医学图像理解中两篇Paper的思考
  3. 【7gyy】笔者支招:巧设安全模式防攻击
  4. Python 开发桌面应用居然如此简单
  5. 手机连不上电脑WIFI并且一直提示正在获取IP地址
  6. luci网页shell_LUCI 使用其原有机制的建立新的页面
  7. 未来十年最紧缺的职业
  8. 笔记本电脑计算机无法显示u盘,小编告诉你为什么笔记本电脑识别不了u盘
  9. 论文笔记:CVPR2021 Bottom-Up Shift and Reasoning for Referring Image Segmentation
  10. ElasticSearch 哪里不会点哪里