基于Wav2Lip的AI主播
现在市面上的各种AI主播产品,基本都是基于现有的人物造型,其中包括3D动漫,真人,二次元等等,然后通过对口型的方式进行的,但是这个会有一个问题,对于这种AI主播有个名词叫虚拟数字人,虽然虚拟数字人没有肖像权的问题,但是存在软件著作权的问题,现在都是购买会员免费试用,但是也容易出现很多问题,不如用自己的形象做一个AI数字人模型更加稳妥。
先说下如果用自己形象进行数字人生成的话建议用自己很多口播视频进行训练,因为官方给的预训练模型使用英语训练出来的,所以你会发现生成好的数字人口型可能对不上的情况。如果想自己训练建议准备一定数量的口播短视频+对应的修正的字幕文档。如果硬件条件达不到的话,使用预训练模型也能凑合用,反正别深琢磨这个事。
通过模型可以实现图片和视频自动对口型制作自己的AI主播,这个是我之前发布到朋友圈的一个样例。
这个训练图片还好,如果是做视频的话还是比较吃GPU资源的 8G显存是个起步配置。
文章目录
- 准备工作
- 环境配置
- 创建虚拟环境
- 激活虚拟环境
- pip安装匹配版本
- 模型预测对口型
- 必要的数据准备
基于Wav2Lip的AI主播相关推荐
- 基于SadTalker的AI主播,Stable Diffusion也可用
基于之前的AI主播的的学习基础 基于Wav2Lip的AI主播 和 基于Wav2Lip+GFPGAN的高清版AI主播,这次尝试一下VideoRetalking生成效果. 总体来说,面部处理效果要好于Wa ...
- 基于Wav2Lip+GFPGAN的高清版AI主播
继上一篇 基于Wav2Lip的AI主播 的内容之后很多小伙伴反应一个问题就是生成的AI人物并不是很清晰,尤其是放到编辑器里会出现明显的痕迹,因此这次带来的了 Wav2Lip+GFPGAN 高清版的内容 ...
- 搜狗发布全球首位 3D AI 主播,背后分身技术有玄机
作者 | 陈利鑫 头图 | CSDN 下载自东方 IC 又是一年两会时间,平时关注新闻的朋友们可能会发现,新华社关于两会的报道,进行消息播送的主持人队伍加入了一位漂亮小姐姐,而这位小姐姐竟然不是真人, ...
- 微信“欲封”百度;AI 主播入职新华社;今日头条遭狠罚 | 极客头条
「CSDN 极客头条」,是从 CSDN 网站延伸至官方微信公众号的特别栏目,专注于一天业界事报道.风里雨里,我们将每天为朋友们,播报最新鲜有料的新闻资讯,让所有技术人,时刻紧跟业界潮流. 快讯速知 腾 ...
- 百度APP“看听模式”:“AI主播”借道信息流全面落地?
文|曾响铃 来源|科技向令说(xiangling0815) "听新闻"的势头正在崛起,除了传统以"有声"为特色的APP,一个内容量级颇高的玩家加入进来--信息流 ...
- 【前沿技术】浅析搜狗AI主播背后的核心技术
文章首发于微信公众号<有三AI> [前沿技术]浅析搜狗AI主播背后的核心技术 今天是新专栏<前沿技术>,技术的更新迭代实在是太快了,我将在这个专栏给大家解读学术界/工业界最新的 ...
- 【历史上的今天】11 月 7 日:图灵奖女性得主诞生;Twitter 告别 140 字符时代;首位中国 AI 主播
整理 | 王启隆 透过「历史上的今天」,从过去看未来,从现在亦可以改变未来. 今天是 2021 年 11 月 7 日,在 1867 年的今天,居里夫人诞生:居里夫人是法国的著名科学家,研究放射性现象, ...
- CCTV首个AI主播“AI王冠”将跟大家正式见面
加州圣马特奥2022年3月24日 /美通社/ -- 中央广播电视总台(CCTV)首个AI主播"AI王冠"将于今年3月通过一档特别节目跟大家正式见面.今年起,"AI王冠&q ...
- 央视315让AI主播预热,人类主播会失业吗?
今年315晚会多家科技公司被点名过堂,骚扰电话.网络贷款.电子烟--搜狗也在315晚会成功登陆央视,不过却有不同角色. 315晚会开播前,搜狗与央视财经频道联合推出的AI主播"姚小松&quo ...
最新文章
- vue el-form鼠标事件导致页面刷新解决方案;vue 阻止多次点击提交数据通用方法...
- 【云栖大会】人工智能:智,在云端
- centos7之破解root密码
- 《数据分析变革:大数据时代精准决策之道》一第1章 了解运营型分析1.1 定义运营型分析...
- java wcf_尝试将WCF映射到Java术语
- 利润暴增800%,单车成本降至22.7万元!特斯拉交出最强年报
- UVA10733 The Colored Cubes【Polya定理】
- 前端之CSS第二部分属性相关
- Angular服务器端渲染
- php hscan,hgetall 替代 hscan的用法详解。
- 春节红包战:他们到底在争什么?
- Java金额转换_阿拉伯数字转换成中国大写数字
- 2023东北大学计算机考研信息汇总
- Flowable 快速入门教程:通过 Comment 保存审核信息
- 英雄联盟龙的传人皮肤爬虫
- fail2ban原理与安装(centos6)
- 【杂谈】 Listary自带的字典功能失效?没关系,让我们自己来改造它
- 人脸识别技术入驻了哪些行业
- 用cd 命令进入和退出D盘文件夹的操作步骤。
- 记录一下,转换树结构数据
热门文章
- 字典排序什么意思_字典序排序
- 2019长安大学ACM校赛网络同步赛 Trial of Devil
- 去哪儿网2014笔试算法题汇总
- 大众点评网平台架构组高级工程师 hadoop 应用案例
- Java Web 胡言乱语 之三
- 图片(旋转/缩放/翻转)变换效果(ccs3/滤镜/canvas)
- 哲学视角说Docker:资本利润最大化的产物。
- 【天华学术】外国文学论文:《老人与海》中的语言特色与修辞手法(节选)
- 信息系统项目管理师-九大知识领域必备知识点整理
- php仿糗事百科,thinkphp精仿糗事百科整站源码