5秒内克隆你的声音，并生成任何内容，这个工具细思极恐...还特么的开源~

上一篇：一个90后员工猝死的全过程

0、2T架构师学习资料干货分享

开源前线（ID：OpenSourceTop）猿妹整编

大家应该都知道声音克隆技术，通俗的来说就是借助深度学习算法，可以完全模拟某个人的声音，而且由机器合成的语音连情绪都能够完美表达出来，基本可以以假乱真，只要不见面，你根本就察觉不出来向你发出声音的知识一个机器。

语音克隆最大的创新之一是减少创建语音所需的原始数据量。过去，该系统需要数十甚至数百小时的音频。但是，今天要和大家分享的这个工具5秒钟就可以克隆成功，这个工具名叫——MockingBird。

MockingBird已经登上Github热榜，收获3.5K的Star，累计分支 303（Github地址：https://github.com/babysor/MockingBird）

MockingBird具有如下特性：

支持普通话并使用多种中文数据集进行测试
适用于 pytorch，已在 1.9.0 版本（最新于 2021 年 8 月）中测试，GPU Tesla T4 和 GTX 2060
支持 Windows + Linux
仅使用新训练的合成器（synthesizer）就有良好效果，复用预训练的编码器/声码器

MockingBird如何使用

MockingBird的安装要求如下：

首先，MockingBird需要Python 3.7 或更高版本
安装 PyTorch
安装 ffmpeg。
运行pip install -r requirements.txt 来安装剩余的必要包。
安装 webrtcvad 用 pip install webrtcvad-wheels。

接着，你需要使用数据集训练合成器：

下载数据集并解压：确保您可以访问 train 文件夹中的所有音频文件（如.wav）
使用音频和梅尔频谱图进行预处理：python synthesizer_preprocess_audio.py <datasets_root> 可以传入参数 --dataset {dataset} 支持 adatatang_200zh, magicdata, aishell3
预处理嵌入：python synthesizer_preprocess_embeds.py <datasets_root>/SV2TTS/synthesizer
训练合成器：python synthesizer_train.py mandarin <datasets_root>/SV2TTS/synthesizer
当你在训练文件夹 synthesizer/saved_models/ 中看到注意线显示和损失满足您的需要时，请转到下一步。

使用预先训练好的合成器，如果没有设备或者不想慢慢调试，可以使用网友贡献的模型。

训练声码器

预处理数据: python vocoder_preprocess.py <datasets_root>
训练声码器: python vocoder_train.py mandarin <datasets_root>

启动工具箱

然后你可以尝试使用工具箱：python demo_toolbox.py -d <datasets_root>

看完这篇文章，你有什么收获？欢迎在留言区与10w+Java开发者一起讨论~

感谢您的阅读，也欢迎您发表关于这篇文章的任何建议，关注我，技术不迷茫！小编到你上高速。

· END ·

最后，关注公众号互联网架构师，在后台回复：2T，可以获取我整理的 Java 系列面试题和答案，非常齐全。

正文结束

5秒内克隆你的声音，并生成任何内容，这个工具细思极恐...还特么的开源~相关推荐

AI拟声: 5秒内克隆您的声音并生成任意语音内容
特征
如何安装MockingBird-AI拟声: 5秒内克隆您的声音并生成任意语音内容
作者:虚坏叔叔博客:https://xuhss.com 早餐店不会开到晚上,想吃的人早就来了!
百度语音系统Deep Voice新突破可在几秒内克隆你的声音
文章来源:ATYUN AI平台百度的AI研究部门近日宣布,其文本到语音(TTS)系统"Deep Voice"已经学会了如何使用仅三秒钟的语音样本数据来模仿人类的声音. 这项技术被 ...
[转载] 细思极恐的星座分析（下）- 外太空？内子宫？人类的天赋从何而来？
参考链接: 显示给定出生日期的星座或黄道十二宫的Python程序在看完本文上半部分后,大家应该对星座与人类天赋之间的关系有了比较深刻的了解.在本文下半部分中,我将通过星座来猜测天赋的成因.与&quo ...
传苹果将弃用高通、博通芯片；华为研发投入排全球第四；微软新文本语音模型可在 3 秒内复制任何人的声音 | 极客头条
「极客头条」-- 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧. 整理 | 苏宓出品 | CSDN(ID:CSDNnews) ...
这个 GitHub 项目能克隆你的声音
今天推荐一个黑科技开源项目,只需要你 5 秒钟的声音对话,就能克隆出你的声音,而且能够实时的生成你任意语音. 是不是很顶? 我觉个例子,如果我这里有 300 条你说话的语音,我把你的语音数据用这个开源 ...
有点恐怖，这个工具能让你在 20 秒内，克隆你的声音，并转成英语！
公众号关注 "GitHubDaily" 设为 "星标",每天带你逛 GitHub! 在上学那会,我便一直有个想法,要是能有一个英汉自动翻译机,能把我说的话,直接 ...
AI软件克隆你的声音，全球诈骗案件已屡次得逞！
在2月28号刚于旧金山结束的RSA大会上,一家名为Pindrop的专门检测语音诈骗的初创公司再次向业内发出警告:网络诈骗份子已经开始借助AI软件克隆声音进行诈骗了! Pindrop的CEO(右)和CT ...
只要5秒就能“克隆”本人语音！美玉学姐不再查寝，而是吃起了桃桃丨开源
博雯萧箫发自凹非寺量子位报道 | 公众号 QbitAI 现在,AI已经能克隆任意人的声音了! 比如,前一秒的美玉学姐还在宿舍查寝: 后一秒就打算吃个桃桃: 简直就是鬼畜区的福利啊! (像我们 ...
我的世界java手机版怎么调按键_如何在10秒内，让我的世界立即“自爆”？一个隐藏的mc快捷键...
传说用give指令9999个蛋糕,在mc会发生一个诡异事情! 关于"9999蛋糕梗"的小故事:这个梗流传于国外的Minecraft社区,早年间一位玩家试图在游戏中给自己可爱的女朋友 ...

5秒内克隆你的声音，并生成任何内容，这个工具细思极恐...还特么的开源~

5秒内克隆你的声音，并生成任何内容，这个工具细思极恐...还特么的开源~相关推荐

最新文章

热门文章