上一篇:一个90后员工猝死的全过程

0、2T架构师学习资料干货分享

开源前线(ID:OpenSourceTop) 猿妹整编

大家应该都知道声音克隆技术,通俗的来说就是借助深度学习算法,可以完全模拟某个人的声音,而且由机器合成的语音连情绪都能够完美表达出来,基本可以以假乱真,只要不见面,你根本就察觉不出来向你发出声音的知识一个机器。

语音克隆最大的创新之一是减少创建语音所需的原始数据量。过去,该系统需要数十甚至数百小时的音频。但是,今天要和大家分享的这个工具5秒钟就可以克隆成功,这个工具名叫——MockingBird

MockingBird已经登上Github热榜,收获3.5K的Star,累计分支 303(Github地址:https://github.com/babysor/MockingBird)

MockingBird具有如下特性:

  • 支持普通话并使用多种中文数据集进行测试

  • 适用于 pytorch,已在 1.9.0 版本(最新于 2021 年 8 月)中测试,GPU Tesla T4 和 GTX 2060

  • 支持 Windows + Linux

  • 仅使用新训练的合成器(synthesizer)就有良好效果,复用预训练的编码器/声码器

MockingBird如何使用

MockingBird的安装要求如下:

  • 首先,MockingBird需要Python 3.7 或更高版本

  • 安装 PyTorch

  • 安装 ffmpeg。

  • 运行pip install -r requirements.txt 来安装剩余的必要包。

  • 安装 webrtcvad 用 pip install webrtcvad-wheels。

接着,你需要使用数据集训练合成器:

  • 下载 数据集并解压:确保您可以访问 train 文件夹中的所有音频文件(如.wav)

  • 使用音频和梅尔频谱图进行预处理:python synthesizer_preprocess_audio.py <datasets_root> 可以传入参数 --dataset {dataset} 支持 adatatang_200zh, magicdata, aishell3

  • 预处理嵌入:python synthesizer_preprocess_embeds.py <datasets_root>/SV2TTS/synthesizer

  • 训练合成器:python synthesizer_train.py mandarin <datasets_root>/SV2TTS/synthesizer

  • 当你在训练文件夹 synthesizer/saved_models/ 中看到注意线显示和损失满足您的需要时,请转到下一步。

使用预先训练好的合成器,如果没有设备或者不想慢慢调试,可以使用网友贡献的模型。

训练声码器

  • 预处理数据: python vocoder_preprocess.py <datasets_root>

  • 训练声码器: python vocoder_train.py mandarin <datasets_root>

启动工具箱

然后你可以尝试使用工具箱:python demo_toolbox.py -d <datasets_root>

看完这篇文章,你有什么收获?欢迎在留言区与10w+Java开发者一起讨论~

感谢您的阅读,也欢迎您发表关于这篇文章的任何建议,关注我,技术不迷茫!小编到你上高速。

· END ·

最后,关注公众号互联网架构师,在后台回复:2T,可以获取我整理的 Java 系列面试题和答案,非常齐全。

正文结束

推荐阅读 ↓↓↓

1.不认命,从10年流水线工人,到谷歌上班的程序媛,一位湖南妹子的励志故事

2.如何才能成为优秀的架构师?

3.从零开始搭建创业公司后台技术栈

4.程序员一般可以从什么平台接私活?

5.37岁程序员被裁,120天没找到工作,无奈去小公司,结果懵了...

6.IntelliJ IDEA 2019.3 首个最新访问版本发布,新特性抢先看

7.这封“领导痛批95后下属”的邮件,句句扎心!

8.15张图看懂瞎忙和高效的区别!

一个人学习、工作很迷茫?

点击「阅读原文」加入我们的小圈子!

5秒内克隆你的声音,并生成任何内容,这个工具细思极恐...还特么的开源~相关推荐

  1. AI拟声: 5秒内克隆您的声音并生成任意语音内容

    特征

  2. 如何安装MockingBird-AI拟声: 5秒内克隆您的声音并生成任意语音内容

    作者:虚坏叔叔 博客:https://xuhss.com 早餐店不会开到晚上,想吃的人早就来了!

  3. 百度语音系统Deep Voice新突破 可在几秒内克隆你的声音

    文章来源:ATYUN AI平台 百度的AI研究部门近日宣布,其文本到语音(TTS)系统"Deep Voice"已经学会了如何使用仅三秒钟的语音样本数据来模仿人类的声音. 这项技术被 ...

  4. [转载] 细思极恐的星座分析(下)- 外太空?内子宫?人类的天赋从何而来?

    参考链接: 显示给定出生日期的星座或黄道十二宫的Python程序 在看完本文上半部分后,大家应该对星座与人类天赋之间的关系有了比较深刻的了解.在本文下半部分中,我将通过星座来猜测天赋的成因.与&quo ...

  5. 传苹果将弃用高通、博通芯片;华为研发投入排全球第四;​微软新文本语音模型可在 3 秒内复制任何人的声音 | 极客头条

    「极客头条」-- 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧. 整理 | 苏宓 出品 | CSDN(ID:CSDNnews) ...

  6. 这个 GitHub 项目能克隆你的声音

    今天推荐一个黑科技开源项目,只需要你 5 秒钟的声音对话,就能克隆出你的声音,而且能够实时的生成你任意语音. 是不是很顶? 我觉个例子,如果我这里有 300 条你说话的语音,我把你的语音数据用这个开源 ...

  7. 有点恐怖,这个工具能让你在 20 秒内,克隆你的声音,并转成英语!

    公众号关注 "GitHubDaily" 设为 "星标",每天带你逛 GitHub! 在上学那会,我便一直有个想法,要是能有一个英汉自动翻译机,能把我说的话,直接 ...

  8. AI软件克隆你的声音,全球诈骗案件已屡次得逞!

    在2月28号刚于旧金山结束的RSA大会上,一家名为Pindrop的专门检测语音诈骗的初创公司再次向业内发出警告:网络诈骗份子已经开始借助AI软件克隆声音进行诈骗了! Pindrop的CEO(右)和CT ...

  9. 只要5秒就能“克隆”本人语音!美玉学姐不再查寝,而是吃起了桃桃丨开源

    博雯 萧箫 发自 凹非寺 量子位 报道 | 公众号 QbitAI 现在,AI已经能克隆任意人的声音了! 比如,前一秒的美玉学姐还在宿舍查寝: 后一秒就打算吃个桃桃: 简直就是鬼畜区的福利啊! (像我们 ...

  10. 我的世界java手机版怎么调按键_如何在10秒内,让我的世界立即“自爆”?一个隐藏的mc快捷键...

    传说用give指令9999个蛋糕,在mc会发生一个诡异事情! 关于"9999蛋糕梗"的小故事:这个梗流传于国外的Minecraft社区,早年间一位玩家试图在游戏中给自己可爱的女朋友 ...

最新文章

  1. 和平精英android怎么写符号,和平精英名字特殊符号怎么打 和平精英名字特殊符号输入方法...
  2. python小技巧-基于python本身
  3. 获取今天,昨天,本周,上周,本月,上月时间
  4. verilog中assign语句
  5. 笔记本上的小键盘计算机怎样用,笔记本数字小键盘不能用怎么办【解决方法】...
  6. java.lang.ClassCastException:android.widget.Button cannot be cast to android.widget.ImageView
  7. color2gray 的实现
  8. 统计正数和负数的个数然后计算这些数的平均值_计算机中的二进制原来是这样:原码、反码和补码
  9. Nodejs 使用Protobuf
  10. Fiddler5中文版
  11. linux开启防火墙教程,linux系统开启防火墙及开放端口操作步骤
  12. 群体遗传分析—LD连锁不平衡
  13. Selenium QQ自动化登录
  14. [转]尚学堂科技 - 马士兵老师-JAVA自学之路
  15. HK32F030MF4P6 TM1650驱动
  16. 避雷快手!确认面试通过,提交银行流水和个人信息后,被告知其他人接了offer!...
  17. Linux在中国...
  18. dhtmlxGantt让您将甘特图导出为PDF或 PNG格式
  19. 【每日早报】2019/09/06
  20. 自己弄个app要多少钱自建app费用多少,自建app如何收费?

热门文章

  1. 记录一下通过QQ发送apk安装失败原因。
  2. 可解释深度学习:从感受野到深度学习的三大基本任务:图像分类,语义分割,目标检测,让你真正理解深度学习
  3. 计算与背景反差较大显示明显的前景色
  4. simulink反差表
  5. 百度地图导航tts语音静音问题的解决
  6. 今日,华为重磅发布6大创新产品及服务!
  7. 2021江西省数学建模A题
  8. mysql语句重命名索引_如何重命名MySQL中的索引
  9. 【正点原子STM32】delay.c文件里关于fac_us=SystemCoreClock/8000000的讲解
  10. SpringCloud微服务网关技术——Gateway网关的使用