开源(离线)中文文本转语音TTS(语音合成)工具整理

目录

文章目录

  • 目录
  • PaddleSpeech
  • VoiceVox
  • TensorFlowTTS
  • ttskit
  • OpenTTS
  • eSpeak
  • 微软 TTS

PaddleSpeech

PaddleSpeech 是一个开源的流式语音合成系统,它提供了基于 FastSpeech2 声学模型和 HiFiGAN 声码器的中文流式语音合成系统。它采用了基于规则的中文文本前端系统,对文本正则、多音字、变调等中文文本场景进行了优化 。

github 7.3k stars

VoiceVox

VoiceVox是一个免费的开源 TTS 软件,目前已经增加到 10 个声库 。

github 11,5k stars

TensorFlowTTS

TensorFlowTTS是一个离线、开源的语音合成(text to speech)模型,支持多种最前沿的模型选择,具备SOTA级效果。

github 3.3k stars

ttskit

ttskit是一个好用的中文语音合成工具箱,包含语音编码器和解码器,支持多种模型和多种语音合成引擎。

Github 649 stars

OpenTTS

OpenTTS 是一个用 Python 编写的免费、开源的文本转语音服务。 它是根据MIT License发布的。 它支持多种语言,并带有易于使用的界面。 此外,它还带有许多替代库。

Github 497 stars

eSpeak

eSpeak 是一个紧凑的开源软件语音合成器,适用于 Linux 和 Windows,支持多种语言和口音,包括中文普通话,并附带许多有用的功能,这使其成为许多用户的理想选择。

GitHub 2K stars

微软 TTS

微软出品的一种语音服务功能,可将文本转换为逼真的语音。据说是目前最好用的文字转语音工具。

具有神经网络真人发音、支持定制、在任何地方(在云中、本地或容器边缘)运行文本转语音、

限制:不开源且收费,有免费版和付费版,免费版有额度上限!

参考文章:

微软文本转语音产品官方地址:Text to speech

Sample 源码 地址: Cognitive-Speech-TTS

微软语音服务官方文档:Speech service documentation

微软的技术,直接颠覆了我对听书这件事的看法!

开源(离线)中文文本转语音TTS(语音合成)工具整理相关推荐

  1. 开源(离线)中文语音识别ASR(语音转文本)工具整理

    开源(离线)中文语音识别ASR(语音转文本)工具整理 目录 文章目录 目录 @[toc] open ai 的开源工具:whisper whisper介绍 引用 ASRT语音识别项目 ASRT介绍 引用 ...

  2. 【语音合成】TensorFlowTTS 中文文本转语音

    [语音合成]TensorFlowTTS 中文文本转语音 文章目录 [语音合成]TensorFlowTTS 中文文本转语音 简介 环境配置 1.windows端 2.ubuntu端(可行) 程序运行 1 ...

  3. qt文本转语音tts的使用方法,QTextToSpeech

    这个功能已经被qt封装好了,在不同的操作系上封装了不同的方法. 在win7上,qt调用的是微软讲述者(microsoft speech),这个功能在原版win中是自带的,在ghost或者阉割版win中 ...

  4. windows下文本转语音TTS库封装

    一.文本转语音实现 本文提及的文本转语音库其实很多年前写的库,最近有才时间整理才将对应库整理成文章供各位网友参考. 其实在windows下自带了文本转语音以及语音识别的功能,这里由于项目中需要将报警文 ...

  5. UE5文本转语音TTS插件

    UE4.26版本的TTS文本转语音插件,同时有UE5版本 使用起来也非常简单 在文本框输入想要发音的文字 关键的语音调用 项目下载地址:https://download.csdn.net/downlo ...

  6. 文本转语音TTS(文本阅读和视频配音制作)MP3

    DL-TTS 通过AI驱动引擎可将文本转化为逼真的语音并可导出MP3音频文件,它可以: (1)生成逼真的合成语音 实现与人声的语调和情感匹配的流畅.发音自然的文本转语音. (2)细化的文本转语音控制 ...

  7. 国内外开源与 SaaS ,团队协作平台、项目管理工具整理

    整理一些开源与 SaaS ,团队协作平台.项目管理工具.还有哪些比较好的工具,可以推荐下? 名称 地址 备注 asana https://asana.com/ 国外 basecamp https:// ...

  8. Unity3D HoloLens2 中文文字转语音即语音合成(语音提示)功能

    文字转语音 UNITY_WSA平台 处理过程和实现原理 中文需要设置声音 上代码 使用方法 一.部署好Unity3d HoloLens项目工程 二.新建节点 三.添加TTS组件并配置 四.调用TTS功 ...

  9. 关于TTS语音合成技术整理

    TTS(Text To Speech),即语音合成技术,是一种把文本信息转换成语音信号的技术,在汽车导航.机器人以及很多语音软件中都有广泛的应用.几十年的发展,TTS技术已经非常成熟,国际IT巨头们大 ...

最新文章

  1. SIFT 特征检测及匹配
  2. 【文本分类】Convolutional Neural Networks for Sentence Classification
  3. 40+场面试,100%通过率,我想分享的 14 条经验
  4. 关于MySQL count(distinct) 逻辑的另一个bug
  5. ALGO-221 数据交换
  6. POJ-2186 Popular Cows (Tarjan缩点) 文末有测试数据
  7. 非985,计算机专业的大学生该如何自学编程?
  8. 人工智能人才缺口巨大,是否要从大学生抓起?
  9. CSS3动画之一:Transitions功能
  10. 一次新生代民工工友切磋经历
  11. 每日算法系列【EOJ 3031】二进制倒置
  12. python除数为0报错_python 错误捕获机制分析
  13. 利用pil库处理图像
  14. 梦幻西游网页版服务器互通吗,梦幻西游网页版开服伙伴
  15. mysql 创建表 create table详解
  16. 美团、飞猪基础架构组实习经历分享
  17. 如何选择数据拆分方法:不同数据拆分方法的优缺点及原因
  18. 使用hifiasm组装hifi基因组的方法介绍
  19. 生成式语言大模型压缩技术思考——以ChatGPT为例
  20. 张良、岳飞、钢铁是怎样炼成的

热门文章

  1. 2021年G3锅炉水处理考试题及G3锅炉水处理证考试
  2. 时间格式转换2021-08-17T16:00:00.000Z存入数据库问题
  3. python中and not是什么意思_python中and、not、or的含义以及优先级
  4. [GYCTF2020]Ezsqli --BUUCTF
  5. 自动车速度闭环控制器设计
  6. 【Active Learning - 03】Adaptive Active Learning for Image Classification
  7. 《高级无线网络—4G技术》——第2章  物理层和多址接入2.1 高级时分多址——ATDMA...
  8. Excel怎么改变表格边框及背景颜色
  9. 模电数电TTL电平上下拉电阻
  10. [SpringMVC笔记] SpringMVC-16-拦截器入门