DeepSpeech 是百度开发的开源实现库,它提供了当前顶尖的语音转文本合成技术。它基于 TensorFlow 和 Python,但也可以绑定到 NodeJS 或使用命令行运行。

Mozilla 一直是构建 DeepSpeech 和开源软件库的主要研究力量,Mozilla 技术战略副总裁 Sean White 在一篇博文中写道:「目前只有少数商用质量的语音识别引擎是开源的,它们大多数由大型公司主宰。这样就减少了初创公司、研究人员和传统企业为它们的用户定制特定的产品与服务。但我们与机器学习社区的众多开发者和研究者共同完善了该开源库,因此目前 DeepSpeech 已经使用了复杂和前沿的机器学习技术创建语音到文本的引擎。」

项目地址: https://github.com/mozilla/Deep

开源中国网址:https://www.oschina.net/p/deepspeech

Speech

DeepSpeech语音转文本合成技术相关推荐

  1. 如何通过讯飞语音将文本合成后的语音保存到本地

    如何通过讯飞语音将文本合成后的语音保存到本地 2014-2-21分类:Android, 解决方案, 随手实例 | 暂无评论 转自:http://www.krislq.com/2014/02/voice ...

  2. ROS 教程3 机器人语音 语音识别理解合成控制 ASR NLU TTS

    机器人语音 语音识别理解合成控制 ASR NLU TTS github 一.语音处理总体框架 1. 语音识别(ASR , Automatic Speech Recognition )2. 语义理解(N ...

  3. C#语音朗读文本 — TTS的实现

    TTS, Text To Speech的缩写,是使用语音朗读文本的技术.目前,在国内应用较多的是排队叫号系统 Windows 平台的TTS,通常使用的是微软自带的 Speech API. Window ...

  4. python pytorch语音识别_PyTorch通过ASR实现语音到文本端的模型以及pytorch语音识别(speech) - pytorch中文网...

    ASR,英文的全称是Automated Speech Recognition,即自动语音识别技术,它是一种将人的语音转换为文本的技术.今天我们主要了解pytorch实现语音到文本的端到端模型. spe ...

  5. 基于 Azure 的认知服务将文本合成语音

    基于 Azure 的认知服务将文本合成语音 Intro 前几天发了一个 .NET 20 周年祝福视频,语音是通过 Azure 的认知服务合成的, 下面就来介绍一下如何将使用 Azure 的认识服务实现 ...

  6. MS-TTS/Edge-TTS免费文本转语音,一键合成导出MP3音频

    原文:MS-TTS/Edge-TTS免费文本转语音,一键合成导出MP3音频_治廷君 注意:本工具完全免费,所以不提供任何售后服务及咨询,有问题请看教程或阅读下方文档自行解决,关于BUG,公众号后台回复 ...

  7. 人脑启发AI设计:让神经网络统一翻译语音和文本

    来源:图灵人工智能 作者:Glaciohound 编辑:陈彩娴 能够统一地理解语音和文本,是人类能够形成通用语言能力的重要原因.那么,人工智能是否也能如此?最近,来自字节跳动和UIUC的研究人员借鉴这 ...

  8. ICBU可控文本生成技术详解

    简介: 文本生成(Text Generation)是自然语言处理(Natural Language Processing,NLP)领域的一项重要且具有挑战的任务.顾名思义,文本生成任务的目的是生成近似 ...

  9. 盲人方便的使用计算机输入文字,中文信息学报盲人用计算机软件系统中的语音和自然语言处理技术Ξ.PDF...

    中文信息学报盲人用计算机软件系统中的语音和自然语言处理技术Ξ 中 文 信 息 学 报 第 18 卷 第 4 期 JOURNAL OF CHINESE INFORMATION PROCESSING Vo ...

最新文章

  1. 小学校园里计算机文字,中小学计算机教学论文(共2228字).doc
  2. DB2客户端,查看、增加、删除节点和数据库编目
  3. ajax被token拦截,vue中封装ajax请求,并且拦截请求在请求头中添加token
  4. Qt中的QFileDialog
  5. python对话框代码_Python、tkinter、复杂对话框和代码结构
  6. JAVA——基于HttpClient的获取帆软FineReport报表爬虫DEMO
  7. 红外线遥控c语言程序,红外遥控的C程序
  8. 吃是为了肉体,喝是为了灵魂
  9. 空间中任一点到超平面的距离公式的推导过程
  10. sqoop的job工具
  11. 备考计算机三级数据库——SQL 案例
  12. 马士兵老师Java虚拟机调优
  13. 修改IE浏览器点击右键“查看源文件”时的打开程序
  14. windows 下 redis服务经常自动关闭
  15. 2019年私域流量的演变历程剖析:定义、演变、成因、改变企业营销决策!
  16. 5g网速究竟有多快?比4g快多少?
  17. HTML5七夕情人节表白网页❤ 浪漫的樱花雨3D相册 ❤ HTML+CSS+JavaScript
  18. EPLAN Electric P8安装步骤说明 系统(win7 64位 旗舰版)
  19. 蓝色给自己的网站加一个好看的跳转页面代码
  20. linux基本功系列之wc命令实战

热门文章

  1. 如何打造高端的数据报表?
  2. Matplotlib绘图:plt?plt.subplots?plt.subplot?
  3. exlsx中定义名称步骤_excel定义名称详解
  4. Elasticsearch中的倒排索引和读写操作原理解析
  5. 桌面支持--skype登陆不上
  6. win7装xp(win7装xp双系统教程)
  7. 微信公众平台开发【发送消息】被动回复消息
  8. 5G发展困难,贪婪的手机企业不愿降价,运营商无奈再开4G价格战
  9. 相关性和差异的显著性
  10. wxpy 建群 err_code: 1 err_msg: