点击关注我哦

一篇文章带你了解文本到语音转换步骤

在《这篇文章》中,我们有简单提到“文本语音转换”的相关内容,本文将继续讲述其详细实现步骤。

这里小编将介绍文本到语音翻译的基础知识。简要介绍文本语音转换,然后介绍如何开始安装Google文本语音转换(gTTS)模块。然后继续了解gTTS模块的工作原理,并编写一个简单的程序以更好地掌握总体概念。最后将探索更多有关使用此模块可以完成的工作的想法,然后尝试理解可以使用gTTS完成的许多实际用例。

P.S  本文将通过互联网使用Google API进行文本到语音的翻译,所以请大家保持网络连接正常。

注意:这是语言建模教程的第一部分。在本教程系列中,我们将介绍如何使用gTTS进行语音转换,光学字符识别,深度学习模型(如序列到注意力序列模型)以及其他有趣的东西。

TTS简介

文本语音转换(TTS)是将单词转换为语音形式的过程。程序,工具或软件从用户处获取输入文本,并使用自然语言处理方法来理解所用语言的语言学,并对文本进行逻辑推断。该处理后的文本被传递到下一个块,在该块中对处理后的文本执行数字信号处理。经过一些算法的处理,最终转换为语音格式。这整个过程涉及语音的合成。下面是一个简单的流程框图,可以帮助理解上述过程。

乍一看,这似乎是一个相当复杂的过程,但是有了python和gTTS模块,该过程可以简化为仅仅几行代码。从框图中了解到,首先通过自然语言处理对传递的文本进行预处理,然后使用数字信号处理将其转换为语音。

事不宜迟,让我们快速开始~

安装gTTs模块:

在本教程的其余部分中都将使用python。请保证电脑中有安装Python哦~

gTTS模块的安装非常简单,可以在命令提示符中使用以下命令来完成:

pip install gTTS

转换:

安装完成后,我们可以继续编写一个非常简单的程序,以了解如何使用此模块将输入的文本转换为语音。 来看一下我们的示例程序:

from gtts import gTTStext = "Hello! My name is Bharath."
tts = gTTS(text)
tts.save("hi.mp3")

gTTS(Google文本语音转换)是一个Python库和CLI工具,可与Google的文本语音转换API进行交互。我们将从gtts模块导入gTTS库,并用该库进行语音翻译。

文本变量是用于存储用户输入的字符串。文本可以替换为引号内的任何内容。另一种方法是在每次运行程序时使用input语句让用户自己输入。上述过程可按如下方式进行:

text = input("Enter your text: ")
tts = gTTS(text)
tts.save("user_input.mp3")

tts变量用于对用户的输入执行Google文本到语音转换。转换后的文本以语音形式存储在tts变量中。

tts.save函数允许以声音格式文件的形式来保存转换后得到的语音。在这里保存为一个名为user_inpurt,格式为.mp3的文件。当然也可以使用其他格式,如.wav等。

经过上述步骤已成功完成文件的保存。

读取:

1. 直接从文件夹运行保存的文件:可以在运行python程序的同一文件夹下找到保存的文件,并且直接播放。

2. 使用Python中的OS模块:使用python的OS模块直接从程序中运行文件。这样做的命令如下:

import os
os.system("user_input.mp3")

3. 使用playsound模块:playsound模块可以用一个简单的命令"pip install playsound"安装,然后使用以下命令继续播放文件中的音频:

from playsound import playsound
os.system("user_input.mp3")

结论:

gTTS模块也可以广泛用于其他语言,例如法语,德语,印地语等。当存在通信障碍并且用户无法将其消息传达给人们时,这个模块就显得非常有用了。文字转语音对视力障碍者或其他残疾人士也有很大的帮助,因为它可以通过协助文字到语音的翻译来帮助他们。

·  END  ·

HAPPY LIFE

使用Python三步完成文本到语音的转换相关推荐

  1. python音频转文字腾讯_使用Python三步完成文本到语音的转换

    重磅干货,第一时间送达 一篇文章带你了解文本到语音转换步骤 在<这篇文章>中,我们有简单提到"文本语音转换"的相关内容,本文将继续讲述其详细实现步骤. 这里小编将介绍文 ...

  2. Python三步爬取VMgirls小姐姐图片

    Python三步爬取VMgirls小姐姐图片 具体思路 第一步:确定目标 第二步:分析目标网站 第三步:代码编写 具体思路 第一步:确定目标:寻找目标网站,我选择的网站是http://www.VMgi ...

  3. 【Python实用API】文本转语音库-pyttsx3

    文本到语音转换库 0.描述 1.安装 2.基本用法: 3.进阶 0.描述 pyttsx3是Python中的文本到语音转换库,并且它是离线工作的. pyttsx3特点: 1.离线的 2.可调节:人声选择 ...

  4. python实现文字转语音_利用python实现自己的文本转语音

    1.安装python3.8.5 python   >>  downloads   >>   windows    >>  Windows x86-64 execut ...

  5. python 三步问题

    三步问题 三步问题.有个小孩正在上楼梯,楼梯有n阶台阶, 小孩一次可以上1阶.2阶或3阶.实现一种方法, 计算小孩有多少种上楼梯的方式.结果可能很大, 你需要对结果模1000000007.示例1:输入 ...

  6. 三步搞定:使用HandBrake转换视频为MP4(AVCH264)格式

    第一步 第二步 第三步:

  7. python调用报表制作工具_工作汇报神技!用Python三步生成带有图表的word报表

    最近在项目中做了一个生成并导出word报表的功能,在这里分享给大家. 经过查看ESPC原有的生成报表代码和网上查阅的一些方法,解决方案的思路如下: 1.利用pychartdir库生成图表,保存图片,转 ...

  8. python 写word图表标题_工作汇报神技!用Python三步生成带有图表的word报表

    结果为一张图片: 2.我们在word中如果只是引用路径,那么生成的word就会出现找不到图片,此时,我们应该使用下面这个函数将图片转化为字节数据: 此时我们就拿到了我们想要的数据 我们可以将所需要画图 ...

  9. python tts 保存wav_C#文本转语音并保存wav和MP3文件

    回顾上次写博客至今都有4个多月了,最近工作比较的忙没时间写博文.以后会多坚持写博文,与大家分享下最近遇到的问题.最近因为项目需要,研究了下用C#开发TTS.下面把大体的思路给大家说说,希望对大家有所帮 ...

最新文章

  1. insightface mxnet训练horovod版
  2. mysql數據庫的增刪改查_MySQL數據庫之基礎增刪改查操作
  3. tomcat 并发数已满_记一次天猫商城系统高并发的优化
  4. SpringBoot Admin2.0 集成 Java 诊断神器 Arthas 实践
  5. mfc 找到字符串中字符_[LeetCode] 467. 环绕字符串中唯一的子字符串
  6. Python(18)-字典dictionary、集合
  7. python包含多个元组的元组_Python数据结构(元组,列表,字典)
  8. 离散点自动生成等高线_有限自动机| 离散数学
  9. 从还珠格格到街头霸王!80后的怀旧神器 三星GalaxyFold另类体验
  10. python将py文件编译成二进制文件 加密
  11. snackbar_Android Snackbar示例教程
  12. 谁说菜鸟不会数据分析python mobi_利用Python进行数据分析[azw3+epub+mobi][30.34MB]
  13. 微信小程序常用UI组件库
  14. prosody相关概念了解。xmpp,jabber,bosh等
  15. HTML颜色值的设置
  16. Mybatis常见技巧
  17. python判断邮箱格式是否正确_如何判断用户输入的邮箱格式是否正确?
  18. 134. 加油站(JS实现)
  19. active英语怎么读音_inactive,inactive的英文意思和翻译,inactive的音标读音,用法,例句,发音,含义讲解...
  20. input标签checkbox选中触发事件的方法

热门文章

  1. 【软考】系统集成项目管理工程师(九)项目成本管理
  2. 微服务:架构体系的深度治理
  3. R语言学习笔记(六):OLS回归
  4. Java后端开发。大学本科的时候我是如何赚到10w+?
  5. 一位 sealer maintainer 的心路历程
  6. 有的时候,我们有需要将由不同栏位获得的资料串连在一起
  7. STM32CubeMX系列教程8:配置工程模板(串口+不定长数据收发+DMA+IDLE中断+软中断)
  8. 软件测试,对于文件的上传下载,导入导出的操作的测试点
  9. QWidgetAction实现鼠标滑过菜单项图标高亮显示
  10. 如何将sql2000备份数据库还原到sql2008中