知乎第一篇文章,本来想写一篇简单的单进程单线程爬虫教程的,可是知乎上这样的文章已经有很多了,而且写的好的挺多,我就不添堵了。下次有空的话写一篇多线程请求的爬虫教程。

这是一篇简单的Python文字(汉字)转语音教程,当然对于其他语言工具在实现的方法上也是一样的 。

在自然语言处理上,文字、音频互转是一个很关键的技术点。对于语音转文字,这个个人实现较为困难,我们可以使用语音转文字的软件或借助各API(如科大讯飞等)进行移植开发。不过文字转语音就相对而言容易实现很多了。

简言之, 汉字转语音实现就分为两步,第一步将汉字转为拼音,第二步通过拼音调用相匹配的音频文件。下面是具体的开发实例教程。

开发环境:Windows

Python版本:3.x

外置模块准备:pygame(可直接在cmd命令行中pip install pygame安装)

汉字转拼音

我使用的是将汉字转为Unicode码,然后通过查询一个匹配文件(我使用的是unicode_py.txt)获取该汉字的拼音,该文件中列有从4E00-9FA5标准汉字的Unicode编码所对应的拼音,外加一个落单的3007编码的“〇”。

文件如下:

文件链接:链接: https://pan.baidu.com/s/1nwhSnDf 密码: 73yk

在大写拼音英文后的1,2,3,4,5分别表示一,二,三,四和轻声(注意到存在有多音字)

我们将其封装成一个函数,参数为一个全是汉字的字符串,返回是一个拼音字符串。(即chinese_to_pinyin("秋水共长天一色") 返回的是"QIU1 SHUI3 GONG4 CHANG2 TIAN1 YI1 SE4 ")

源码如下:

def chinese_to_pinyin(x):

y = ''

dic = {}

with open("unicode_py.txt") as f:

for i in f.readlines():

dic[i.split()[0]] = i.split()[1]

for i in x:

i = str(i.encode('unicode_escape'))[-5:-1].upper()

try:

y += dic[i] + ' '

except:

y += 'XXXX ' #非法字符我们用XXXX代替

return y

说明:将该文件与"unicode_py.txt"文件放在同一目录下,代码比较简陋,因为主要给大家讲实现教学,所以没有对多音字进行处理(所以默认使用第一个使用频率最高的音)

拼音转语音

这一步也比较简单,我们根据拼音调用相对应的单个音的音频文件即可。单个音的音频文件可以自己录或找人录,渠道有很多哦。注意文件格式,最好是mp3或wav文件。

部分文件展示如下:

我们将其置入一个voice文件夹下。准备工作就做好了。

我们同样将汉字转语音封装成一个make_voice函数,参数为一个汉字字符串,然后调用chinese_to_pinyin函数,返回值不重要,可为空,功能实现是调用音频文件发音。

源码如下:

import pygame

def make_voice(x):

pygame.mixer.init()

voi = chinese_to_pinyin(x).split()

for i in voi:

if i == 'XXXX': #处理'XXXX'的音,可将其忽略

continue

pygame.mixer.music.load("voice/" + i + ".mp3")

pygame.mixer.music.play()

while pygame.mixer.music.get_busy() == True:

pass

return None

我们展示一下这个教学版的最后完整的代码图(该文件名为"test.py"):

import pygame

def chinese_to_pinyin(x):

y = ''

dic = {}

with open("unicode_py.txt") as f:

for i in f.readlines():

dic[i.split()[0]] = i.split()[1]

for i in x:

i = str(i.encode('unicode_escape'))[-5:-1].upper()

try:

y += dic[i] + ' '

except:

y += 'XXXX '

return y

def make_voice(x):

pygame.mixer.init()

voi = chinese_to_pinyin(x).split()

for i in voi:

if i == 'XXXX':

continue

pygame.mixer.music.load("voice/" + i + ".mp3")

pygame.mixer.music.play()

while pygame.mixer.music.get_busy() == True:

pass

return None

while True:

p = input("请输入文字:")

make_voice(p)

教程文件的目录结构:

test.py

unicode_py.txt

voice----A1.mp3

A2.mp3

A3.mp3

...

实现原理就是这样,同时也可以视一些具体情况做一些拓展,例如将阿拉伯数字转汉字读法(即1234006.15读作“一百二十三万四千零六点一五”,这个实现不难),还有将多音字问题攻破也是很棒的。

当然只要想法够丰富用pygame的音频功能也能实现很多有趣的功能(如播放器制作或电子音乐简单创作等)。

python中文字符串转语音_Python实现文字转语音功能相关推荐

  1. python中文字符串多余空格_python使用正则表达式去除中文文本多余空格,保留英文之间空格方法详解...

    python使用正则表达式去除中文文本多余空格,保留英文之间空格方法详解 在pdf转为文本的时候,经常会多出空格,影响数据观感,因此需要去掉文本中多余的空格,而文本中的英文之间的正常空格需要保留,输入 ...

  2. python中文字符串比较模块_python比较字符串相似度,原创度检测工具

    #-*- coding: utf-8 -*- """基于gensim模块的中文句子相似度计算 思路如下: 1.文本预处理:中文分词,去除停用词 2.计算词频 3.创建字典 ...

  3. python 中文字符串分割与拼接

    python 中文字符串分割与拼接 1. 中文字符串分割 path = 'D:/硕博/博士生期间资料/机器学习/机器学习课程资料/HW1/data/本纪list格式/高祖本纪.txt' with op ...

  4. Android App开发语音处理之系统自带的语音引擎、文字转语音、语音识别的讲解及实战(超详细 附源码)

    需要源码请点赞关注收藏后评论区留下QQ~~~ 一.系统自带的语音引擎 语音播报的本质是将书面文字转换成自然语言的音频流,这个转换操作被称作语音合成,又称TTS(从文本到语音)在转换过程中,为了避免机械 ...

  5. html5d调用百度语音,易语言调用百度语音平台实现文字转换语音功能的代码

    调用百度语音平台实现文字转换语音功能 此功能需要加载精易模块5.6 .版本 2 .支持库 wmp9 .程序集 窗口程序集1 .子程序 _试听按钮_被单击 播放器1.地址 = "http:// ...

  6. 【微信小程序】语音播报,文字转语音,使用《微信同声传译插件》

    需要实现的功能是: 输入一段文字,由小程序读出来 步骤如下: 一.小程序添加 "微信同声传译" 插件 添加插件步骤看这篇博===>如何添加插件并配置 二.代码编写 index ...

  7. 语音计算机管家,文字转语音软件管家 免费版

    文字转语音软件管家由华军小编为你搜集整理,"文字转语音软件管家"致力于向您提供最高品质的语音角色,助您轻松制作各类真人语音资料.语音广告.有需要下载使用文字转语音软件管家的小伙伴们 ...

  8. 【vue 语音播报(文字转语音)】

    vue 语音播报(文字转语音) 1.安装speak-tts包 npm install speak-tts 2.在页面中引入 import Speech from 'speak-tts' 3.初始化以及 ...

  9. python中文字符串编码_python中文乱码 字符串和编码

    Unicode把所有语言都统一到一套编码里,这样就不会再有乱码问题了. Unicode标准也在不断发展,但最常用的是用两个字节表示一个字符(如果要用到非常偏僻的字符,就需要4个字节).现代操作系统和大 ...

最新文章

  1. 如何用python编写一个绘制马赛克图像的自写程序mask = np.zeros
  2. C语言输入一行整数(OJ输入格式)
  3. CSS :hover 伪类
  4. 设计赋能,数联杭温!2020温州“市长杯”·数字设计(杭州)专项赛开始报名啦!...
  5. 画师id_二次元小姐姐:画师OBM 大庭下門的插画作品
  6. 安装软件要求输入服务器配置信息,信息技术考试软件配置安装与操作规范(管理服务端与客户端)(30页)-原创力文档...
  7. oracle中查询实现以下结果,如何在Oracle中为查询结果分配等级?
  8. 【iOS系列】-iOS中内存管理
  9. 100以内偶数的个数_【数学杂谈】如何记住1000以内的所有质数?
  10. 蓝桥杯2020山西省省赛太原理工大获丰收
  11. js通过浏览器批量下载图片代码
  12. 面试IT公司的时候,程序员的简历应该写多少个项目经验比较合适?
  13. MySQL之表的约束(主键、外键、唯一键、自增长、列描述、默认值、空属性)
  14. IMO Res MSC 307(88) 国际船舶材料防火试验
  15. 对《人工智能的进化》这一人工智能方面科普书籍的学习/摘抄/总结
  16. Intellij IDEA 提示 Cannot access com... 解决办法
  17. 服务器系统可以重装系统,服务器上可以重装操作系统吗
  18. excel怎么删除换行符
  19. 一些对模糊搜索的思考
  20. C++播放音乐和MFC的messagebox用法

热门文章

  1. RouterOS(ROS)定时备份配置并发送至邮箱脚本
  2. asp.net在遨游3下的一个BUG
  3. 什么是面向对象?什么是面向过程?及其优缺点。
  4. android平板 跑分软件,新人看过来 安卓平板装机必备软件推荐
  5. c语言叠罗汉问题解决思路,叠罗汉(示例代码)
  6. 04747 java语言程序设计(一)_自考软件工程:2017年4月04747Java语言程序设计(一)历年真题及答案...
  7. 数码相框_通过随机选择的媒体文件轻松加载数码相框和MP3播放器
  8. 象棋小游戏(pygame)代码汇总
  9. 最小树形图(朱刘算法)模板
  10. 分享各电商平台上的评论视频、主图和详情页的下载方法