吴禀雅

摘要:将计算机语音合成技术应用到计算机辅助教学CAI中,对教学能提供较大帮助。可以利用专门的语音合成软件TTS App进行语音合成,也可以利用Microsoft Office XP中的Excel提供的语音合成功能,通过设置,在Word和PowerPoint中实现语音合成。

关键词:语音合成;CAI;TTS App;Office XP

引言

计算机语音合成即TTS(Text to Speech),指计算机将随机产生的、或外部输入的文字信息转变为人可以听懂的、较流利的口语输出。语音合成是计算机应用的重要领域,其研究涉及到计算机科学、语言学、语音学、人工智能、心理学等多种学科。

实现计算机语音输出一般有两种方法:一种是录音/重放,另一种是文字—语音转换。录音/重放方法是原语音的重现,可获得高质量的声音,但它不能满足实时修改发音内容的需要,而且所需的存储容量会随发音时间而线性增长。文字—语音转换方法可以根据给定文字即时发出语音,文语转换的参数库不会随发音时间增长而加大,但是要寻找合适的参数和生成算法,并合成极似人类发音的、自然流畅的语音难度非常大。

一般来说,录音/重放技术常应用于一些不需要语言理解和随时更新的系统中,如航班信息发布、语音报时、汽车报站、电话语音服务等系统。而文字—语音转换系统是基于语音合成技术实现的文字到语音的即时转换,能适应各种需求,应用领域极为广泛。

1计算机辅助教学CAI中的语音合成

随着现代教育技术水平的提高,以及各院校多媒体教学设备的更新,许多教师都采用了CAI技术和多媒体教学手段,其中不可避免地要碰到输出语音的问题,比如在利用PowerPoint电子演示文稿软件放映幻灯片时,有时就需要输出语音。利用PowerPoint自带的“录制旁白”的方法,将教师的语音保存在计算机中,放映时同步播出,这样做虽然语音质量较好,但是一则录制旁白比较麻烦,花费时间较长,对录音时的环境要求较高,二则需要较大的存储空间,不利于课件的转送,三是内容不能更新。另外,有些课程,如《计算机专业英语》,其中许多内容并没有配备相应语音文件,单独找外教录制也很麻烦。

因而,将计算机语音合成技术应用到多媒体教学中,让计算机自己按照教师的要求即时“读”出语音,是非常有意义的。

2语音合成应用于CAI中的实现技术

要在CAI中实现语音合成,可以采取直接调用TTS软件合成语音的方法,也可以在CAI课件中嵌入语音。TTS软件可以将输入文本后直接转换成语音输出,而且可以控制语音的语速、音量、暂停、继续播放等,操作简便。在课件中嵌入语音,可以利用Microsoft Office XP自带的语音合成引擎,经过简单设置后实现指定内容的语音输出。

2.1利用TTS软件直接输出语音

自20世纪60年代首个英语TTS系统研制成功以来,迄今世界上已推出多种语言的TTS系统。近年来我国也研制出许多优秀的汉语TTS软件,都较好地实现了输入语篇后立时转换成语音的任务,而且这些系统合成的汉语语音的可懂度、清晰度都达到了较高的水平。

在这样的软件环境下,教师可以直接利用现成的TTS软件实现语音输出。这里以Microsoft Speech SDK中的TTs App软件的操作为例作一介绍。

首先在网络浏览器IE的地址栏中输入网址:http://www.microsofl.corn/downloads/details.aspx?Familyld=5E86EC97-40A7-453F-BOEE-658317184530&displaylang=en在该Microsoft Speech SDK 5.1下载页面上找到“Files inThis Download"部分,如图1所示。这部分包括了几个独立的供下载的文件。其中SpeechSDK51.exe文件提供了英语语音引擎,SpeechSDK51LangPack.exe文件提供了汉语语音引擎。

下载完成后,首先双击运行SpeechSDK51.exe进行解压,解压完成后双击运行解压出的Setup.exe安装文件,按照安装向导提示安装Microsoft Speech SDK 5.1。该文件安装完成后,再双击SpeechSDK51LangPack.exe自解压文件,解压后将在当前目录下生成一个名为LangPack的文件夹,在该文件夹中找到Setup.exe安装文件,双击运行,按照安装向导的提示进行“Complete”安全安装。

安装完成后,在[开始]菜单的[所有程序]下会发现一个[Microsoft Speech SDK 5.1]程序组图标,在其下级菜单中找到[Tool]菜单顷,其中有—个[TTs App]命令,单击,即可运行该软件。

在“Enter text you wish spoken here.(在此输入你想朗读的文本)”文本输入框中,输入需要语音输出的文本内容,单击右边的“Speak”按钮,就可以听到计算机合成的语音输出了。

用户可以通过“Voice”下拉式列表框来选择英文语音发音(分男女声)或中文语音发音(男声),并可通过“Rate”滑尺来选择语音的音速,通过“Volume”来调节语音的音量高低,通过“Format”下拉式列表框来选择声音的格式。另外还可以通过右侧的“Pause”、“Speak”按钮来控制输出语音的输出和继续播放等。

利用Microsoft Speech SDK这个TTS软件来进行计算机语音合成,因为需要在教师机上下载相应的软件并进行安装,另外输入的文本篇幅受限小且不能保存,所以使用上有局限性。

2.2在Microsoft Office XP中实现语音输出

现在多数教师所用的计算机都安装了Microsoft OfficeXP办公软件。Microsoft Office XP比起Microsoft Office以前的版本来说,增加了许多新功能,其中包括语音合成功能。

2.2.1 Excel语音合成功能介绍

启动Excel(本文中所提到的Word、Excel和PowerPoint指的都是Microsoft Office XP中的成员),单击[工具]菜单下的[语音]菜单项,在下级菜单中选中[显示“文本到语音”工具栏]复选项,即出现“文本到语音”工具栏。

“文本到语音”32具栏中的按钮从左到右依次为“朗读单元格”、“停止朗读”、“按行”、“按列”和“按回车键开始朗读”。

当用户在单元格中输入要合成语音输出的文本内容后,选中单元格,单击“文本到语音”工具栏中的“朗读单元格”按钮,就可以听到计算机合成的语音输出了。

这里需要说明的是,通过选择“控制面板”下的“声音、语音

和音频设备”项目,选择其中的“语音”图标,在弹出的“语音属性”对话框中有一“语音选择”下拉式列表框,如图2所示,通过选择“Microsoft Sam”(英文男声朗读)或“Microsoft SimplifiedChinese”(简体中文男声朗读),可以分别实现英文语音输出和中文语音输出。此外,还可以对输出语音的速度进行调整。

2.2.2在Word中实观语音合成

启动Word,单击[工具]菜单下的[宏],在弹出的下级菜单中选择[宏…]菜单项。在弹出的“宏”对话框中的“宏名”文本输入框中输入宏的名称,例如“WordTTS”,单击“创建”按钮。在弹出的Microsoft Visual Basic中的代码输入窗口中,输入以下代码:

Sub WordTTS

Call Excel.Application.Speech.Speak(Selection)

End Sub

输入完成后,再单击[工具]菜单下的[引用]菜单项,在弹出的“引用”对话框中的“可使用的引用”列表框中,找到并选中“Microsoft Excel 10.0 Object Library”复选框,单击“确定”按钮,并保存,关闭Microsoft Visual Basic窗口,回到Word编辑窗口。

在Word的文档中输入文字,例如:

“How to select a personal computer system?1 will tell you

something about that.”

随后选中这段文字,再单击[工具]菜单中的[宏],选择[宏]菜单项,在弹出的“宏”对话框中选中“WordTTS”宏名,单击“运行”按钮,就可以听到计算机读出的语音了。

这样,当我们需要在Word中进行语音合成时,只要选定需要输出语音的文本内容,再运行刚才的宏WordTTS,就可以随时得到合成语音了。

2.2.3在PowerPoint中实现话音合成

在Word中我们实现了利用计算机语音合成来进行CAI的语音输出。但是在实际教学中,大多数教师在教学过程中使用了Microsoft Office XP中的PowerPoint电子演示文稿软件来制作多媒体课件。我们也可以利用Microsoft Office XP的语音合成功能实现PowerPoint电子演示文稿中的语音输出,使语音合成功能更具实用性。

首先启动PowerPoint,在出现的新建演示文稿的第—张幻灯片中,单击标题文本框(也即第—个文本框),输入—段文字,例如:

“How to select a personal computer system?I will tell you

something about that.”

单击[32具]菜单下的[宏],在弹出的下级菜单中选择[宏…]菜单项。在弹出的“宏”对话框中的“宏名”文本输入框中输入宏的名称,例如“PPTTTS”,单击“创建”按钮。在弹出的Microsoft Visual Basic编辑器中,单击[工具]菜单下的[引用]菜单项,在弹出的“引用”对话框中的“可使用的引用”列表框中,找到并选中“Microsoft Excel 10.0 Object Library"复选框,单击“确定”按钮。接着,在代码输入窗口中,输入以下代码:

单击[幻灯片放映]菜单中的[动作按钮]菜单项,在列出的十二种动作按钮中任选一种动作按钮。双击幻灯片的右下角,将动作按钮插入到幻灯片中。在随即弹出的“动作设置”对话框中,选择“单击鼠标”选项卡,将“单击鼠标时的动作”设为“运行宏”,并在“运行宏”下方的下拉式列表框中选定刚才所创建的"PPTTTS"宏名,单击“确定”按钮。这样在幻灯片中就出现了一个动作按钮,如图3所示。

最后,单击[幻灯片放映]菜单下的[观看放映],进入幻灯片放映的界面中,再单击动作按钮,就可以听到对这第一张幻灯片的第一个文本框中的内容的语音朗读了。

该过程的代码中的"Call Excel.Application.Speech.Speak.(PowerPoint.ActivePresentation.Slides(1).Shapes(1).TextFrame.TextRange.Text)"语句,是对PowerPoint当前电子演示文稿中的第1张幻灯片的第1个对象文本框中的文本内容进行语音输出。当用户插入新的幻灯片时,只需对相应的代码加以修改即可。

3结束语

计算机语音合成在计算机辅助教学CAI中具有很大的作用。教师可以通过专门的TTS软件实现语音输出,也可以在Microsoft Office XP中实现语音输出。利用本文中所述方法,教师只需通过简单的语句设置和操作,即可完成CAI课件中的语音合成。

但是不管用何种方法实现语音输出,都存在计算机合成语音的质量问题。合成语音的质量取决于语音合成引擎的质量。计算机语音合成的质量不够高、自然度和流畅度不够好等,是语音合成研究领域仍在努力攻克的难题。随着计算机语音合成技术的发展,合成语音的质量、自然度和情感表现力将会不断地提高。相信在不久的将来,合成语音能像人类发音一样自然流畅。

所谓语音合成 是计算机根据语言学,计算机语音合成在GAI中的应用相关推荐

  1. 计算机 语言学 交叉,计算机和语言学

    计算机和语言学 端木:我们这些学英语的,基本就是两条路啊,要不然做文学,要不然做语言学.我呢,对语言学比较感兴趣一些. seren:这样啊.那我看到您在MIT念书的时候,还念了一个计算机的专业? 端木 ...

  2. 计算机和语言学的交叉,计算语言学与传统语言学的区别

    冯志伟在翻译<自然语言处理综论>(修订本) 计算语言学与传统语言学的区别 冯志伟 1964年我在北京大学中文系读研究生的时候,向我的导师岑麒祥教授提出了一个在当时看来很奇特的要求:我要求把 ...

  3. 计算机在英语口语教学中的应用,计算机在英语口语与听力教学中的应用.doc

    计算机在英语口语与听力教学中的应用 计算机在英语口语与听力教学中的应用 扬州市邗江区霍桥学校 225104 练厚兵 [摘要]:随着计算机技术的发展,计算机对语音处理的速度越来越快,语音处理质量也越来越 ...

  4. 人工智能语音合成:实现更加智能的语音合成

    作者:禅与计算机程序设计艺术 人工智能语音合成:实现更加智能的语音合成 作为一名人工智能专家,软件架构师和程序员,我今天将探讨如何实现更加智能的语音合成,以及人工智能语音合成技术的一些原理和方法. 引 ...

  5. 计算机和我的关系 论文参考文献,近几年计算机学生参考文献 计算机学生期刊参考文献哪里找...

    导出. [4]计算机硬件教学中提升学生主动性成效的新思路.卢爱臣.杨迪.王剑宇,2008全国高等院校计算机基础教育研究会2008年会 [5]创设计算机与信息技术应用氛围切实提高学生信息素养.赵丽,2 ...

  6. 徐文尚计算机控制系统,【计算机控制系统 徐文尚】_计算机控制系统 徐文尚参考资料-毕业论文范文网...

    棉纺质量控制的计算机控制系统分析 摘要]计算机辅助生产(puterassistantmanufacture)和控制(puterassistan. 计算机控制系统在电力行业的应用分析 用分析[j].广东 ...

  7. 化验室计算机用户管理,计算机实验室管理思路及方法

    计算机实验室管理思路及方法 高校计算机实验室机房在学生的培养.成长中发挥着十分重要的作用,为了给高校学生提供更好的计算机学习环境,就应该提高高校计算机实验组机房的管理和维护水平.作为高校计算机机房的管 ...

  8. 全国成人计算机考试题,成人计算机考试试题.docx

    成人计算机考试试题 计算机在现代社会越来越重要,下面就是为您收集整理 的成人计算机考试试题的相关文章,希望可以帮到您,如果 你觉得不错的话可以分享给更多小伙伴哦! 成人计算机考试试题 一.理论部分(共 ...

  9. 电子科大计算机组成原理ppt,电子科技大学,计算机组成原理3计算机组成原理-3-5-组合逻辑控制方式.ppt...

    文档介绍: 3.5组合逻辑控制虽谆煤疟胜尉张型佳腐瞪咕涝递咱砒融外尉绕粥宰墒剥俐拉摆斯绵峪掉海电子科技大学,计算机组成原理3计算机组成原理-3-5-组合逻辑控制方式电子科技大学,计算机组成原理3计算机 ...

  10. 计算机基础理论汇编,计算机基础知识:计算机中的汇编语言

    一.汇编语言的概念 汇编语言是一种功能很强的程序设计语言,也是利用计算机所有硬件特性并能直接控制硬件的语言.汇编语言的实质和机器语言是相同的,都是直接对硬件操作,只不过指令采用了英文缩写的标识符,更容 ...

最新文章

  1. python读文件代码-Python遍历文件夹和读写文件的实现代码
  2. Quartz应用----发送邮件工作调度Java(转)
  3. **Java有哪些悲观锁的实现_Redis 分布式锁的正确实现方式(Java版)
  4. 美国智能家居止步不前 原因是产品过于碎片化
  5. android评论嵌套,android 嵌套的listview示例(可参照实现朋友圈评论)
  6. LeetCode 463. Island Perimeter
  7. Xcode 4.2 中的Automatic Reference Counting (ARC) (转)
  8. 工人与资本家互相养活,主动权在资本家手里
  9. python爬取喜马拉雅vip音频安卓_Python爬虫:爬取喜马拉雅音频数据详解
  10. 项目管理—领导力与管理的区别
  11. 涨姿势!3D游戏里的男女性角色是这样建模出来的
  12. redis的三大模式主从,哨兵和集群
  13. Multisim基础 发光二极管 添加元件的位置
  14. 2022最全大数据学习路线(建议收藏)
  15. 查看邮件导致关联?亚马逊多账号管理必看
  16. 太简单了!串口触摸屏开发HMI的全流程介绍
  17. 3D视觉检测风挡玻璃智能涂胶工作站
  18. Python pandas库|任凭弱水三千,我只取一瓢饮(1)
  19. Facebook在美上线相亲功能,微软AI成为麻将冠军!...|一周热闻回顾
  20. 6-1 水仙花数判断 (10分)(函数题)

热门文章

  1. 研究生学习生活日记——未来三年的规划
  2. 大数据领域常用算法总结
  3. friends105. The One with the East German Laundry Detergent
  4. 远程唤醒、WOL、Magic_Packet【转】
  5. 数字电路基础(三)编码器和译码器
  6. 实现网站二维码扫描登录
  7. 【IT职业】IT人的职业规划
  8. python处理考勤数据_python连接中控考勤机分析数据
  9. html <font>中英文常用字体和颜色总结
  10. 身为码农,为12306说两句公道话