随着.net技术深入人心,越来越多的程序员开始转到.net平台上进行开发。然而,在新发布的.net speech SDK里面并没有对中文语音进行支持,目前支持中文的Speech SDK最高版本为Windows平台下的SAPI 5.1(),本文介绍如何在.net平台下利用SAPI5.1开发中文语音应用程序。

--------------------------------------------------------------------------------
目录:
1. SAPI.51 SDK浅析以及安装
2. 导入COM对象到.Net
3. 用C#开发中文TTS应用程序示例
4. 结论
5. 参考文献
--------------------------------------------------------------------------------
1. SAPI.51 SDK浅析以及安装
SAPI SDK是微软公司免费提供的语音应用开发工具包,这个SDK中包含了语音应用设计接口(SAPI)、微软的连续语音识别引擎(MCSR)以及微软的语音合成(TTS)引擎等等。目前的5.1版本一共可以支持3种语言的识别 (英语,汉语和日语)以及2种语言的合成(英语和汉语)。SAPI中还包括对于低层控制和高度适应性的直接语音管理、训练向导、事件、语法编译、资源、语音识别(SR)管理以及TTS管理等强大的设计接口。其结构如图(1):
图(1)
语音引擎则通过DDI层(设备驱动接口)和SAPI(SpeechAPI)进行交互,应用程序通过API层和SAPI通信。通过使用这些API,用户可以快速开发在语音识别或语音合成方面应用程序。
SAPI5.1 SDK可以从微软网站下载:http://www.microsoft.com/downloads/details.aspx?FamilyID=5e86ec97-40a7-453f-b0ee-6583171b4530&DisplayLang=en需要安装程序的有Speech SDK 5.1(68M)和5.1 Language Pack (81.5M)。
--------------------------------------------------------------------------------
2. 导入COM对象到.Net
SAPI5.1的基于Windows平台的,通过COM接口进行调用。在.Net平台下要应用SAPI5.1,我们可以利用.Net Framework自带的强大工具TlbImp.exe来把SAPI SDK的COM对象导入到.Net中。TlbImp.exe产生一个管制的包装类,管理客户端可以使用它。包装类管理实际的COM对象的参考数。当包装类当作收集的垃圾时,包装类释放掉它包装的COM对象。当然,你也可以在VS.NET环境中通过从项目参考对话框选择COM对象,实现COM对象的导入,这个过程也是通过TlbImp.exe来完成的。
下面演示如何导入SAPI的COM对象:
D:/Program Files/Common Files/Microsoft Shared/Speech>Tlbimp sapi.dll /out: DotNetSpeech.dll

在安转SDK以后,可以在D:/Program Files/Common Files/Microsoft Shared/Speech/目录下面找到SAPI.dll,这里面定义了SAPI的COM对象,用Tlbimp.exe工具将该dll转换成.net平台下的Assembly---DotNetSpeech.dll,转换的过程会提示不少的警告(warning),但这部影响我们的开发,可以忽略。最后,我们可以用ildasm查看DotnetSpeech.dll里面的对象。
--------------------------------------------------------------------------------
3. 用C#开发中文TTS应用程序示例
下面通过一个实例来介绍如何利用C# 进行开发语音应用程序,开发环境为:
操作系统: Windows 2000 中文版+ SP3
.Net Framework: 1.0.3705(英文版)
Visual Studio.Net 7.0.9466(英文版)
首先,新建一个C#的Windows Application工程SpeechApp,在开发环境的右边的解决方案管理器(Solution Explorer)中,添加DotNetSpeech对象库。右键点击"Reference"(参考),选择"Add Reference"(添加参考),在弹出的文件选择对话框中找到刚才生成的DotNetSpeech.dll。

图(2)
打开Form1.cs代码文件,在代码开头添加名字空间(注意大小写)。
using DotNetSpeech;
这样就实现了SAPI SDK的导入,下面我们就可以开始编写应用代码了。本示例演示如何把文本通过喇叭朗读出来以及把文本转化成语音信号(Wave声音文件),程序界面如图(3):

以下为引用的内容:
//朗读
private void buttonSynthesis_Click(object sender, System.EventArgs e)
{
try
{
SpeechVoiceSpeakFlags SpFlags = SpeechVoiceSpeakFlags.SVSFlagsAsync;
SpVoice Voice = new SpVoice();
Voice.Speak(this.textBoxText.Text, SpFlags);
}
catch(Exception er)
{
MessageBox.Show("An Error Occured!","SpeechApp", MessageBoxButtons.OK, MessageBoxIcon.Error);
}
}
//生成声音文件(Wav)
private void buttonTTStoWave_Click(object sender, System.EventArgs e)
{
try
{
SpeechVoiceSpeakFlags SpFlags = SpeechVoiceSpeakFlags.SVSFlagsAsync;
SpVoice Voice = new SpVoice();
SaveFileDialog sfd = new SaveFileDialog();
sfd.Filter = "All files (*.*)|*.*|wav files (*.wav)|*.wav";
sfd.Title = "Save to a wave file";
sfd.FilterIndex = 2;
sfd.RestoreDirectory = true;
if (sfd.ShowDialog()== DialogResult.OK)
{
SpeechStreamFileMode SpFileMode = SpeechStreamFileMode.SSFMCreateForWrite;
SpFileStream SpFileStream = new SpFileStream();
SpFileStream.Open(sfd.FileName, SpFileMode, false);
Voice.AudioOutputStream = SpFileStream;
Voice.Speak(txtSpeakText.Text, SpFlags);
Voice.WaitUntilDone(Timeout.Infinite);
SpFileStream.Close();
}
}
catch(Exception er)
{
MessageBox.Show("An Error Occured!","SpeechApp", MessageBoxButtons.OK, MessageBoxIcon.Error);
}
}

接下来,还要去控制面板配置Speech SDK引擎当前所处理语言。打开"控制面板",打开"语音"配置项目,可以看到在这里我们可以指定当前可以对何种语言进行识别或者合成,还可以配置相关的硬件设备以及控制语速。(如图4)

在"文字-语音转换"的"语音选择"组合框中选择简体中文(Microsoft Simplified Chinese)。这样就可以合成汉语文字了。
回到VS.Net,F5编译运行刚才的应用程序,在文本框里输入汉字,戴上耳机,点击"朗读"按钮,开始体验新一代的智能人机界面吧,呵呵:)

C#使用微软的TTS引擎发音相关推荐

  1. android的发音功能实现,为Android TTS引擎指定发音的最佳做法?

    一般来说,我对Android的默认文字引擎(即com.svox.pico)印象深刻.正如预期的那样,它误导了一些话(像我一样),因此偶尔需要一些发音指导.所以我想知道最好的做法,用于语音拼写出微软TT ...

  2. Android中使用自带TextToSpeech实现语音合成时Pico TTS引擎不能播放中文怎样解决

    场景 Android中使用自带TextToSpeech实现离线语音合成功能: https://blog.csdn.net/BADAO_LIUMANG_QIZHI/article/details/109 ...

  3. Linux声音解决方案与TTS引擎

    一.ALSA+Pulseaudio在嵌入式Linux中的声音解决方案 Linux音频系统比较复杂,各层间有很多交叉,可能是最无序的子系统,并且它有两套音频驱动框架: OSS (Open Sound S ...

  4. java tts引擎_Android TTS系列二——如何开发一款系统级tts引擎?

    上篇文章Android TTS系列一--如何让app具备tts能力分享了如何通过第三方tts sdk和Android speech包下的接口来拥有tts能力,这次分享下如何开发一款系统级tts引擎.代 ...

  5. android系统tts TextToSpeech源码原理解析及定制tts引擎

    TextToSpeech 即文字转语音服务,是Android系统提供的原生接口服务,原生的tts引擎应用通过检测系统语言,用户可以下载对应语言的资源文件,达到播报指定语音的文字的能力.但是一切都是在g ...

  6. 自制TTS引擎第0.02步-单字拼音化, 从Excel表格用Python提取拼音表

    续上文: 自制TTS引擎第0.01步-Python实现拼接单字wav文件 首先, 利用第三方库获取中文字符对应拼音: from xpinyin import Pinyin ...for 单字 in 文 ...

  7. 微软语音朗读引擎MSSPEECH打造自己的TTS应用

    不废话,直接上代码,例子是读取日语文本进行朗读.LANGUAGE ID可以改成其他语言的. #include "pch.h" #include <Windows.h> ...

  8. C#.NET使用TTS引擎实现文语转换

    [转载] 本文讲述使用微软TTS5.1语音引擎(中文)实现文本阅读和音频输出为WAV完美解决方案. 网上很多文章说的是要安装SAPI.51 SDK,而这个东西有好几十M,并且用起来比较复杂.微软官方网 ...

  9. 微软开源数据处理引擎 Trill,每天可分析万亿次事件

    微软近日开源了数据处理引擎 Trill,它每天能够分析万亿次事件. 项目地址:https://github.com/Microsoft/trill 当下每毫秒处理大量数据正成为一种常见的业务需求,此次 ...

最新文章

  1. 20162325 金立清 S2 W8 C17
  2. linux中各种文件的颜色表示是什么意思?
  3. 买房签定金合同或转让合同之前需要了解到的一些问题
  4. Docker部署微服务详解
  5. php 通知数据库,如何通过php通知我的iPhone应用程序名称已添加到数据库?
  6. 开机自启动脚本_使用xtu降低笔记本(游戏本)cpu电压及功耗·游戏本延时(以及试着解决开机自启动的问题)...
  7. c与指针 从一个字符串中提取子串_python实现找出来一个字符串中最长不重复子串...
  8. Xcode中四种build for 的区别
  9. iOS开发CGRectGetMidX. CGRectGetMidY.CGRectGetMinY. CGRectGetMaxY. CGRectGetMinX. CGRectGetMaxX的使用...
  10. 如何制作出色的R可重现示例
  11. spss软件下载安装
  12. 微弱信号检测(放大电路篇——集成运放)
  13. Java对接海康威视明眸门禁设备
  14. 查看office2016是不是永久激活状态
  15. php x12,小辣椒x12pro是什么处理器,一款专门为老年人服务的手机
  16. 基于bootstrap的富文本框——wangEditor【欢迎增加开发】
  17. 12种文本数据采集方法
  18. mib browser读取飞塔mib文件的oid
  19. 数学通道的应用(十五)-电阻的测量
  20. FBI树——递归练习

热门文章

  1. 一个下载Dropper.Agent.fwm的网站
  2. 微前端wujie的使用与nginx部署整理
  3. TCP_IP详解学习笔记
  4. python 去掉中文或英文
  5. 整数在计算机中的编码
  6. 世炬网络受邀参加2022高通创投CEO峰会
  7. Seate 1.4.2运行seata-server.bat数据库连接失败解决方案
  8. [移动GIS] 7-移动可视化|高德地图
  9. Radix-4加法器的性能分析——论文解析
  10. Leetcode 69 Sqrt(x)