语音识别(SR)的秘密
语音识别(SR)功能是当今国外操作系统的标准特征,而国产操作系统根本不具备这样的特质,并且国家队没有相关的主观动力。去开发实际可用的语音识别系统。与国外相比,国产操作系统落后了一大节子,怪谁?
如何让机器识别人的语音?事实上大道理并不复杂。首先,让机器设备听懂元音,然后听懂辅音。将两者合成起来成为单词,再做进一步的处理。可是。实际做起来就复杂了。
怎么做?
建立“语料库”(Corpus),就是建立语音的声学模型库。比方。”猫“这个单词的发音,必须让机器记住“猫”的发音,设法让机器听到“猫”所相应的“声音”(所谓”生物信号“)就知道主人对它说的是“猫”。语料库就是建立单词与语音的相应关系。这是基本建设,须要投入大量的人力、物力。别无他法。
不论什么语音都有个人特征,尽管100个人的发音基本同样,可是,存在一定的差异。
所以机器的听觉总是存在“错误率”,这是必定的。减少机器识别错误率是必要的。这是一个基本认识,对机器不能要求过高。机器耳朵永远比只是人耳。
微软、谷歌、百度语音识别巨头都拥有各自的数万小时的语料库,可是,我们却没有,Linux社区也没有GPL可用的语料库(VoxForge不带我们玩)。
怎么办?天上不会自己主动掉馅饼。
要知道。私有公司建立自己的版权大型语料库总是要付出巨大的投入成本。而我们有人喜欢天上掉馅饼。整天坐在院子里面张着大嘴巴对着蓝天等着天上掉下馅饼来。
袁萌 7月14日
语音识别(SR)的秘密相关推荐
- 语音识别的两个方法_语音识别的应用有哪些
语音识别的两个方法 通过微软的SAPI,不仅仅可以实现语音合成TTS,同样可以实现语音识别SR.下面我们就介绍并贴出相关代码.主要有两种方式: 1.使用COM组件技术,不管是C++,C#,Delphi ...
- 如何再发行 SAPI 5.1 核心组件
基于语音应用程序设计接口 (SAPI) 5.1 版开发的应用程序要求您在客户端计算机上安装 SAPI 5.1 核心组件. 您可以将 SAPI 5.1 核心组件作为 Microsoft Windows ...
- 微软TTS语音引擎编程入门
我们都使用过一些某某词霸的英语学习工具软件,它们大多都有朗读的功能,其实这就是利用的Windows的TTS(Text To Speech)语音引擎.它包含在Windows Speech SDK开发包中 ...
- TTS实现文字语音朗读
一. TTS概述 随着语音技术的发展,微软也推出了相应的语音开发工具,即Microsoft Speech SDK,这个SDK中包含了语音应用设计接口(SAPI).微软的连续语音识别引擎(MCSR)以及 ...
- C++实现TTS文字语音朗读Microsoft Speech SDK
转自http://www.zhimax.com/article/vc/ttsvoice.html 一. TTS概述 随着语音技术的发展,微软也推出了相应的语音开发工具,即Microsoft Speec ...
- python tts 保存wav_C#文本转语音并保存wav和MP3文件
回顾上次写博客至今都有4个多月了,最近工作比较的忙没时间写博文.以后会多坚持写博文,与大家分享下最近遇到的问题.最近因为项目需要,研究了下用C#开发TTS.下面把大体的思路给大家说说,希望对大家有所帮 ...
- 什么是机器学习?从3个视角谈起:学习任务、学习范式、学习模型
Three Perspectives of Machine Learning 机器学习的三个视角 Perspectives Description 描述 典型 Learning Tasks 学习任务 ...
- App安全登录之密码、通讯加密方法(MD5,Base64,RSA,AES)
今天研究了一下关于登录密码加密的问题,下面来说说实现. 一.RSA非对称加密: 具体流程如下:截取自http://blog.csdn.net/m372897500/article/details/50 ...
- 【VC++技术杂谈004】使用微软TTS语音引擎实现文本朗读
本文主要介绍如何使用微软TTS语音引擎实现文本朗读,以及生成wav格式的声音文件. 1.语音引擎及语音库的安装 TTS(Text-To-Speech)是指文本语音的简称,即通过TTS引擎把文本转化为语 ...
- C#使用微软的TTS引擎发音
随着.net技术深入人心,越来越多的程序员开始转到.net平台上进行开发.然而,在新发布的.net speech SDK里面并没有对中文语音进行支持,目前支持中文的Speech SDK最高版本为Win ...
最新文章
- 【C++】Google C++编码规范(四):其他C++
- 虚拟化技术原理与实现 pdf_多进程的实现原理-多道技术
- Java中ListE对象赋值问题(引用传递和值传递)
- JSON 转javabean 利器
- Hadoop实战-中高级部分 之 Hadoop 集群安装
- javafx 浏览器_浏览器中的JavaFX
- c++ 三次多项式拟合_线性回归进阶版,多项式线性回归讲解与实现(附完整代码)...
- 当 Egg 遇到 TypeScript,收获茶叶蛋一枚 #27
- 用栈实现队列,实现Enqueue和Dequeue方法
- 《MongoDB实战系列》系列文章导读
- matlab 课程设计心得与总结,(最新整理)课程设计心得体会
- python爬取qq音乐歌词风变编程_爬取QQ音乐歌词
- Python pandas.pivot_table学习笔记1
- c语言计算存储大小,在C语言中5种基本数据类型的存储空间长度的排列顺序
- 自动驾驶感知——环境感知的基本概念
- android 自定义拍照模糊,Android自定义相机拍照模糊处理
- Java回调函数理解和应用
- 推荐几个 Windows 小工具
- Oracle DG日常运维命令大全
- 怎么查看卫星地图的更新日期?
热门文章
- 1998考研阅读Text3翻译
- 计算机等级考试四级网络工程师真题,计算机等级考试四级网络工程师练习题
- 希捷磁盘文件出现故障该如何恢复?
- PHP代码审计系列(一) 基础:方法、思路、流程
- 单片机编程自己编写的一个很简单的传感器控制代码
- 二叉树的高度和深度定义、回溯(个人学习记录)
- DS树--二叉树高度
- 某溯源平台:vue生成二维码压缩包下载(二)
- 格林威治时间转换成北京时间,Mon May 10 2021 15:34:42 GMT+0800 (中国标准时间) TO 2021/5/10
- 中国精细化工行业发展模式与十四五投资战略规划研究报告2022-2028年