语音识别(SR)功能是当今国外操作系统的标准特征,而国产操作系统根本不具备这样的特质,并且国家队没有相关的主观动力。去开发实际可用的语音识别系统。与国外相比,国产操作系统落后了一大节子,怪谁?

如何让机器识别人的语音?事实上大道理并不复杂。首先,让机器设备听懂元音,然后听懂辅音。将两者合成起来成为单词,再做进一步的处理。可是。实际做起来就复杂了。

怎么做?

建立“语料库”(Corpus),就是建立语音的声学模型库。比方。”猫“这个单词的发音,必须让机器记住“猫”的发音,设法让机器听到“猫”所相应的“声音”(所谓”生物信号“)就知道主人对它说的是“猫”。语料库就是建立单词与语音的相应关系。这是基本建设,须要投入大量的人力、物力。别无他法。

不论什么语音都有个人特征,尽管100个人的发音基本同样,可是,存在一定的差异。

所以机器的听觉总是存在“错误率”,这是必定的。减少机器识别错误率是必要的。这是一个基本认识,对机器不能要求过高。机器耳朵永远比只是人耳。

微软、谷歌、百度语音识别巨头都拥有各自的数万小时的语料库,可是,我们却没有,Linux社区也没有GPL可用的语料库(VoxForge不带我们玩)。

怎么办?天上不会自己主动掉馅饼。

要知道。私有公司建立自己的版权大型语料库总是要付出巨大的投入成本。而我们有人喜欢天上掉馅饼。整天坐在院子里面张着大嘴巴对着蓝天等着天上掉下馅饼来。

袁萌 7月14日

语音识别(SR)的秘密相关推荐

  1. 语音识别的两个方法_语音识别的应用有哪些

    语音识别的两个方法 通过微软的SAPI,不仅仅可以实现语音合成TTS,同样可以实现语音识别SR.下面我们就介绍并贴出相关代码.主要有两种方式: 1.使用COM组件技术,不管是C++,C#,Delphi ...

  2. 如何再发行 SAPI 5.1 核心组件

    基于语音应用程序设计接口 (SAPI) 5.1 版开发的应用程序要求您在客户端计算机上安装 SAPI 5.1 核心组件. 您可以将 SAPI 5.1 核心组件作为 Microsoft Windows ...

  3. 微软TTS语音引擎编程入门

    我们都使用过一些某某词霸的英语学习工具软件,它们大多都有朗读的功能,其实这就是利用的Windows的TTS(Text To Speech)语音引擎.它包含在Windows Speech SDK开发包中 ...

  4. TTS实现文字语音朗读

    一. TTS概述 随着语音技术的发展,微软也推出了相应的语音开发工具,即Microsoft Speech SDK,这个SDK中包含了语音应用设计接口(SAPI).微软的连续语音识别引擎(MCSR)以及 ...

  5. C++实现TTS文字语音朗读Microsoft Speech SDK

    转自http://www.zhimax.com/article/vc/ttsvoice.html 一. TTS概述 随着语音技术的发展,微软也推出了相应的语音开发工具,即Microsoft Speec ...

  6. python tts 保存wav_C#文本转语音并保存wav和MP3文件

    回顾上次写博客至今都有4个多月了,最近工作比较的忙没时间写博文.以后会多坚持写博文,与大家分享下最近遇到的问题.最近因为项目需要,研究了下用C#开发TTS.下面把大体的思路给大家说说,希望对大家有所帮 ...

  7. 什么是机器学习?从3个视角谈起:学习任务、学习范式、学习模型

    Three Perspectives of Machine Learning 机器学习的三个视角 Perspectives Description 描述 典型 Learning Tasks 学习任务 ...

  8. App安全登录之密码、通讯加密方法(MD5,Base64,RSA,AES)

    今天研究了一下关于登录密码加密的问题,下面来说说实现. 一.RSA非对称加密: 具体流程如下:截取自http://blog.csdn.net/m372897500/article/details/50 ...

  9. 【VC++技术杂谈004】使用微软TTS语音引擎实现文本朗读

    本文主要介绍如何使用微软TTS语音引擎实现文本朗读,以及生成wav格式的声音文件. 1.语音引擎及语音库的安装 TTS(Text-To-Speech)是指文本语音的简称,即通过TTS引擎把文本转化为语 ...

  10. C#使用微软的TTS引擎发音

    随着.net技术深入人心,越来越多的程序员开始转到.net平台上进行开发.然而,在新发布的.net speech SDK里面并没有对中文语音进行支持,目前支持中文的Speech SDK最高版本为Win ...

最新文章

  1. 【C++】Google C++编码规范(四):其他C++
  2. 虚拟化技术原理与实现 pdf_多进程的实现原理-多道技术
  3. Java中ListE对象赋值问题(引用传递和值传递)
  4. JSON 转javabean 利器
  5. Hadoop实战-中高级部分 之 Hadoop 集群安装
  6. javafx 浏览器_浏览器中的JavaFX
  7. c++ 三次多项式拟合_线性回归进阶版,多项式线性回归讲解与实现(附完整代码)...
  8. 当 Egg 遇到 TypeScript,收获茶叶蛋一枚 #27
  9. 用栈实现队列,实现Enqueue和Dequeue方法
  10. 《MongoDB实战系列》系列文章导读
  11. matlab 课程设计心得与总结,(最新整理)课程设计心得体会
  12. python爬取qq音乐歌词风变编程_爬取QQ音乐歌词
  13. Python pandas.pivot_table学习笔记1
  14. c语言计算存储大小,在C语言中5种基本数据类型的存储空间长度的排列顺序
  15. 自动驾驶感知——环境感知的基本概念
  16. android 自定义拍照模糊,Android自定义相机拍照模糊处理
  17. Java回调函数理解和应用
  18. 推荐几个 Windows 小工具
  19. Oracle DG日常运维命令大全
  20. 怎么查看卫星地图的更新日期?

热门文章

  1. 1998考研阅读Text3翻译
  2. 计算机等级考试四级网络工程师真题,计算机等级考试四级网络工程师练习题
  3. 希捷磁盘文件出现故障该如何恢复?
  4. PHP代码审计系列(一) 基础:方法、思路、流程
  5. 单片机编程自己编写的一个很简单的传感器控制代码
  6. 二叉树的高度和深度定义、回溯(个人学习记录)
  7. DS树--二叉树高度
  8. 某溯源平台:vue生成二维码压缩包下载(二)
  9. 格林威治时间转换成北京时间,Mon May 10 2021 15:34:42 GMT+0800 (中国标准时间) TO 2021/5/10
  10. 中国精细化工行业发展模式与十四五投资战略规划研究报告2022-2028年