科学网—语音识别技术发展史

语音识别技术发展史

与机器进行语音交流，让它听明白你在说什么。语音识别技术将人类这一曾经的梦想变成了现实。语音识别就好比“机器的听觉系统”，该技术让机器通过识别和理解，把语音信号转变为相应的文本或命令。

在1952年的贝尔研究所，Davis等人研制了世界上第一个能识别10个英文数字发音的实验系统。1960年英国的Denes等人研制了第一个计算机语音识别系统。

大规模的语音识别研究始于上世纪70年代以后，并在小词汇量、孤立词的识别方面取得了实质性的进展。上世纪80年代以后，语音识别研究的重点逐渐转向大词汇量、非特定人连续语音识别。

同时，语音识别在研究思路上也发生了重大变化，由传统的基于标准模板匹配的技术思路开始转向基于统计模型的技术思路。此外，业内有专家再次提出了将神经网络技术引入语音识别问题的技术思路。

上世纪90年代以后，在语音识别的系统框架方面并没有什么重大突破。但是，在语音识别技术的应用及产品化方面出现了很大的进展。比如，DARPA是在上世界70年代由美国国防部远景研究计划局资助的一项计划，旨在支持语言理解系统的研究开发工作。进入上世纪90年代， DARPA计划仍在持续进行中，其研究重点已转向识别装置中的自然语言处理部分，识别任务设定为“航空旅行信息检索”。

我国的语音识别研究起始于1958年，由中国科学院声学所利用电子管电路识别10个元音。由于当时条件的限制，中国的语音识别研究工作一直处于缓慢发展的阶段。直至1973年，中国科学院声学所开始了计算机语音识别。

进入上世纪80年代以来，随着计算机应用技术在我国逐渐普及和应用以及数字信号技术的进一步发展，国内许多单位具备了研究语音技术的基本条件。与此同时，国际上语音识别技术在经过了多年的沉寂之后重又成为研究的热点。在这种形式下，国内许多单位纷纷投入到这项研究工作中去。

1986年，语音识别作为智能计算机系统研究的一个重要组成部分而被专门列为研究课题。在“863”计划的支持下，中国开始组织语音识别技术的研究，并决定了每隔两年召开一次语音识别的专题会议。自此，我国语音识别技术进入了一个新的发展阶段。

自2009年以来，借助机器学习领域深度学习研究的发展以及大数据语料的积累，语音识别技术得到突飞猛进的发展。

将机器学习领域深度学习研究引入到语音识别声学模型训练，使用带RBM预训练的多层神经网络，提高了声学模型的准确率。在此方面，微软公司的研究人员率先取得了突破性进展，他们使用深层神经网络模型（DNN）后，语音识别错误率降低了30%，是近20年来语音识别技术方面最快的进步。

2009年前后，大多主流的语音识别解码器已经采用基于有限状态机（WFST）的解码网络，该解码网络可以把语言模型、词典和声学共享音字集统一集成为一个大的解码网络，提高了解码的速度，为语音识别的实时应用提供了基础。

随着互联网的快速发展，以及手机等移动终端的普及应用，可以从多个渠道获取大量文本或语音方面的语料，这为语音识别中的语言模型和声学模型的训练提供了丰富的资源，使得构建通用大规模语言模型和声学模型成为可能。

在语音识别中，训练数据的匹配和丰富性是推动系统性能提升的最重要因素之一，但是语料的标注和分析需要长期的积累和沉淀，随着大数据时代的来临，大规模语料资源的积累将提到战略高度。

现如今，语音识别在移动终端上的应用最为火热，语音对话机器人、语音助手、互动工具等层出不穷，许多互联网公司纷纷投入人力、物力和财力展开此方面的研究和应用，目的是通过语音交互的新颖和便利模式迅速占领客户群。（雨田整理）

科学网—语音识别技术发展史相关推荐

淘宝网的技术发展史（三）——分布式时代
本文是<淘宝网的技术发展史>系列连载文的第三篇.在系统发展的过程中,架构师的眼光至关重要,作为程序员,把功能实现即可:但作为架构师,要考虑系统的扩展性.复用性,这种敏锐的感觉,有人说是一种 ...
淘宝网的技术发展史（二） ——Oracle替换MySQL
本文是<淘宝网的技术发展史>系列连载文的第二篇,在告别个人网站时代后,淘宝网的技术发展迎来了由Oracle开启的第二个时代. 文/淘宝技术大学培训专家子柳 MySQL撑不住了淘宝网作为 ...
淘宝网的技术发展史（一）——个人网站时代
<天下网商·经理人>十月刊开始将连载系列文章<淘宝网的技术发展史>,为读者描述淘宝网在整个发展过程中,所有的主动和被动的技术变革的前因后果. 文/淘宝技术大学培训专家子柳前 ...
语音识别技术发展史与行业最佳实践全解析
原标题:语音识别技术发展史与行业最佳实践全解析在人工智能技术的探索征程里,语音语义识别技术一直扮演着先驱的角色,不管是在技术探索还是商业落地方面都走在了前面.近两年来随着深度学习技术的进一步深入,其 ...
淘宝网的技术发展史（三）――分布式时代
本文是<淘宝网的技术发展史>系列连载文的第三篇.在系统发展的过程中,架构师的眼光至关重要,作为程序员,把功能实现即可:但作为架构师,要考虑系统的扩展性.复用性,这种敏锐的感觉,有人说是一种 ...
人工智能—语音识别技术发展史
语音识别技术:也被称为自动语音识别Automatic Speech Recognition,(ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键.二进制编码或者字符序列.所涉及 ...
通过语音发展史及语音识别产品对比，来看看语音识别技术都有哪些难点-通信/网络-与非网...
与机器进行语音交流,让它听明白你在说什么.语音识别技术将人类这一曾经的梦想变成了现实.语音识别就好比"机器的听觉系统",该技术让机器通过识别和理解,把语音信号转变为相应的文本或命令 ...
科学网—中文普通话语音识别DEMO，LilyMandarinSpeechRecognition V1.0 - 石自强的博文...
DEMO简介: 这是一个中文普通话语音识别的最简单DEMO,LilyMandarinSpeechRecognition V1.0. 首先给出这款软件的下载链接: 或者 http://vdisk.wei ...
计算机科学与技术专业机遇与挑战,科学网—填报专业大类志愿：机遇与挑战 - 雒运强的博文...
2020年的高考结束了,不久就要出分,接着考生就要选择大学和专业了.可是,有一些大学说按专业大类招生,究竟什么是专业大类.这样招生好不好呢? 专业大类有很多,如中国语言文学.历史学.考古学.戏剧影视文 ...

科学网—语音识别技术发展史

科学网—语音识别技术发展史相关推荐

最新文章

热门文章