语音识别系统历史

国外研究:

从开始研究语音识别技术至今,语音识别技术的发展已经有半个多世纪的历史。语音识别技术研究的开端,是Davis等人研究的Audry系统,它是当时第一个可以获取几个英文字母的系统。到了20世纪60年代,伴随计算机技术的发展,语音识别技术也得以进步,动态规划和线性预测分析技术解决了语音识别中最为重要的问题——语音信号产生的模型问题;70年代,语音识别技术有了重大突破,动态时间规整技术(DTW)基本成熟,使语音变得可以等长,另外,矢量量化(VQ)和隐马尔科夫模型理论(HMM)也不断完善,为之后语音识别的发展做了铺垫;80年代对语音识别的研究更为彻底,各种语音识别算法被提出,其中的突出成就包括HMM模型人工神经网络(ANN);进入90年代后,语音识别技术开始应用于全球市场,许多著名科技互联网公司, 如IBM,Apple等,都为语音识别技术的开发和研究投入巨资;到了 21 世纪,语音识别技术研究重点转变为即兴口语和自然对话以及多种语种的同声翻译。

国内研究:

国内关于语音识别技术的研究与探索从20 世纪80 年代开始,取得了许多成果并且发展飞速。例如:清华大学研发的语音识别技术以1183 个单音节作为识别基元,并对其音节进行分解,最后进行识别,使三字词和四字词的准确率高达98%;中科院采用连续密度的HMM,整个系统的识别率达到89.5%,声调和词语的识别率分别是 99.5%和95%。目 前,我国的语音识别技术已经和国际上的超级大国实力相当, 其综合错误率可控制在10%以内。

清华大学电子工程系语音技术与专用芯片设计课题组,研发的非特定人汉语数码串连续语音识别系统的识别精度,达到94.8%(不定长数字串)和96.8%(定长数字串)。在有5%的拒识率情况下,系统识别率可以达到96.9%(不定长数字串)和98.7%(定长数字串),这是目前国际最好的识别结果之一,其性能已经接近实用水平。研发的5000词邮包校核非特定人连续语音识别系统的识别率达到98.73%,前三选识别率达99.96%;并且可以识别普通话与四川话两种语言,达到实用要求。

中科院自动化所及其所属模式科技(Pattek)公司2002年发布了他们共同推出的面向不同计算平台和应用的“天语”中文语音系列产品——PattekASR,结束了中文语音识别产品自1998年以来一直由国外公司垄断的历史。

语音识别系统前景趋势

在新兴产业市场需求的推动下,语音识别的市场也是十分具有看头的,有研究机构指出,预计到2020年,全球语音识别的市场规模将从2015年的61.9亿美元增长到200亿美元。然而,在市场规模壮大这一美好的预测面前,我们也不能忽视一些需要面对的问题,只有解决了它们,语音识别才能得到完善,给用户带来极致服务。

首先就是对象识别的准确性。现在,在应用上,我们看见语音识别多是在智能家居领域,包括智能家电和服务机器人。此时,我们就要考虑一个问题了,当多个家庭成员同时讲话时,智能家电和服务机器人该执行谁的命令呢?它们又如何能在众声音中找出自己主人的命令?这些都是当前语音识别所需要解决的问题,毕竟我们通常所说的语音识别不仅仅只是单纯的对语音内容进行识别。

在这个问题上,人们也找到了一个解决方案——声纹识别。一般来讲,声纹具有唯一性,对说话人身份的确认有着极大的帮助。借助于声纹识别,语音识别能够准确对说话人的位置和身份进行定位,从而准确识别语音内容,执行其中下达的指令。不过,鉴于数据的极大空缺等问题,声纹识别技术还需完善。

其次是降低周边环境的干扰。对于人类来讲,在嘈杂环境中听别人说话或是从众多声音中找出自己想听的内容还是一件较为简单的事,而与此相反,这件事在机器这里并没有那么容易。

为了降低周边环境对语音识别的干扰,亚马逊和谷歌都在智能音箱中使用了麦克风阵列技术,从而起到一定的“降噪”作用,增加语音识别的准确率。不过,到目前为止,环境的干扰依然没有得到更好的解决,仍然是语音识别前进道路中的一只“拦路虎”,尤其是在多段语音中准确找出指定说话人的情境中。

在一次采访中,和机器学习权威学者、百度首席科学家吴恩达表示,2017年是“对话式电脑”快速发展的一年。对话式电脑,诸如聊天机器人、人工智能虚拟助手之类,作为展开对话的第一步,语音识别也属于这快速发展的一部分。

在、等多种产业以及聊天机器人、虚拟助手这些产品市场的推动下,语音识别的市场正在不断扩大,同时也是对它准确性的一个挑战。

语音识别系统市场前景及发展趋势相关推荐

  1. QYResearch回顾:2017年中国汽车语音识别系统产量为1413万

    本文为QYResearch分析师整理首发,若转载请写明来源 发布者:QYR 发布日期:2018年9月26日 汽车语音识别系统是安装在汽车上以满足现代车辆消费者在车内工作.休息.娱乐以及行车安全等方面的 ...

  2. 语音识别系统报告_2018-2024年中国语音识别系统行业市场发展格局及投资价值评估研究报告_中国产业信息网...

    报告目录: 章语音识别系统行业相关概述 第一节语音识别系统行业相关概述 一.产品概述 二.产品特点 三.产品分类 四.产品用途 第二节语音软件行业经营特征 第三节语音识别系统行业经营模式分析 第二章语 ...

  3. 语音识别系统wav2letter++简介

    语音识别系统是深度学习生态中发展最成熟的领域之一.当前这一代的语音识别模型基本都是基于递归神经网络(Recurrent Neural Network)对声学和语言模型进行建模,以及用于知识构建的计算密 ...

  4. 脸书开源第一个使用卷积神经网络技术的端到端语音识别系统

    https://www.toutiao.com/a6639449370913669635/ 2018-12-27 07:34:30 脸书发布全新自动语音识别的卷积方法 ,以及开源目前最先进的端到端语音 ...

  5. 语音识别系统及科大讯飞最新实践

    http://geek.csdn.net/news/detail/96948 语音作为最自然便捷的交流方式,一直是人机通信和交互最重要的研究领域之一.自动语音识别(Automatic Speech R ...

  6. 基于深度学习的中文语音识别系统框架(pluse)

    目录 声学模型 GRU-CTC DFCNN DFSMN 语言模型 n-gram CBHG 数据集 本文搭建一个完整的中文语音识别系统,包括声学模型和语言模型,能够将输入的音频信号识别为汉字. 声学模型 ...

  7. 错误率_研究发现,商业语音识别系统存在高错误率

    雷锋网讯,"某些语音识别系统(ASR)的准确性可能要比之前假定的差很多."这是最近约翰·霍普金斯大学.波兰波兹南工业大学.弗罗茨瓦夫科技大学以及初创公司Avaya的研究人员一项正在 ...

  8. PocketSphinx语音识别系统的编程

    PocketSphinx语音识别系统的编程 zouxy09@qq.com http://blog.csdn.net/zouxy09 关于语音识别的基础知识和sphinx的知识,具体可以参考我的另外的博 ...

  9. PocketSphinx语音识别系统声学模型的训练与使用

    PocketSphinx语音识别系统声学模型的训练与使用 zouxy09@qq.com http://blog.csdn.net/zouxy09 声学模型主要用于计算语音特征和每个发音模板之间的似然度 ...

最新文章

  1. github上的图片当网络图片使用
  2. PKUWC 2018游记
  3. mysql php 增删数据,php学习之mysql数据的增删改查
  4. OkHttp3中的HTTP/2首部压缩
  5. AgileEAS.NET 4.0重构裁剪,新的ORM、支持Linq,正式支持WPF,开放更多的接口
  6. 100内奇数之和流程图_JavaScript基础教程(六)流程控制之循环语句
  7. 第12章[12.7] Ext JS实现带动态数字的图标
  8. 图解前端之正则表达式
  9. python入门之正则表达式
  10. spoon mysql教程_kettle 教程(一):简介及入门
  11. 【AI视野·今日CV 计算机视觉论文速览 第224期】Tue, 22 Jun 2021
  12. 使用APP inventor制作蓝牙串口助手【智能浇灌模型中用到】
  13. ubuntu中录制gif
  14. java 0点时间_java 获取当前时间与零点的时间差
  15. 【JavaScript】 一万字 JavaScript 笔记(详细讲解 + 代码演示 + 图解)
  16. es6 混合commjs_嵌入式JavaScript引擎 – mjs
  17. 发布轻开平台移动App服务器
  18. 免安装版mysql使用_免安装版MySql使用
  19. matlab simulink 数学符号,MATLAB符号数学
  20. win11修改C盘用户文件夹名称

热门文章

  1. python学习笔记 -- map() 操作可迭代序列
  2. 7 - Struts.xml各属性说明(待补充)
  3. [Offer收割]编程练习赛12 题目1 : 歌德巴赫猜想
  4. jsp电子商务 购物车实现之一 设计篇
  5. android 选择多选图片
  6. Bailian4107 19岁生日礼物-Birthday Gift【进制】
  7. JSK-16016 单词排序【排序】
  8. CodeForces-1A Theatre Square【水题】
  9. Eclipse 工程配置与目录结构及各种文件夹(常用插件)
  10. 性能优化—— 代码优化