什么是语音识别技术

语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术,也就是让机器听懂人类的语音。

也就是说,如果电脑配置有“语音辨识”的程序组,那么当你的声音通过一个转换装置输入电脑内部、并以数位方式储存后,语音辨识程序便开始以你输入的声音样本与事先储存好的声音样本进行对比工作。声音对比工作完成之后,电脑就会输入一个它认为最“象”的声音样本序号,就可以知道你刚才念的声音是什么意义,进而执行此命令。说起来简单,但要真正建立辨识率高的语音辨识程序组,却是非常困难而专业的,世界各地的学者们也还在努力研究最好的方式。专家学者们研究出许多破解这个问题的方法,如傅立叶转换、倒频谱参数等,使目前的语音辨识系统已达到一个可接受的程度,并且辨识度愈来愈高。

计算机语音识别过程与人对语音识别处理过程基本上是一致的。目前主流的语音识别技术是基于统计模式识别的基本理论。一个完整的语音识别系统可大致分为三部分:

(1)语音特征提取:目的是从语音波形中提取随时间变化的语音特征序列。

(2)声学模型与模式匹配(识别算法):声学模型是识别系统的底层模型,并且是语音识别系统中最关键的一部分。声学模型通常由获取的语音特征通过训练产生,目的是为每个发音建立发音模板。在识别时将未知的语音特征同声学模型(模式)进行匹配与比较,计算未知语音的特征矢量序列和每个发音模板之间的距离。声学模型的设计和语言发音特点密切相关。声学模型单元大小(字发音模型、半音节模型或音素模型)对语音训练数据量大小、系统识别率,以及灵活性有较大影响。

(3)语义理解:计算机对识别结果进行语法、语义分析。明白语言的意义以便做出相应的反应。通常是通过语言模型来实现。

所谓“语音识别”,就是利用电子计算机等机械装置来识别人讲话的意义和内容。20世纪50代,就有人提出“口授打印机”的设恕。可以说,这是有关语音识别技术最早构想。

语音识别技术经历了语音识别、语音合成以及自然语音合成3个阶段。从原理上讲,似乎让计算机识别人的语言并不难,其实困难还是不少的。例如,不同的人读同一个词所发出的音在声学特征上却不完全相同;即便是同一个人,右不同情况下对同一个字的发音也不相同。加上人们讲话时常有不合语法规律的情况,有时还夹杂些俗语,或省略一些词语,而且语速变化不定。所有这些,在我们听别人讲话时似乎都不成为问题,但让机器理解则很是困难。近年来,由于计算机功能的日益强大,存储技术、语音算法技术和信号处理技术的长足进步,以及软件编程水平的提高,语音识别技术已经取得突破性的进展,使它的广泛应用成为可能。

语音识别技术的应用主要有以下两个方面。一是用于人机交流。目前这方面应用的呼声很高,因为使用键盘、鼠标与电子计算机进行交流的这种方式,使许多非专业人员,特别是不懂英语或不熟悉汉语拼音的人被拒之于门外,影响到电子计算机的进一步普及。语音识别技术的采用,改变了人与计算机的互动模式,人们只需动动口,就能打开或关闭程序,改变工作界面。这种使电脑人性化的结果是使人的双手得到解放,使每个人都能操作和应用计算机。电话仍是目前使用最为普遍的通信工具,通过电话与语音识别系统的协同工作,可以实现语音拨号、电话购物以及通过电话办理银行业务、炒股、上网检索信息或处理电子件等。不久,能按主人口令接通电话、打开收音机,以及通过声纹识别来者身份的安全系统也将获得应用。

语音识别技术的另一方面应用便是语音输入和合成语音输出。现在,已经出现能将口述的文稿输入计算机并按指定格式编排的语音软件,它比通过键盘输入在速度上要提高2~4倍。装有语音软件的电脑还能通过语音合成把计算机里的文件用各种语言“读”出来,这将大大推进远程通信和网络电话的发展。

在现阶段,语音技术主要用于电子商务、客户服务和教育培训等领域,它对于节省人力、时间,提高工作效率将起到明显的作用。能实现自动翻译的语音识别系统目前也正在研究、完善之中。

语音识别是一门交叉学科。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。人们预计,未来 10 年内,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域

语音识别技术是什么 语音识别技术应用介绍【图文】相关推荐

  1. 语音识别技术是什么 语音识别基本方法介绍【图文】

    语音识别技术,语音识别技术是什么意思 语音识别技术,也被称为自动语音识别Automatic Speech Recognition,(ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例 ...

  2. AI产品经理需了解的技术知识:语音识别技术(2)

    AI产品经理需了解的技术知识:语音识别技术(2) https://blog.csdn.net/zhangbijun1230/article/details/81232256 本文章主要介绍了语音识别技 ...

  3. 深度学习笔记 | 第16讲:语音识别——一份简短的技术综述

    原标题:深度学习笔记 | 第16讲:语音识别--一份简短的技术综述 大家好!又到了每周一狗熊会的深度学习时间了.在上一讲中,小编给大家介绍了经典的 seq2seq,以及著名的注意力模型,并且小编在这些 ...

  4. 语音识别深度神经网络,深度神经网络技术

    深度神经网络为什么能大幅度提高语音识别的准确率吗? 微软介绍,这种新型语音识别软件采用了名为"深度神经网络"的技术,使得该软件处理人类语音的过程与人脑相似. 对此微软必应Bing) ...

  5. 【飞桨PaddleSpeech语音技术课程】— 语音识别-Deepspeech2

    (以下内容搬运自飞桨PaddleSpeech语音技术课程,点击链接可直接运行源码) 语音识别--DeepSpeech2 0. 视频理解与字幕 # 下载demo视频 !test -f work/sour ...

  6. 语音识别中代价函数_语音识别技术简述(概念-原理)

    目录 语音识别技术简述(概念->原理) 语音识别概念 语音识别原理 语音识别技术简介 1.动态时间规整(DTW) 2.支持向量机(SVM) 3.矢量量化(VQ) 4.隐马尔科夫模型(HMM) 5 ...

  7. 语音识别——一份简短的技术综述

    转自:https://zhuanlan.zhihu.com/p/53264756 大家好!又到了每周一狗熊会的深度学习时间了.在上一讲中,小编给大家介绍了经典的 seq2seq,以及著名的注意力模型, ...

  8. AI产品经理需了解的技术知识:语音识别技术(1)

    AI产品经理需了解的技术知识:语音识别技术(1) https://blog.csdn.net/zhangbijun1230/article/details/81231921 一.语音识别的发展 20世 ...

  9. 讯飞输入法将深度神经网络DNN技术应用于语音识别达到业界领先水平

    10月20日,以"语见更好的我们"为主题的"讯飞输入法10周年 A.I.输入沙龙"在北京举办.记者从活动现场了解到,自2010年10月上线至今,讯飞输入法的日语 ...

最新文章

  1. error C2065: “M_PI”: 未声明的标识符
  2. 个人知识体系思维导图_高中数学知识点思维导图
  3. python变量如何声明_如何确定变量是否在Python中声明?
  4. linux centos7 安装使用 惠普 hp 打印机
  5. LAMP介绍,Apache安装细节过程
  6. 这又何止呢的openeim002
  7. 第四次博客作业:bookstore缺陷报告
  8. leetcode刷题:最大子序积
  9. 【图像算法】七种常见阈值分割代码(Otsu、最大熵、迭代法、自适应阀值、手动、迭代法、基本全局阈值法)...
  10. Shell脚本编程之(五)条件判断式
  11. SQL Agent服务无法启动如何破
  12. 4.微服务:从设计到部署 --- 服务发现
  13. 手机怎么投屏到电脑?小技能分享
  14. word去掉多余空格,换行符
  15. Mac电脑优点是什么,缺点是什么?
  16. 第九届河南省程序设计大赛 1273-宣传墙(java)
  17. 系统集成项目管理工程师笔记_备考常见英文词汇汇总
  18. 一切皆socket!网络编程:三次握手 四次握手 与socket函数的关系
  19. 阿里云上各种Rpm包下载地址
  20. 【观点】“马云:金融是要为外行人服务,这个观点其实并不新鲜

热门文章

  1. element ui里dialog关闭后清除验证条件
  2. hdu 6015 Gameia(树上博弈)
  3. python全栈 操作系统
  4. JS实现文字截取(雾)
  5. PHP开发者最好的学习资源收集
  6. Sharpmap AjaxMapControl 分析
  7. UVA10191 Longest Nap【排序】
  8. UVA11310 Delivery Debacle【铺砖问题】
  9. HDU4510 小Q系列故事——为什么时光不能倒流【时间计算】
  10. Bailian2940 求和【进制+迭代】