1. 语音识别系统框架

1.1 语音识别系统的基本内容

  • 语音特征特区
  • 声学模型
  • 语言模型

语音识别系统的框架如图所示,首先语音信号经过特征提取转换成数字语音信号,然后结合声学模型和语言模型对数字信号进行解码,最后完成语音的识别。

2 语音特征提取

2.1 音频信号提取

  • 在任意一个语音识别系统中,第一步就是提取特征。换句话说,我们需要把音频信号中具有辨识性的成分提取出来。
  • 语音通常是指人说话的声音。从生物学的角度来看,是气流通过声带、咽喉、口腔、鼻腔等发出声音;从信号的角度来看,不同位置的震动频率不一样,最后的信号是由基频和一些谐波构成。

2.3 声谱图

  • 语音被分为很多帧,每帧语音都对应于一个频谱(通过短时FFT计算),频谱表示频率与能量的关系。在实际使用中,频谱图有三种,即线性振幅谱、对数振幅谱、自功率谱

2.4 声谱图旋转

  • 先将其中一帧语音的频谱通过坐标表示出来。现在我们将左边的频谱旋转90度。得到中间的图。然后把这些幅度映射到一个灰度级表示。

2.5 spectrogram声谱图

  • 我们会得到一个随着时间变化的频谱图,这个就是描述语音信号的spectrogram声谱图。

3 声学模型

3.1 声学模型

  • 首先回顾一下语音识别的任务,输入input是音频wav文件,保存的一般是经过抽样量化编码之后数字信号,也就是每个样点的值。输出是文字序列,代表这段音频的内容。

3.2 主流的声学模型建模技术

  • 深度神经网络超强的特征学习能力大大简化了特征抽取的过程,降低了建模对于专家经验的依赖,因此建模流程逐步从之前复杂多步的流程转向了简单的端到端的建模流程。

人工智能之语音识别技术(三)相关推荐

  1. 人工智能之语音识别技术【科普】

    原标题:人工智能之语音识别技术[科普] 语言是人与人之间最重要的交流方式.能与机器进行自然的人机交流,是人类一直期待的事情.随着人工智能快速发展.语音识别技术作为人机交流接口的关键技术.发展迅速.在A ...

  2. Kaldi语音识别技术(三) ----- 完成L.fst的生成

    Kaldi语音识别技术(三) ----- 完成L.fst的生成 文章目录 Kaldi语音识别技术(三) ----- 完成L.fst的生成 基础知识 一.运行环境准备 二.文件准备 lexicon.tx ...

  3. 人工智能之语音识别技术(二)

    1. 语音识别技术的重要性 各种终端设备的智能化和集成化程度越来越高,传统的信息检索和菜单操作方式已经越来越无法满足需求.迫切需要一种更加便捷的信息检索和命令方式来替代传统的按键操作. 语音识别技术的 ...

  4. 【人工智能】语音识别技术

    了解关于语音识别技术的内容: 人工智能智能语音交互技术与应用 (课程主要讲解人工智能 智能语音相关技术,包括语音识别.人机交互.语音合成等) 语音识别技术,也被称为自动语音识别Automatic Sp ...

  5. 人工智能之语音识别技术(四)

    1. 语音信号基础 1.1 语音信号处理的目的 语音信号处理是一门新兴的边缘科学,它是语音学与数字信号处理两个学科相结合的产物.它和认知科学.心理学.语音学.计算机科学.模式识别和人工智能等学科有着紧 ...

  6. 人工智能:语音识别技术介绍

    ❤️作者主页:IT技术分享社区 ❤️作者简介:大家好,我是IT技术分享社区的博主,从事C#.Java开发九年,对数据库.C#.Java.前端.运维.电脑技巧等经验丰富. ❤️个人荣誉: 数据库领域优质 ...

  7. 语音识别技术应用仍存在着一些技术瓶颈,主要体现在哪几个方面?

    从某种意义上来说,语音智能识别技术的最终目的就是为了让计算机能够听懂人类语言,从而执行人的某项操作.该技术作为现阶段人工智能研究的一个主要方向与人机语音交互实现的一个关键技术,一直以来都备受各国人工智 ...

  8. python多媒体应应用应用(人工智能篇):你想为自己的工作和生活减负吗?一文全程让你掌握语音识别技术核心

    这篇博文标题为:你想为自己的工作和生活减负吗?那么欢迎关注语音识别技术吧! 作为21世纪,很多生活和工作的模式都发生了变化,特别是多媒体技术的普遍应用,随着人工智能的兴起,给多媒体技术锦上添花.那么当 ...

  9. 图像处理、语音处理的应用及前沿技术_人工智能,虚拟技术,语音识别技术在我们的生活中...

    人工智能(Artificial Intelligence),英文缩写为AI.它是研究.开发用于模拟.延伸和扩展人的智能的理论.方法.技术及应用系统的一门新的技术科学. 人工智能是计算机科学的一个分支, ...

最新文章

  1. 自动化测试框架cucumber_基于Cucumber和Testng的WebUI自动化测试方法与流程
  2. __int64 与long long 的区别
  3. Android FTP Server 1
  4. 1189C. Candies
  5. 自动/持续部署Docker 的tomcat web项目(二)
  6. java的封装和this关键字知识整理
  7. 华晨集团债务违约65亿 宝马中国:华晨宝马运营不受影响
  8. insert时调用本身字段_多线程编程时,7件你必须知道的事情
  9. 计算机中那些事儿(五):我与Dos的不解情缘---应用篇
  10. 关于内存对齐介绍的比较好的一个文章
  11. HDU 4111 Alice and Bob 【DP解决博弈】
  12. Android 进程之间通信
  13. DeepStream:下一代智慧城市的视频分析
  14. ie显示的html页面乱码,IE10、IE11页面中文乱码解决方案
  15. 因为看了这些书,我大二就拿了腾讯OFFER
  16. 计算机网络知识点总结
  17. 高淇java什么方向,高淇Java笔记(数据类型和运算符、控制语句)
  18. CSS设置背景颜色透明
  19. 三自由度机械手腕设计机构设计
  20. 计算机 64虚拟内存设置方法,64位的WIN7,4G内存,虚拟内存怎么设置

热门文章

  1. SEO优化技巧:16个方法优化网页中的图片
  2. Hibernate常见问题集锦
  3. 使用Reactor进行反应式编程最全教程
  4. c语言随机生成整数存放一维数组_C语言入门教程(十)多维数组
  5. jquery中获取元素的几种方式小结
  6. 科学计算机的显示怎么调整成出厂设置,笔记本电脑怎么恢复出厂设置
  7. pandas新建dataframe_pandas数据处理
  8. 联想服务器做完raid找不到硬盘,联想服务器RAID配置步骤
  9. ndows live id怎么登陆,手机如何注册和使用Windows Live ID帐号
  10. CentOS7中yum安装mysql_CentOS7中YUM 安装mysql