PPT内容

这是人工智能语音识别ppt,包括了语音识别的定义,语音识别涉及领域,语音识别的类型,语音识别原理框图,DTW算法,语音识别系统应用领域,语音识别技术的应用发展方向等内容,欢迎点击下载。

目录

语音识别的定义

语音识别涉及领域

语音识别的类型

语音识别原理框图

DTW算法

语音识别系统应用领域

语音识别技术的应用发展方向

语音识别的定义

语音识别技术就是让机器通过识别和理解过程把人类的语音信号转变为相应的文本或命令的技术,属于多维模式识别和智能计算机接口的范畴。它是语音信号处理学科的一个分支。语音识别系统的本质就是一种模式识别系统。

常见的语音识别方法有动态时间归整技术(DTW)、矢量量化技术(VQ)、隐马尔可夫模型(HMM)、基于段长分布的非齐次隐马尔可夫模型(DDBHMM)和人工神经元网络(ANN)

语音识别涉及领域

语音识别的类型

语音识别原理框图

DTW算法

模板匹配方法的语音识别算法需要解决的一个关键问题是说话人对同一个词的两次发音不可能完全相同。设参考模板有M帧矢量{R(1),R(2),…R(m),…,R(M)},R(m)为第m帧的语音特征矢量,测试模板有N帧矢量{T(1),T(2),…T(n),…,T(N)},T(n)是第n帧的语音特征矢量。d(T(in),R(im))表示T中第in帧特征与R中im帧特征之间的距离,通常用欧几里德距离表示。

三种匹配模式的对比

DTW算法

DTW是把时间规整和距离测度计算结合起来的一种非线性规整技术,它寻找一个规整函数im=Ф(in),将测试矢量的时间轴n非线性地映射到参考模板的时间轴m上,并使该函数满足:

D就是处于最优时间规整情况下两矢量的距离。

DTW算法

通常规整函数必须满足如下的约束条件:

边界限制

单调性限制

连续性限制

DTW算法

DTW算法的原理图如图把测试模板的各个帧号n=1~N在一个二维直角坐标系中的横轴上标出,把参考模板的各帧m=1~M在纵轴上标出,通过这些表示帧号的整数坐标画出一些纵横线即可形成一个网格,网格中的每一个交叉点(ti,rj)表示测试模式中某一帧与训练模式中某一帧的交汇。DTW算法分两步进行,一是计算两个模式各帧之间的距离,即求出帧匹配距离矩阵,二是在帧匹配距离矩阵中找出一条最佳路径。

DTW算法

DTW算法

搜索从(1,1)点出发,对于局部路径约束如图5-3,点(in,im)可达到的前一个格点只可能是(in-1,im)、(in-1,im-l)和(in-1,im-2)。那么(in,im)一定选择这三个距离中的最小者所对应的点作为其前续格点,这时此路径的累积距离为:

D(in,im)=d(T(in),R(im))+min{D(in-1,im),D(in-1,im-1),D(in-1,im-2)}

语音识别系统应用领域

电话通信的语音拨号 特别是在中、高档移动电话上 ,现已普遍的具有语音拨号的功能。随着语音识别芯 片的价格降低,普通电话上也将具备语音拨号的功 能。

汽车的语音控制 对汽车的卫星导航定位系统(GPS )的操作,汽车空调、照明以及音响等设备的 操作,同样也可以由语音来方便的控制。

工业控制及医疗领域 当操作人员的眼或手已经被占 用的情况下,在增加控制操作时,最好的办法就是增 加人与机器的语音交互界面。由语音对机器发出命令 ,机器用语音做出应答。

语音识别系统应用领域

个人数字助理的语音交互界面 PDA的体积很小 ,人机界面一直是其应用和技术的瓶颈之一。由于在 PDA上使用键盘非常不便,因此,现多采用手写体识 别的方法输入和查询信息。随着语音识别技术的提高 ,语音将成为PDA主要的人机交互界面。

智能玩具

家电遥控 用语音可以控制电视机、VCD、空调、电扇 、窗帘的操作,而且一个遥控器就可以把家中的电器 皆用语音控起来。

语音识别技术的应用发展方向

一个方向是大词汇量连续语音识别系统,主要应用于计算机的听写机,以及与电话网或者互联网相结合的语音信息查询服务系统,这些系统都是在计算机平台上实现的;

另外一个重要的发展方向是小型化、便携式语音产品的应用,如无线手机上的拨号、汽车设备的语音控制、智能玩具、家电遥控等方面的应用,这些应用系统大都使用专门的硬件系统实现,特别是近几年来迅速发展的语音信号处理专用芯片和语音识别片上系统的出现。

相关PPT

人工智能基础06--专家系统ppt:这是人工智能基础06--专家系统ppt,包括了专家系统概述,基于规则的专家系统,基于框架的专家系统,基于模型的专家系统,专家系统的设计、评价与开发,专家系统设计举例,新型专家系统,知识发现等内容,欢迎点击下载。

人工智能第四章推理技术ppt:这是人工智能第四章推理技术ppt,包括了推理技术概述,基于谓词逻辑知识表示方法的问题求解技术,不确定推理概述,非单调推理等内容,欢迎点击下载。

人工智能第五章专家系统ppt:这是人工智能第五章专家系统ppt,包括了ES基本概念,ES的产生与发展及今后展望,ES的结构,ES的创建步骤,ES的知识获取,ES开发工具,ES实例等内容,欢迎点击下载。

《人工智能语音识别ppt》是由用户NoSongToSing于2018-03-31上传,属于行业PPT。

人工智能语音识别ppt相关推荐

  1. 语音识别PPT.ppt

    您所在位置:网站首页 > 海量文档 &nbsp>&nbsp高等教育&nbsp>&nbsp语言学 语音识别PPT.ppt69页 本文档一共被下载:次,您 ...

  2. 国家机构评测主流电视:长虹人工智能语音识别第一

    原标题:国家机构评测主流电视:长虹人工智能语音识别第一 随着AI技术的快速兴起,人工智能已经成为电视新品的重要配置,但对用户来说,只有在使用场景中体现出来的方便快捷,才能真正让用户感知到技术的进步. ...

  3. 语音输入是计算机在哪个领域的应用,人工智能语音识别支持9种语言

    近日,搜狗输入法更新至10.8版本.据悉,新版本主要针对语音输入和多语言输入两大功能进行了创新升级. 9种外语语音识别,搜狗输入法成国内支持语种最多输入法 首先,新版搜狗输入法的较大亮点,就是上线了全 ...

  4. 人工智能—语音识别技术发展史

    语音识别技术:也被称为自动语音识别Automatic Speech Recognition,(ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键.二进制编码或者字符序列.所涉及 ...

  5. 分享本周所学——人工智能语音识别模型CTC、RNN-T、LAS详解

    本人是一名人工智能初学者,最近一周学了一下AI语音识别的原理和三种比较早期的语音识别的人工智能模型,就想把自己学到的这些东西都分享给大家,一方面想用浅显易懂的语言让大家对这几个模型有所了解,另一方面也 ...

  6. 国内最值得关注的10家人工智能语音识别公司

    在谈人工智能的时候,一定不能不谈语音识别,语音识别是人机交互的入口,是指机器/程序接收.解释声音,或理解和执行口头命令的能力.目前国内外都有公司在语音领域有所投入,其中包括才成立几年的初创企业,也包括 ...

  7. OpenAI的人工智能语音识别模型Whisper详解及使用

    1 whisper介绍 拥有ChatGPT语言模型的OpenAI公司,开源了 Whisper 自动语音识别系统,OpenAI 强调 Whisper 的语音识别能力已达到人类水准. Whisper是一个 ...

  8. 人工智能算法需要运用计算机吗,什么是人工智能算法.ppt

    什么是人工智能算法 什么是人工智能算法 随着计算机技术的飞速发展,智能计算方法的应用领域也越来越广泛,当前存在的一些智能算法有人工神经网络?遗传算法?模拟退火算法?群集智能?蚁群算法?粒子群算?等等. ...

  9. 搜狗推出庭审语音识别系统 人工智能下的全新应用

    "审判长.人民陪审员,根据<中国人民共和国刑事诉讼法>第184条.第193条.203条规定--"近日,不少在网上看庭审直播的公众发现,与以往只有视频画面和声音不同,还增 ...

最新文章

  1. svg animation应用之-描边效果
  2. 哈夫曼编码译码 C语言,【求助】严蔚敏版数据结构 哈夫曼编码译码
  3. 答TOGAF企业架构的一些问题
  4. visio 形状_分享我Visio经验(问题从来都不是问题)
  5. 47 - 算法 - 记住常用位运算-Leetcode-136-只出现一次的数字
  6. 7. Decorator pattern(装饰器模式)
  7. 三 APPIUM Android自动化 测试初体验(转)
  8. Rabbitmq消息队列(二) Hello World! 模拟简单发送接收
  9. 如果有人私信,吾看到后都会及时回答
  10. matlab fullfile函数
  11. linux 进程 cpu 100,清理linux中占用CPU 100%的病毒
  12. java代码性能优化
  13. 漏洞扫描器简单教程(天镜、Nessus、Appscan、Awvs)
  14. 清华教授!亲手教你JavaScript 在线解压 ZIP 文件,实战理论全都有
  15. 登出系统gif图标_来了!深度操作系统 20正式版——崭新视界,创无止境
  16. Grand Theft Auto V 图形研究(2)
  17. 《Fundamentals of Computer Grahpics》虎书第三版翻译——第四章 光线追踪
  18. 图像傅里叶变换后的复数域乘法
  19. 黑马程序员------黑马基础测试题参考
  20. 智能卡水表管理系统功能介绍

热门文章

  1. 精确光源(Punctual Light Sources)
  2. Ubuntu,QT5连接MySQL
  3. Delphi 实现数字转大写
  4. 利用webBrowser来实现自动登录网站
  5. HDU2015 偶数求和【入门】
  6. HDU2566 统计硬币【暴力】
  7. 2016CCPC东北地区大学生程序设计竞赛题解
  8. 51Nod-1050 循环数组最大段和【最大子段和+最小子段和+DP】
  9. Git 基础(九)—— Failed to push some refs to git
  10. 【学习 OpenCV】—— 将一个3通道的像素点转换到新的彩色空间