5分钟带你读懂“语音识别”工作原理
https://www.toutiao.com/a6692701310044602887/
电话机器人效果好不好,首先得看他的语音识别能力怎么样,语音识别率高、稳定,那么这个电话机器人就不会差。我们可以看一下语音识别的基本原理:
一个基本的语音识别系统如下图,实现是正常工作流程,虚线是训练模式分类问题中的模板(这里就是声学模型,字典和语言模型)。
预处理:
1. 首尾端的静音切除,下降对后续进程形成的搅扰,静音切除的操作一般称为VAD。
2. 声响分帧,也就是把声响切开成一小段一小段,每小段称为一帧,运用移动窗函数来完成,不是简略的切开,各帧之间一般是有交叠的。
特征提取:首要算法有线性猜测倒谱系数(LPCC)和Mel 倒谱系数(MFCC),意图是把每一帧波形变成一个包括声响信息的多维向量;
声学模型(AM):经过对语音数据进行练习取得,输入是特征向量,输出为音素信息;
字典:字或许词与音素的对应, 简略来说, 中文就是拼音和汉字的对应,英文就是音标与单词的对应;
言语模型(LM):经过对大量文本信息进行练习,得到单个字或许词彼此相关的概率;
解码:就是经过声学模型,字典,言语模型对提取特征后的音频数据进行文字输出;
语音辨认流程的举例(仅仅形象表述,不是实在数据和进程):
1. 语音信号:PCM文件等(我是电销机器人)
2. 特征提取:提取特征向量[5 4 2 66 98 ...]
3. 声学模型:[5 4 2 66 98]-> wo shi dianxiao jiqiren
4. 字典翻译:窝:w o;我:w o; 是:s i;电销:dian xiao 机:j i; 器:q i; 人:r en
5. 言语模型:我:0.1286, 是: 0.3616,电销:0.5682,机器人:0.6785;
6. 输出文字:我是电销机器人;
5分钟带你读懂“语音识别”工作原理相关推荐
- 三分钟带你读懂 BERT
本文为 AI 研习社编译的技术博客,原标题 : BERT Technology introduced in 3-minutes 作者 | Suleiman Khan, Ph.D. 翻译 | 胡瑛皓.s ...
- 一文读懂CPU工作原理、程序是如何在单片机内执行的、指令格式之操作码地址码
文章较长,大家可选择性阅读,嘎嘎细 计算机结构 CPU的运行原理 CPU的控制单元在时序脉冲的作用下,将指令计数器里所指向的指令地址(这个地址是在内存里的)送到地址总线上去,然后CPU将这个地址里的指 ...
- kafka同一个group 消费两个topic吗_MQ: 一张图读懂kafka工作原理
1.关于kafka Kafka是由Apache软件基金会开发的一个开源消息队列,由Scala和Java编写. 相关文章参考: MQ: 消息队列常见应用场景及主流消息队列ActiveMQ.RabbitM ...
- 一文读懂舵机工作原理并运用(附代码)
杂谈 自己拿到这一模块是也挺迷茫的,后来看了一些资料,也渐渐积累了些自己的理解,很多博文并没有将舵机讲明白,至少你待把PWM与角度如何换算讲清楚吧,所以笔者写这篇博文供大家学习掌握. 如果你拿到一个舵 ...
- 窥一斑而知全豹,几分钟带你读懂Java字节码,再也不怕了
目录 1.如何看字节码 2.一个简单的例子 3.字节码结构 4.总结: 引言:都知道java的源文件最后会被编译成class文件,class文件的内容是字节码.为什么java要编译成字节码呐?我觉得最 ...
- 优先队列默认是小顶堆吗_一分钟带你读懂什么是堆?
堆其实就是一种特殊的队列--优先队列. 普通的队列游戏规则很简单:就是先进先出:但这种优先队列搞特殊,不是按照进队列的时间顺序,而是按照每个元素的优先级来比拼,优先级高的在堆顶. 这也很容易理解吧,比 ...
- uml类图例子_五分钟带你读懂UML类图
目录 先看下面这张类图,包括了UML类图的基本图示法 1.类的表示 2.接口的表示 3.继承关系 4.实现接口 5.关联关系 6.聚合关系 7.合成(组合)关系 8.依赖关系 先看下面这张类图,包括了 ...
- 柔性屏发展前景?十分钟带你读懂2019年中国柔性显示产业
利好政策.技术进步和市场需求驱动下,中国柔性屏产业高速发展,目前中国柔性显示产业已形成零件制造.面板制造和终端产品应用三大产业链环节,产业发展前景广阔,2018年中国柔性显示产业链各个环节相关企业营收 ...
- 一分钟带你读懂什么是堆?
上一篇的 「Java 集合框架」里,还剩下一个大问题没有说的,那就是 PriorityQueue,优先队列,也就是堆,Heap. 什么是堆? 堆其实就是一种特殊的队列--优先队列. 普通的队列游戏规则 ...
最新文章
- 解决k8s中node拉取镜像失败问题
- 一笔画问题 (DFS或并查集)
- javaScript一些函数--Math()
- struts2 18拦截器详解(五)
- 大数据开发实战:数据流图及相关数据技术
- JavaScript数组方法map
- PHP5.3, PHP5.4, PHP5.5新特性
- 网管系统开发经验谈(二)
- 深度学习2.0-29.卷积神经网络
- 同时安装python2和python3
- python上海房价数据分析_Python数据分析告诉你为何上海的二手房你都买不起
- Opencv源码之平面点集的最小包围圆
- 218. 天际线问题
- PCIE操作基础原理
- python输入esc退出循环_如何用Esc键停止GhPython或者RhinoPython脚本运行
- 4个步骤让你空手套白狼,零投资净赚百万!颠覆传统的商业思维!
- 三菱FX5U系列PLC模拟量使用方法及相关参数设置
- peel在Linux生成excel,如何将多个Excel文件合并成一个且保留原有数据?
- mybatis-plus设置id自增,插入数据。
- 暴风酷播云二期配置_暴风播酷云二期 黑群晖