语音识别模块解决方案
什么叫
语音识别技术,也被称为自动语音识别Automatic Speech Recognition,(ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。
语音识别模块是在一种基于嵌入式的语音识别技术的模块,主要包括语音识别芯片和一些其他的附属电路,能够方便的与主控芯片进行通讯,开发者可以方便的将该模块嵌入到自己的产品中使用,实现语音交互的目的。
语音识别的基本原理如图1所示。语音识别包括两个阶段:训练和识别。不管是训练还是识别,都必须对输入语音预处理和特征提取。训练阶段所做的具体工作是收集大量的语音语料,经过预处理和特征提取后得到特征矢量参数,最后通过特征建模达到建立训练语音的参考模型库的目的。而识别阶段所做的主要工作是将输入语音的特征矢量参数和参考模型库中的参考模型 进行相似性度量比较,然后把相似性最高的输入特征矢量作为识别结果输出。 这样,最终就达到了语音识别的目的。
现有的识别技术按照识别对象可以分为特定人识别和非特定人识别。特定人识别是指识别对象为专门的人,非特定人识别是指识别对象是针对大多数用户,一般需要采集多个人的语音进行录音和训练,经过学习,达到较高的识别率。
基于现有技术开发嵌入式语音交互系统,目前主要有两种方式:一种是直接在嵌入式处理器中调用语音开发包;另一种是嵌入式处理器外围扩展语音芯片。第一种方法程序量大,计算复杂,需要占用大量的处理器资源,开发周期长;第二种方法相对简单,只需要关注语音芯片的接口部分与微处理器相连,结构简单,搭建方便,微处理器的计算负担大大降低,增强了可靠性,缩短了开发周期。
本文的
语音识别模块的最小系统
一般应用中语音识别系统最小系统需要包括:控制器模块、语音识别模块、功放模块、喇叭。如果需要使用语音识别功能,系统中还需要增加麦克风。
如图2所示,用户在使用语音识别或语音唤醒功能时,上位机发送启动语音识别或语音唤醒功能的命令给语音模块,模块把从麦克风采集到的语音数据,通过内部的识别模块进行转换成相应的识别结果,通过通讯接口回传给控制器。
图2-采用Syn7318语音识别模块的系统构成图
随着技术的发展,传统的键盘和按钮才操作已经不能满足人们得需求了,更方便、更自然、更人性化的人机交互方式成了人们追求的方向。基于听觉的人机交互方式无疑是最具有交互友好性的方式之一。而嵌入式语音交互由于结构简单,搭建方便,已成为目前研究的热门课题。嵌入式语音识别系统和PC机的语音识别系统相比,虽然其运算速度和内存容量有一定限制,但它具有体积小、功耗低、可靠性高、投入小、安装灵活等优点,特别适用于智能家居、机器人及消费电子等领域。
恩瑞智能(中国)有限公司
Enri-Link(China)CO.,LTD
语音识别模块解决方案相关推荐
- 智能语音识别系统-解决方案.pdf
数字化会议智能语音识别 系统解决方案 武汉蓝图伟业科技有限公司 2016 年 12 月 第 1 页 共 15 页 目 录 1.系统概述 3 2 .服务器需求分析 4 3 .系统原理 5 4 .系统优势 ...
- cjson使用_LD3320语音识别模块:LDV7模块使用详解
LD3320是非特定人(不用针对指定人)语音识别芯片,即语音声控芯片.最多可以识别50条预先内置的指令. 工作模式: LD3320(LDV7)语音模块可以工作在以下三种模式: 普通模式:直接说话,模块 ...
- LD3320语音识别模块开发
达者为先 师者之意 LD3320语音识别模块开发 1 LD3320语音识别模块基本参数 1.1 基本参数 1.2 识别原理 1.3 解决方案: 2 LD3320语音识别模块二次开发 2.1 源码修改 ...
- LD3320语音识别模块:LDV7模块使用详解
喜欢请关注微信公众号:嵌入式从0到1 公众号内容面向在校大学生.电子爱好者.嵌入式工程师: 涉及电子制作.模块使用.单片机技术.物联网相关知识分享: 软硬件全栈工程师,玩模块,学硬件,带你从0走到1 ...
- 启英泰伦推出多种智能语音识别照明解决方案,改装简单,成本低
随着人工智能技术的普及,智能家居设备开始走进千家万户.而智能照明系统成为其不可或缺的一部分,占据着举足轻重的地位. 但是照明系统和其他家居设备不一样的是,开发商交房时已布好电路,或用户直接购买精装房, ...
- python3语音识别模块_零基础教你玩转语音控制,学习语音控制技术,打造智能生活很简单...
大家好,我是阿乐,今天给大家讲解一下LD3320语音识别模块. 先来看看模块实物,它是长这个样子的: LD3320语音识别模块实物 我现在用来给大家做讲解的这个模块是已经集成了单片机在上面,这样子开发 ...
- python3语音识别模块_『开源项目』基于STM32的智能垃圾桶之语音识别
大家好,我是『芯知识学堂』的SingleYork,前面给大家简单介绍了『开源项目』基于STM32的智能垃圾桶之成员简介,相信有很多小伙伴都已经忍不住跃跃欲试了,别着急,从这一篇开始,笔者将会带领大家一 ...
- WTK6900B02语音识别模块,声控模块,语音交互模块,语音识别模块方案-深圳唯创知音电子有限公司...
简介: WTK6900B02是深圳唯创知音电子有限公司研发.生产的高识别率可离线更换语音识别语句的语音识别模块,结合了WTK6900B02 V2.03-P1与WTK6900B02 V2.03-P2两个 ...
- 语音识别人工智能解决方案
语音识别人工智能解决方案 摘要 语音识别人工智能解决方案 背景介绍 语音识别技术,也被称为自动语音识别(Automatic Speech Recognition ,ASR),其目标是将人类的语音中的词 ...
最新文章
- 迁移 Nexus 软件仓库拾遗
- java项目功能详情介绍,JAVAEE—spring的详细介绍
- Ubuntu下deb与rpm包的安装方法
- Go 语言学习总结(4)—— 为什么说 Golang 是面向未来的语言?
- Linux命令之umask
- InnoDB存储引擎MVCC实现原理
- 项目(1)——文件压缩
- 中国工程院院士张尧学:透明计算/云计算操作系统
- python flask 读取地址栏参数
- win7系统64位系统怎么计算机配置,电脑装64位系统有什么要求|64位系统安装条件是什么...
- 软件工程-软件开发的工程思维
- 一位计算机牛人的心得,谈到计算机和数学,很实用~
- HTML中怎么改变一条线的粗细
- 克罗内克积的c++简单实现
- Linux下NFS服务器的配置 (二)
- 怎样用c语言禁止鼠标滑轮,如何禁用鼠标滚轮-禁用鼠标滚轮的教程 - 河东软件园...
- 光脚丫思考Vue3与实战:第04章 模板语法 第01节 概述+插值
- 第十四届蓝桥杯三月真题刷题训练——第 27 天
- 腾讯安全运营中心集成UEBA能力,助力企业保障内部网络安全
- Android:设置圆形头像,Android截取圆形图片