离线语音茶吧机设计应用案例
1 概述¶
随着人们生活水平的提高,都追求舒适的体验感,特别是对操控性的要求越来越高。目前带功能的茶吧机产品的控制方式有以下几类:
- 按键控制:传统控制方式,每次要走到茶吧机边才行,操作麻烦;
- 遥控控制:采用红外遥控或者蓝牙遥控,方便远距离控制,但遥控器容易丢,放置也麻烦。且遥控器上按键较少,当茶吧机功能多的时候无法用单次按键控制全部的功能,组合按键不符合人们使用习惯;
- 手机APP控制:每次控制需要打开手机APP,需要联网,同时需配网,操作繁琐;
- 智能音箱控制:通过如天猫精灵等智能音箱直接控制,相对方便,但音箱需联网状态下才可使用,识别时有隐私安全问题,网络延时大时控制的实时性不好。
为了解决以上痛点,可以采用纯离线语音识别进行控制,在成本增加不大的情况下,为产品带来更多的亮点和竞争力。启英泰伦针对该产品领域,已开发了整套离线语音茶吧机方案,下面对该方案进行介绍。
2 方案优势¶
启英泰伦离线语音茶吧机相对传统茶吧机方案,可让用户通过语音控制茶吧机设备,替换传统遥控器或按钮控制的方式,该方案有以下优势:
- 可以直接使用语音控制茶吧机,且无需联网,自然方便,识别率可达95%以上;
- 语音控制响应快,一般在0.2~0.8s内完成;
- 可远场识别,安静情况下可达10米;
- 方案功耗低,工作功耗仅为0.2W左右;
- 可靠性好,芯片方案已通过双85测试,满足格力、美的等家电巨头要求;
- 整套产品技术已成熟,具有完整的软件、硬件、结构设计方案,节省开发周期,降低开发难度;
- 配合我司语音AI平台开发,可灵活定制唤醒词和命令词,不需要再专门收集语料训练。
3 应用描述¶
启英泰伦离线语音茶吧机方案适用于各类需控制的茶吧机。 语音茶吧机产品的使用场景为普通家居环境,在安静和中低噪音下可以达到良好的识别率。其中安静环境的环境底噪在35dB ~ 45dB之间,属于中低噪音环境;开启茶吧机后环境噪音可达45dB ~ 65dB之间。该噪音环境下可以直接选用我司单麦克风语音模块,如CI-B0XGS01S或CI-B0XGS01S-H模块,以达到比较好的性价比。
特别注意,不同的茶吧机运行过程中,因为齿轮位置、进出水口等差异,运行产生的噪声大小也有不小的差异,为了达到最好的语音识别效果,在设计茶吧机整机结构时,因注意控制麦克风噪音小于65dB、具体参照下面结麦克风结构设计。
4 产品设计流程¶
一个基于我司芯片的标准语音产品设计流程如下图所示:
该流程主要针对我司新用户开发产品使用,包含了前期购买样品Demo进行验证,硬件选型,语音对话逻辑、软硬件方案和结构设计,设计完成后的测试,以及生产测试准备和后续批量采购等步骤。如果是已经熟悉我司方案的老用户,可以直接从中间步骤开始,不用再重复进行Demo测试等工作。
下面针对新用户的开发,对上述流程中的各个步骤逐一描述。
4.1 DEMO测试¶
针对新用户,可以先从我司授权的经销商或直接从我司官网 ☞样品购买 处购买对应的模块或开发板套件,进行识别效果测试,相关的软硬件技术文档可以从本文档中心处获取。用户测试满意后,可以进行硬件选型。
4.2 选型指南¶
用户硬件选型可以直接参考 ☞硬件选型 ,如果用户想快速产品化,推荐直接使用我司已设计好的标准模块;如果现有标准模块无法满足产品的结构需求,也可以选用合适的芯片进行硬件板的设计。
4.3 方案设计¶
选择好合适的芯片或模块后,可根据产品的功能进行下述设计:
- 语音UI(唤醒词和命令词)设计:设计方法可参考 ☞语音UI设计参考;
- 硬件设计:设计方法可参考 ☞硬件设计参考;
- 结构设计:设计方法可参考 ☞产品结构设计;
- 软件开发:设计方法可参考 ☞软件开发。
如用户为首次进行语音方案开发,建议到 ☞启英泰伦语音AI平台 上获取基于相关芯片的语音产品方案设计Checklist文档,进行逐一检查以确保设计效果。如有技术支持需求请联系我司技术支持人员。
4.4 测试验收¶
产品方案设计完成形成样品后,建议对该样品进行相关的识别测试,相关测试方法和标准可参考 ☞识别效果测试。同时,还建议根据产品质量的要求进行各类硬件测试,静电测试、防水测试等。为了保证最终的识别效果,还建议进行硬件底噪的测试及产品装机后的整机功能测试。
4.5 生产测试¶
样机测试完成后,会转入后续产线批量生产阶段。我司为产品的批量生产做了完善的解决方案,用户可以参考 ☞生产测试 获取更多信息。用户如需要生产测试的相关技术支持,请联系我司技术人员。
4.6 下单采购¶
用户如果要采购我司产品,请点击 ☞样品和批量采购 获取更多信息。
5 茶吧机设计方案介绍¶
5.1 方案特点¶
用户可以用我司的芯片设计语音控制板,和原产品的电控板通过串口进行通讯,可以实现语音茶吧机的产品设计。该方式开发相对简单,可以快速对接完成产品,但成本略高,适用于需快速出产品的的方案或者第一次接触语音识别的方案。
该方案的设计框图如下,语音模块与电控模块需要4根线的串口连接,语音模块进行语音识别及根据茶吧机的状态进行信息播放,控制由电控模块完成。
5.2 硬件设计参考¶
用户可以使用我司芯片设计需要要求的语音模块,但为快速开发,推荐直接使用我司的以下标准模块:
- CI-B02GS03T:适合空间比较高,纵深长的结构,串口接口电平为3.3V;
- CI-B02GS01S:适合空间比较矮的结构,串口接口电平为3.3V;
- CI-B02GS01J:适合有空间放置固定语音模块的结构,原来的茶吧机硬件改动较小,串口接口电平为5V。
用户直接使用我司标准语音模块时,有以下注意事项:
- 将语音模块板的串口跟电控串口对接,注意电控的供电需要大于500mA;
- 注意串口的电平要匹配,CI-B02GS01J支持5V电平,其他的模块支持3.3V,如果电控板使用5V电平,CI-B02GS01J可以对接直接串口,其它模块需要增加电平转换电路,如下图所示:
5.3 串口通讯方式¶
语音模块与电控模块通过串口进行信息交互,主要有两种方式,一种为语音模块主动播放,同时将信息发电控模块;另一种为语音模块被动播放,其分别描述如下:
语音模块主动播放模式
主动播放方式主要执行以下动作:
- 识别到词条;
- 主动播放反馈声音;
- 将此条信息串口告知电控模块;
- 电控模块执行动作。
该方式的优点在于控制方式简单,由语音模块单线输出信息给电控模块。但缺点在于无法根据茶吧机的情况及按键情况进行语音反馈。
语音模块被动播放模式
被动播放方式主要执行以下动作:
- 语音模块识别到词条;
- 将词条信息串口告知电控模块;
- 电控模块执行相关动作;
- 告知语音模块需要播放的内容;
- 语音模块根据电控模块反馈进行播放。
该方式的优点在于语音模块根据电控模块的状态进行播放对应内容,可以进行最合适的反馈,体验感好;同时如果电控模块通过按键或者遥控进行控制,语音模块也可以进行状态播放。缺点在于会多一次串口通信的过程。
5.4 SDK包说明和模块串口通讯协议¶
我司为用户提供了串口通讯方案完整的SDK包,用户可以到 ☞启英泰伦语音AI平台 上获取相关SDK开发包。
模块的串口通讯建议使用我司标准协议,具体格式请参考 ☞串口协议 。
注意:
- ASR语言模型中文建议选择SE159,其他语种请使用对应语种的模型。茶吧机产品自带运行噪音,如果茶吧机本身噪音大于60db,建议打开降噪功能。
- 串口设置:
- 波特率:9600
- 停止位:1
- 数据位:8
- 奇偶校验:无
- 代码中通过判断 “命令+语音ID”获取是什么指令和功能。
- 发送的串口信息建议要检查完整性,可以用以下的checksum参考代码来实现。
6 产品结构相关注意事项¶
6.1 麦克风结构设计¶
茶吧机产品在设计结构时,针对麦克风应当注意以下事项:
- 麦克风布局尽量远离茶吧机的电机,进出水管等噪音处;
- 麦克风需要防水防尘处理,至少选择IP65规格的;
- 麦克风放在茶吧机的正面的位置,避免遮挡,保证拾音最大范围;
- 分贝仪测试运行时,麦克风处的稳态噪声需小于65dB;
- 麦克风连线较长可选择带屏蔽的线;
- 麦克风线扎捆远离电机或电控线。
下图以常用智能茶吧机为例,讲述麦克风结构开孔及位置的建议方式,固定麦克风的结构件也需要考虑麦克风线方便引出导线和避免干扰。
6.2 喇叭结构设计¶
茶吧机产品在设计结构时,针对喇叭应当注意以下事项:
- 考虑到音质,喇叭功率不能太小,建议选用1W以上喇叭,带音腔的喇叭效果会更好一点,同时注意硬件板上的功放驱动能力要匹配喇叭型号;
- 喇叭放置位置以美观及结构布局方便为主,但注意尽量避免和麦克风放在同一位置;
- 不带音腔喇叭可以在结构上做一个音腔密封后能增大音量输出。
下图是一个喇叭规格及开孔的建议。
6.3 其它注意事项¶
- 建议选择-32dB±3dB,信噪比大于70dB以上,性价比高的全向模拟麦克风;
- 若茶吧机电机震动比较大,选择较厚的麦克风胶套减缓震动,可减小对识别效果的影响;
- 茶吧机处理潮湿环境,最好板子刷三防漆,推荐选择IP65防水防尘的麦克风,;
- 特别注意禁止直接点热溶胶用于固定麦克风头;
- 将麦克风完全插入固定孔内部,避免歪斜,拾音孔中心孔对准麦克风的中心;
- 茶吧机内部接线多容易扯松,插头配插座带卡扣会更牢固;
- 选择符合环保RoHS要求的RTV硅胶,推荐常用的硅胶有703/704/737等,或其它有机材料、单组分室温固化硅胶等;
- 多数硅橡胶灌胶厚度小于3mm以内实温完全固化时间为8 ~ 12小时,灌胶厚度 > 3mm以上完全固化时间更长,可分层多次浇灌,确保完全固化稳定密封;
- 生产工艺可把固定麦克风工序提前,另外特别注意麦克风接线在重力拉扯下,未完全固化前容易导致麦克风扯歪,也需注意将麦克风插线固定好。
7 相关参考资料列表¶
编号 | 参考资料描述 | 获取方式 |
---|---|---|
1 |
标准离线SDK CI110X_SDK_ASR_Offline |
请到 ☞启英泰伦语音AI平台 上获取 |
2 |
茶吧机SDK Demo: 串口通讯方案SDK |
请到 ☞启英泰伦语音AI平台 上获取 |
3 | 测试固件 | 到 ☞启英泰伦语音AI平台 上获取 |
4 | 我司芯片和模块的选型指南 | 请点击 ☞硬件选型指南 查看 |
5 | 我司芯片硬件设计方法参考 | 请点击 ☞硬件设计参考 查看 |
6 | 麦克风和喇叭器件选型 | 请点击 ☞外围器件兼容列表 查看 |
7 | 产品结构设计 | 请点击 ☞产品结构设计 查看 |
8 | 软件开发方法和标准SDK说明 | 请点击 ☞软件开发 查看各部分内容 |
9 | 产品识别性能测试方法 | 请点击 ☞识别效果测试 查看 |
10 | 生产测试的方法 | 请点击 ☞生产测试 查看 |
用户如遇到使用问题,请到启英泰伦语音AI平台上提交技术工单,或直接联系我司技术人员获取协助。
离线语音茶吧机设计应用案例相关推荐
- 电蚊香长时间通电引发的86离线语音智能盒子的设计开发
夏天到了,家里的蚊子也渐渐的多了起来,电蚊香因为其使用方便.污染物少等优点走进了千家万户,但是因为其只是简单的接入家用220V电路,比如白天不想用的时候一直是通着电的,目前市面上也有一些能周期性设置通 ...
- 离线语音蓝牙设计应用案例
1 概述¶ 随着人们生活水平的提高,对产品的功能要求也越来越高,追求舒适的体验感,特别是对操控性的要求越来越高.目前传统蓝牙产品的使用方式大部分还是局限于手动操作,例如蓝牙耳机,蓝牙音箱等,蓝牙成功连 ...
- 基于ESP8266和SU-03T的离线语音红外遥控器设计
一. 系统设计及框图 之前设计了基于ESP32模块的智能红外遥控器,具体功能见以下CSDN链接: 智能红外遥控器(一):功能简介_远望创客学堂的博客-CSDN博客 上面这款智能红外遥控器可以实现红外的 ...
- 基于STM32 STC15和SU-03T离线语音模块的智能语音自拍器设计
一. 系统设计及框图 现在的自拍系统有很多是蓝牙控制的,我们这次介绍的是使用语音控制的拍照系统. 本系统通过MCU产生20kHZ左右的频率驱动蜂鸣器(占空比为50%即可),手机APP收到此特定频率的信 ...
- 晓宇哥新年力作!AI离线语音开关控制器
作者:晓宇,整理:晓宇 微信公众号:芯片之家(ID:chiphome-dy) 曾经很长一段时间,晓宇哥在这个青春而骚动的城市,舍不得在这个安静的夜晚睡去,睡前总是习惯看看公众号,看看头条,知乎等等,尽 ...
- 嵌入式端音频开发(Unisound篇)之 7.1 蜂鸟M离线语音芯片简介
这里的Unisound就是云知声啦,一家很棒的人工智能公司.下面的开发案例都是基于芯片蜂鸟M的的标准硬件板. 如果是行业的小伙伴肯定都知道这家公司了: 云知声总部位于北京,在上海.深圳.厦门设有全资子 ...
- 启英泰伦离线语音+蓝牙+小程序控制方案介绍
近期,启英泰伦推出了一款可兼容离线语音识别+蓝牙控制+小程序控制的语音模块,模块型号为D02GS07J-BT. 模块简介 D02GS07J-BT模块体积小巧,长宽为37mm×40mm,工作电压为 5. ...
- 基于耳部脑电的语音想象脑机接口系统
本次分享一篇发表于JNE期刊的基于耳部脑电的语音想象脑机接口系统. 摘要 本研究调查了以用户耳朵 (ear-EEG) 为中心的脑电图 (EEG) 对基于语音想象的脑机接口 (BCI) 系统的功效.开发 ...
- 智能离线语音取暖器解决方案
随着技术的进步,越来越多的家庭都在使用取暖器来保持室内温度适宜.但是,传统的取暖器控制方式让人感到不便,不利于用户使用,因此诞生了取暖器智能语音解决方案. 该解决方案通过语音识别技术,将传统的操作替换 ...
- 语音识别插件_AnsweringMachine XS: 越狱理由之二,iPhone 电话语音答录机
Apps & Tweaks| Jailbreak Guide| iDevices Tweak:AnsweringMachine XSVersion:XSRepo:http://limneos ...
最新文章
- 独家 | ​数据科学家必知的五大深度学习框架!(附插图)
- 计算机考研最后四十天,2021考研最后四十天冲刺复习攻略
- CC攻击介绍及如何防御
- [css] 说说你对hasLayout的理解,触发hasLayout的方式有哪些?
- (转)Openlayers 2.X加载高德地图
- 十进制与二进制快速互转换计算心得
- 数据结构知识点大汇总(六)
- CentOS6 图形界面(gnome)安装(转)
- WPF Visifire 图表控件
- AcWing 188 武士风度的牛 题解(BFS)
- Android双目摄像头(带人脸检测)正确调用姿势
- Java(二十二) -- 生产者消费者模式
- PCIE Feature ------ INTx
- HTML屏蔽F12、右键、开发者工具、审查元素
- 维克森林大学计算机专业,维克森林大学计算机专业
- 区块链怎样运用到社交领域?
- python unescape函数_Python中unescape JavaScript中escape的字符
- 球面贴图(Sphere Map)
- 启明大学计算机博士,启明大学博士申请冬夏学期制-博士学位项目官网
- 【系统环境变量被删除如何恢复】