1 概述¶

随着人们生活水平的提高,都追求舒适的体验感,特别是对操控性的要求越来越高。目前带功能的茶吧机产品的控制方式有以下几类:

  • 按键控制:传统控制方式,每次要走到茶吧机边才行,操作麻烦;
  • 遥控控制:采用红外遥控或者蓝牙遥控,方便远距离控制,但遥控器容易丢,放置也麻烦。且遥控器上按键较少,当茶吧机功能多的时候无法用单次按键控制全部的功能,组合按键不符合人们使用习惯;
  • 手机APP控制:每次控制需要打开手机APP,需要联网,同时需配网,操作繁琐;
  • 智能音箱控制:通过如天猫精灵等智能音箱直接控制,相对方便,但音箱需联网状态下才可使用,识别时有隐私安全问题,网络延时大时控制的实时性不好。

为了解决以上痛点,可以采用纯离线语音识别进行控制,在成本增加不大的情况下,为产品带来更多的亮点和竞争力。启英泰伦针对该产品领域,已开发了整套离线语音茶吧机方案,下面对该方案进行介绍。


2 方案优势¶

启英泰伦离线语音茶吧机相对传统茶吧机方案,可让用户通过语音控制茶吧机设备,替换传统遥控器或按钮控制的方式,该方案有以下优势:

  • 可以直接使用语音控制茶吧机,且无需联网,自然方便,识别率可达95%以上;
  • 语音控制响应快,一般在0.2~0.8s内完成;
  • 可远场识别,安静情况下可达10米;
  • 方案功耗低,工作功耗仅为0.2W左右;
  • 可靠性好,芯片方案已通过双85测试,满足格力、美的等家电巨头要求;
  • 整套产品技术已成熟,具有完整的软件、硬件、结构设计方案,节省开发周期,降低开发难度;
  • 配合我司语音AI平台开发,可灵活定制唤醒词和命令词,不需要再专门收集语料训练。


3 应用描述¶

启英泰伦离线语音茶吧机方案适用于各类需控制的茶吧机。 语音茶吧机产品的使用场景为普通家居环境,在安静和中低噪音下可以达到良好的识别率。其中安静环境的环境底噪在35dB ~ 45dB之间,属于中低噪音环境;开启茶吧机后环境噪音可达45dB ~ 65dB之间。该噪音环境下可以直接选用我司单麦克风语音模块,如CI-B0XGS01S或CI-B0XGS01S-H模块,以达到比较好的性价比。

特别注意,不同的茶吧机运行过程中,因为齿轮位置、进出水口等差异,运行产生的噪声大小也有不小的差异,为了达到最好的语音识别效果,在设计茶吧机整机结构时,因注意控制麦克风噪音小于65dB、具体参照下面结麦克风结构设计。


4 产品设计流程¶

一个基于我司芯片的标准语音产品设计流程如下图所示:

该流程主要针对我司新用户开发产品使用,包含了前期购买样品Demo进行验证,硬件选型,语音对话逻辑、软硬件方案和结构设计,设计完成后的测试,以及生产测试准备和后续批量采购等步骤。如果是已经熟悉我司方案的老用户,可以直接从中间步骤开始,不用再重复进行Demo测试等工作。

下面针对新用户的开发,对上述流程中的各个步骤逐一描述。

4.1 DEMO测试¶

针对新用户,可以先从我司授权的经销商或直接从我司官网 ☞样品购买 处购买对应的模块或开发板套件,进行识别效果测试,相关的软硬件技术文档可以从本文档中心处获取。用户测试满意后,可以进行硬件选型。

4.2 选型指南¶

用户硬件选型可以直接参考 ☞硬件选型 ,如果用户想快速产品化,推荐直接使用我司已设计好的标准模块;如果现有标准模块无法满足产品的结构需求,也可以选用合适的芯片进行硬件板的设计。

4.3 方案设计¶

选择好合适的芯片或模块后,可根据产品的功能进行下述设计:

  • 语音UI(唤醒词和命令词)设计:设计方法可参考 ☞语音UI设计参考;
  • 硬件设计:设计方法可参考 ☞硬件设计参考;
  • 结构设计:设计方法可参考 ☞产品结构设计;
  • 软件开发:设计方法可参考 ☞软件开发。

如用户为首次进行语音方案开发,建议到 ☞启英泰伦语音AI平台 上获取基于相关芯片的语音产品方案设计Checklist文档,进行逐一检查以确保设计效果。如有技术支持需求请联系我司技术支持人员。

4.4 测试验收¶

产品方案设计完成形成样品后,建议对该样品进行相关的识别测试,相关测试方法和标准可参考 ☞识别效果测试。同时,还建议根据产品质量的要求进行各类硬件测试,静电测试、防水测试等。为了保证最终的识别效果,还建议进行硬件底噪的测试及产品装机后的整机功能测试。

4.5 生产测试¶

样机测试完成后,会转入后续产线批量生产阶段。我司为产品的批量生产做了完善的解决方案,用户可以参考 ☞生产测试 获取更多信息。用户如需要生产测试的相关技术支持,请联系我司技术人员。

4.6 下单采购¶

用户如果要采购我司产品,请点击 ☞样品和批量采购 获取更多信息。


5 茶吧机设计方案介绍¶

5.1 方案特点¶

用户可以用我司的芯片设计语音控制板,和原产品的电控板通过串口进行通讯,可以实现语音茶吧机的产品设计。该方式开发相对简单,可以快速对接完成产品,但成本略高,适用于需快速出产品的的方案或者第一次接触语音识别的方案。

该方案的设计框图如下,语音模块与电控模块需要4根线的串口连接,语音模块进行语音识别及根据茶吧机的状态进行信息播放,控制由电控模块完成。

5.2 硬件设计参考¶

用户可以使用我司芯片设计需要要求的语音模块,但为快速开发,推荐直接使用我司的以下标准模块:

  • CI-B02GS03T:适合空间比较高,纵深长的结构,串口接口电平为3.3V;
  • CI-B02GS01S:适合空间比较矮的结构,串口接口电平为3.3V;
  • CI-B02GS01J:适合有空间放置固定语音模块的结构,原来的茶吧机硬件改动较小,串口接口电平为5V。

用户直接使用我司标准语音模块时,有以下注意事项:

  • 将语音模块板的串口跟电控串口对接,注意电控的供电需要大于500mA;
  • 注意串口的电平要匹配,CI-B02GS01J支持5V电平,其他的模块支持3.3V,如果电控板使用5V电平,CI-B02GS01J可以对接直接串口,其它模块需要增加电平转换电路,如下图所示:

5.3 串口通讯方式¶

语音模块与电控模块通过串口进行信息交互,主要有两种方式,一种为语音模块主动播放,同时将信息发电控模块;另一种为语音模块被动播放,其分别描述如下:

语音模块主动播放模式

主动播放方式主要执行以下动作:

  1. 识别到词条;
  2. 主动播放反馈声音;
  3. 将此条信息串口告知电控模块;
  4. 电控模块执行动作。

该方式的优点在于控制方式简单,由语音模块单线输出信息给电控模块。但缺点在于无法根据茶吧机的情况及按键情况进行语音反馈。

语音模块被动播放模式

被动播放方式主要执行以下动作:

  1. 语音模块识别到词条;
  2. 将词条信息串口告知电控模块;
  3. 电控模块执行相关动作;
  4. 告知语音模块需要播放的内容;
  5. 语音模块根据电控模块反馈进行播放。

该方式的优点在于语音模块根据电控模块的状态进行播放对应内容,可以进行最合适的反馈,体验感好;同时如果电控模块通过按键或者遥控进行控制,语音模块也可以进行状态播放。缺点在于会多一次串口通信的过程。

5.4 SDK包说明和模块串口通讯协议¶

我司为用户提供了串口通讯方案完整的SDK包,用户可以到 ☞启英泰伦语音AI平台 上获取相关SDK开发包。

模块的串口通讯建议使用我司标准协议,具体格式请参考 ☞串口协议 。

注意:

  1. ASR语言模型中文建议选择SE159,其他语种请使用对应语种的模型。茶吧机产品自带运行噪音,如果茶吧机本身噪音大于60db,建议打开降噪功能。
  2. 串口设置:
    • 波特率:9600
    • 停止位:1
    • 数据位:8
    • 奇偶校验:无
  3. 代码中通过判断 “命令+语音ID”获取是什么指令和功能。
  4. 发送的串口信息建议要检查完整性,可以用以下的checksum参考代码来实现。

6 产品结构相关注意事项¶

6.1 麦克风结构设计¶

茶吧机产品在设计结构时,针对麦克风应当注意以下事项:

  • 麦克风布局尽量远离茶吧机的电机,进出水管等噪音处;
  • 麦克风需要防水防尘处理,至少选择IP65规格的;
  • 麦克风放在茶吧机的正面的位置,避免遮挡,保证拾音最大范围;
  • 分贝仪测试运行时,麦克风处的稳态噪声需小于65dB;
  • 麦克风连线较长可选择带屏蔽的线;
  • 麦克风线扎捆远离电机或电控线。

下图以常用智能茶吧机为例,讲述麦克风结构开孔及位置的建议方式,固定麦克风的结构件也需要考虑麦克风线方便引出导线和避免干扰。

6.2 喇叭结构设计¶

茶吧机产品在设计结构时,针对喇叭应当注意以下事项:

  • 考虑到音质,喇叭功率不能太小,建议选用1W以上喇叭,带音腔的喇叭效果会更好一点,同时注意硬件板上的功放驱动能力要匹配喇叭型号;
  • 喇叭放置位置以美观及结构布局方便为主,但注意尽量避免和麦克风放在同一位置;
  • 不带音腔喇叭可以在结构上做一个音腔密封后能增大音量输出。

下图是一个喇叭规格及开孔的建议。

6.3 其它注意事项¶

  • 建议选择-32dB±3dB,信噪比大于70dB以上,性价比高的全向模拟麦克风;
  • 若茶吧机电机震动比较大,选择较厚的麦克风胶套减缓震动,可减小对识别效果的影响;
  • 茶吧机处理潮湿环境,最好板子刷三防漆,推荐选择IP65防水防尘的麦克风,;
  • 特别注意禁止直接点热溶胶用于固定麦克风头;
  • 将麦克风完全插入固定孔内部,避免歪斜,拾音孔中心孔对准麦克风的中心;
  • 茶吧机内部接线多容易扯松,插头配插座带卡扣会更牢固;
  • 选择符合环保RoHS要求的RTV硅胶,推荐常用的硅胶有703/704/737等,或其它有机材料、单组分室温固化硅胶等;
  • 多数硅橡胶灌胶厚度小于3mm以内实温完全固化时间为8 ~ 12小时,灌胶厚度 > 3mm以上完全固化时间更长,可分层多次浇灌,确保完全固化稳定密封;
  • 生产工艺可把固定麦克风工序提前,另外特别注意麦克风接线在重力拉扯下,未完全固化前容易导致麦克风扯歪,也需注意将麦克风插线固定好。


7 相关参考资料列表¶

编号 参考资料描述 获取方式
1 标准离线SDK
CI110X_SDK_ASR_Offline
请到 ☞启英泰伦语音AI平台 上获取
2 茶吧机SDK Demo:
串口通讯方案SDK
请到 ☞启英泰伦语音AI平台 上获取
3 测试固件 到 ☞启英泰伦语音AI平台 上获取
4 我司芯片和模块的选型指南 请点击 ☞硬件选型指南 查看
5 我司芯片硬件设计方法参考 请点击 ☞硬件设计参考 查看
6 麦克风和喇叭器件选型 请点击 ☞外围器件兼容列表 查看
7 产品结构设计 请点击 ☞产品结构设计 查看
8 软件开发方法和标准SDK说明 请点击 ☞软件开发 查看各部分内容
9 产品识别性能测试方法 请点击 ☞识别效果测试 查看
10 生产测试的方法 请点击 ☞生产测试 查看

用户如遇到使用问题,请到启英泰伦语音AI平台上提交技术工单,或直接联系我司技术人员获取协助。

离线语音茶吧机设计应用案例相关推荐

  1. 电蚊香长时间通电引发的86离线语音智能盒子的设计开发

    夏天到了,家里的蚊子也渐渐的多了起来,电蚊香因为其使用方便.污染物少等优点走进了千家万户,但是因为其只是简单的接入家用220V电路,比如白天不想用的时候一直是通着电的,目前市面上也有一些能周期性设置通 ...

  2. 离线语音蓝牙设计应用案例

    1 概述¶ 随着人们生活水平的提高,对产品的功能要求也越来越高,追求舒适的体验感,特别是对操控性的要求越来越高.目前传统蓝牙产品的使用方式大部分还是局限于手动操作,例如蓝牙耳机,蓝牙音箱等,蓝牙成功连 ...

  3. 基于ESP8266和SU-03T的离线语音红外遥控器设计

    一. 系统设计及框图 之前设计了基于ESP32模块的智能红外遥控器,具体功能见以下CSDN链接: 智能红外遥控器(一):功能简介_远望创客学堂的博客-CSDN博客 上面这款智能红外遥控器可以实现红外的 ...

  4. 基于STM32 STC15和SU-03T离线语音模块的智能语音自拍器设计

    一. 系统设计及框图 现在的自拍系统有很多是蓝牙控制的,我们这次介绍的是使用语音控制的拍照系统. 本系统通过MCU产生20kHZ左右的频率驱动蜂鸣器(占空比为50%即可),手机APP收到此特定频率的信 ...

  5. 晓宇哥新年力作!AI离线语音开关控制器

    作者:晓宇,整理:晓宇 微信公众号:芯片之家(ID:chiphome-dy) 曾经很长一段时间,晓宇哥在这个青春而骚动的城市,舍不得在这个安静的夜晚睡去,睡前总是习惯看看公众号,看看头条,知乎等等,尽 ...

  6. 嵌入式端音频开发(Unisound篇)之 7.1 蜂鸟M离线语音芯片简介

    这里的Unisound就是云知声啦,一家很棒的人工智能公司.下面的开发案例都是基于芯片蜂鸟M的的标准硬件板. 如果是行业的小伙伴肯定都知道这家公司了: 云知声总部位于北京,在上海.深圳.厦门设有全资子 ...

  7. 启英泰伦离线语音+蓝牙+小程序控制方案介绍

    近期,启英泰伦推出了一款可兼容离线语音识别+蓝牙控制+小程序控制的语音模块,模块型号为D02GS07J-BT. 模块简介 D02GS07J-BT模块体积小巧,长宽为37mm×40mm,工作电压为 5. ...

  8. 基于耳部脑电的语音想象脑机接口系统

    本次分享一篇发表于JNE期刊的基于耳部脑电的语音想象脑机接口系统. 摘要 本研究调查了以用户耳朵 (ear-EEG) 为中心的脑电图 (EEG) 对基于语音想象的脑机接口 (BCI) 系统的功效.开发 ...

  9. 智能离线语音取暖器解决方案

    随着技术的进步,越来越多的家庭都在使用取暖器来保持室内温度适宜.但是,传统的取暖器控制方式让人感到不便,不利于用户使用,因此诞生了取暖器智能语音解决方案. 该解决方案通过语音识别技术,将传统的操作替换 ...

  10. 语音识别插件_AnsweringMachine XS: 越狱理由之二,iPhone 电话语音答录机

    Apps & Tweaks| Jailbreak Guide| iDevices  Tweak:AnsweringMachine XSVersion:XSRepo:http://limneos ...

最新文章

  1. 独家 | ​数据科学家必知的五大深度学习框架!(附插图)
  2. 计算机考研最后四十天,2021考研最后四十天冲刺复习攻略
  3. CC攻击介绍及如何防御
  4. [css] 说说你对hasLayout的理解,触发hasLayout的方式有哪些?
  5. (转)Openlayers 2.X加载高德地图
  6. 十进制与二进制快速互转换计算心得
  7. 数据结构知识点大汇总(六)
  8. CentOS6 图形界面(gnome)安装(转)
  9. WPF Visifire 图表控件
  10. AcWing 188 武士风度的牛 题解(BFS)
  11. Android双目摄像头(带人脸检测)正确调用姿势
  12. Java(二十二) -- 生产者消费者模式
  13. PCIE Feature ------ INTx
  14. HTML屏蔽F12、右键、开发者工具、审查元素
  15. 维克森林大学计算机专业,维克森林大学计算机专业
  16. 区块链怎样运用到社交领域?
  17. python unescape函数_Python中unescape JavaScript中escape的字符
  18. 球面贴图(Sphere Map)
  19. 启明大学计算机博士,启明大学博士申请冬夏学期制-博士学位项目官网
  20. 【系统环境变量被删除如何恢复】

热门文章

  1. 什么是游戏盾,如何使用
  2. 算法快学笔记(一):算法入门
  3. 以太坊-区块链开发入门
  4. Java selenium 设置代理
  5. xshell修改服务器登录密码
  6. 一个好用的鼠标连点器
  7. 两级运放积分器的带宽分析
  8. qtdesigner页面布局
  9. java线程的五种状态
  10. vim插件配置安装与分享