基于W800的AIOT离在线一体方案说明 (阿里飞燕+离线语音控制)
HLK-V40Y——AIOT离在线一体方案说明
(阿里飞燕+离线语音控制)
HLK-V40Y是海凌科电子推出的专门为离在线远场语音交互场景设计的高性能,高集成度,高性价比的语音智能IOT模组,主要面对智能家电,小家电,灯具,智能插座等产品领域。
HLK-V40Y接入生活物联网平台(阿里飞燕),生活物联网平台是一款针对智能生活领域的物联网云平台,是在阿里云IaaS和PaaS层云产品的基础上,搭建的一套公有云平台。平台提供了功能设计、嵌入式开发调试、设备安全、云端开发、App开发、运营管理、数据统计等,助力开发者和方案商从产品前期开发到后期运营的全生命周期服务。
HLK-V40Y支持单麦拾音、前端降噪、语音唤醒、离线识别等。支持150个离线命令词设置,线 3-5 米远场识别。安静环境下,识别率达到95%以上。支持 RTOS 轻量级系统,并提供简洁友好的客制化工具,快速定制语音产品,为空调、冰箱、灯具、开关等家居设备赋能。
- 方案介绍
- 功能架构
- 软件架构
HLK-V40Y架构采用分层设计,各个层次完成特定的功能封装,基本框架结构如下图所示: 各个层次功能描述如下:
硬件规范层:定义了uart、spi、i2c、gpio等芯片外设驱动的统一接口;
核心服务层:包含了操作系统内核、设备管理框架、网络协议、蓝牙协议、网络管理器等核心服务模块;
应用组件层:提供了大量的应用组件,满足不同产品需求的选择;
业务框架层:提供IoT、语音识别、人机交互等多种应用领域软件框架,简化了应用软件的编写难度。
- 软件功能
序号 |
功能 |
功能描述 |
1 |
单麦拾音 |
· 单麦克风方案 · 支持家居场景3~5m远讲 |
2 |
语音唤醒 |
· 高性能唤醒引擎 · 支持带口音的普通话 · 低误唤醒率 (< 1 false in 24 hours) |
3 |
离线识别 |
· 支持本地150条控制指令识别 |
4 |
多轮对话 |
· 一次唤醒连续对话,语音操作更加便捷自然。 |
5 |
多种发音人音色 |
· 提供标准女声、甜美女声、可爱女声、台湾女声、标准男声、女童声、男童声七种音色可选 |
6 |
UART主板对接 |
· 云知声提供标准UART协议,也支持对接用户自有协议 |
7 |
IoT对接 |
· 支持阿里飞燕云智能app控制,支持天猫精灵 |
7 |
智能设备平台 |
· 唤醒词自定义,命令词自定义,回复播报语自定义,个性化声学模型,发音人音色选择等产品自定义配置 |
8 |
OTA |
· 支持阿里生活平台固件管理及OTA |
9 |
透传功能 |
· 支持阿里透传 |
10 |
BLE |
· 支持蓝牙配网 |
- 方案说明
- 语音算法优势
针对很多产品会发出固定的噪声很大程度上影响产品的语音识别效果,比如电风扇,抽湿机,空调的风噪,以及晾衣架的电机噪声等。离线语音方案通过算法优化推出专门消除稳态噪声的语音识别模型,将识别提升约 6%。如下图所示:
|
通用模型 |
增加去风噪模型 |
场景 |
风扇 |
风扇 |
声源距离 |
3m |
3m |
声源分贝 |
70db |
70db |
风噪分贝 |
72db |
72db |
唤醒率 |
91% |
95% |
识别率 |
92% |
97% |
有限的控制命令词条和客户的个性化需求是相互矛盾的。为了满足客户可以随意根据喜好定制相应命令词的需求,本方案中加入了自学习功能模块,进入自学习模式用户可根据语音提示直接录入自己想要的命令词即可完成,同时该功能支持普通话以及各种方言。最大支持150条控制命令,7种音色可选,给您的产品智能功能夹持赋能。
开发优势
3.2.1语音快速开发
五步轻松完成定制语音产品
3.2.2 IOT快速对接
阿里云发布生活物联网平台为行业合作伙伴提供安全、稳定、高扩展、低成本的智能生活解决方案,同时还将通过阿里云的全球化部署助力中国企业走向国际化,共同打造物联网的生态圈。
- 快速智能化
传统硬件厂商可以快速定义产品功能和属性、选择认证模组、在线调试端到云链路、配置所见即所得的人机界面,从而大大节省设备上云的工作量。
- 快捷配置免开发
传统的智能硬件开发包括设备端、服务端和客户端开发,还需要面对高并发、稳定性、安全保障、运维服务等方面的问题。现在,智能硬件厂商可以快捷配置和服务选择,低成本的完成从硬件到用户交互的产品交付,并且拥有专属的运营管理中心,从而只需要专注于硬件产品本身的设计和开发。
- 灵活扩展
生活物联网平台还提供高扩展能力,包括客户端SDK和云端API,让具备开发能力和个性化需求高的厂商可以开发自主品牌App,从而深度定制自有业务体系,也可以通过云对云的方式将自有业务系统和平台对接。
- 全球化部署
通过阿里云的全球化部署,生活物联网平台在全球多个节点实现完整的全链路服务能力、统一的设备激活和漫游能力、多语言能力,助力中国企业的产品走向海外,服务国际用户。
- 支持天猫精灵、Amazon Alexa、Google Assistant、IFTTT
成本优势
集成Wi-Fi、蓝牙、离线语音一体的AIOT模组,32bit高性能CPU,支持DSP指令集以及FPU浮点运算单元,支持FFT加速,内置RAM和ROM,丰富的外围接口,支持阿里生活物联网接入。硬件和软件功能的高度集成带来的就是成本的进一步降低。
维护优势
3.4.1 OTA
支持设备端口OTA固件升级功能,减少产品售出后软件bug导致的损失,同时让您的产品持续进化。
3.4.2 多维度运营数据分析
每个项目有一个独立的运营中心,提供了一个免开发的运营管理后台,包括设备的运维监管、用户的运营统计,以及DataV大屏。运营中心目前支持中英文切换。
运营中心针对该项目下的产品、设备、用户的统计范畴如下。
功能 |
运营中心规则 |
设备运维 |
|
用户运营 |
仅统计自有App的用户(包括自有App中的内置账号和三方账号对接的用户;不包括公版App的用户;也不包括通过天猫精灵App(淘宝账号)授权的用户) |
数据大屏 |
|
应用领域
- 典型应用——智能灯带(HLK-CB103)
HLK-CB103
- 语音控制
上电后任意状态下都可使用语音控制,语音控制需要唤醒后进行控制,使用语音“你好魔方|小海小海|小凌小凌|小科小科”唤醒模块,灯带全亮双闪后可以语音操作,具体命令词如下表:
命令词 |
功能说明 |
你好魔方、你好小海、你好小凌、你好小科 |
唤醒词,以下命令需要唤醒后使用 |
进入配网模式 |
识别后进入配网模式 |
打开灯光 |
识别后RGB灯带全亮(白色) |
关闭灯光 |
识别后RGB灯带全灭 |
调为红色 |
识别后灯带调为红色 |
调为橙色 |
识别后灯带调为橙色 |
调为黄色 |
识别后灯带调为黄色 |
调为绿色 |
识别后灯带调为绿色 |
调为青色 |
识别后灯带调为青色 |
调为蓝色 |
识别后灯带调为蓝色 |
调为紫色 |
识别后灯带调为紫色 |
调为白色 |
识别后灯带调为白色 |
亮度十 |
识别后相应色灯亮度为十 |
亮度二十 |
识别后相应色灯亮度为二十 |
亮度三十 |
识别后相应色灯亮度为三十 |
亮度四十 |
识别后相应色灯亮度为四十 |
亮度五十 |
识别后相应色灯亮度为五十 |
亮度六十 |
识别后相应色灯亮度为六十 |
亮度七十 |
识别后相应色灯亮度为七十 |
亮度八十 |
识别后相应色灯亮度为八十 |
亮度九十 |
识别后相应色灯亮度为九十 |
亮度一百 |
识别后相应色灯亮度为一百 |
睡眠模式 |
识别后灯光调为睡眠模式 |
影院模式 |
识别后灯光调为影院模式 |
阅读模式 |
识别后灯光调为阅读模式 |
护眼模式 |
识别后灯光调为护眼模式 |
退下 再见 |
识别后灯带退出唤醒识别状态,无法响应语音控制,可再次唤醒 |
超时退出时间:30s,一次唤醒多次交互,唤醒设备后,超时时间内设备可以多次响应语音指令,30s内无响应语音指令则退出唤醒识别状态。 |
- APP功能
1)打开/关闭灯光
2)调节颜色亮度
3)场景模式
4)音乐律动
5)本地定时开关
应用场景
基于W800的AIOT离在线一体方案说明 (阿里飞燕+离线语音控制)相关推荐
- 离线语音控制新方案,NRK3303语音识别芯片在智能风扇的应用
随着科技的不断发展,智能家居已经成为人们日常生活中不可或缺的一部分,涌现出越来越多的智能设备,如智能门锁.智能灯泡.智能冰箱等,这些设备为人们的生活带来了更多的便利和创新.其中作为常见的风扇通过添加智 ...
- 37 手游基于 Flink CDC + Hudi 湖仓一体方案实践
简介: 介绍了 37 手游为何选择 Flink 作为计算引擎,并如何基于 Flink CDC + Hudi 构建新的湖仓一体方案. 本文作者是 37 手游大数据开发徐润柏,介绍了 37 手游为何选择 ...
- 离线语音控制芯片——智能垃圾桶语音方案
随着家居生产技术日益发展,垃圾桶也得到了快速的发展,由最初的单纯的圆筒式垃圾桶,到后来的加盖的脚踏式垃圾桶,再到现在的感应式垃圾桶,使得垃圾桶也变得越来越人性化. 智能垃圾桶语音控制方案设计需求: 现 ...
- 启英泰伦推出基于三代AIoT芯片的离在线语音识别方案
2022年7月,启英泰伦推出了为离在线方案专业定制的AIoT语音芯片CI2306,该语音芯片集成了离线语音识别+WIFI+蓝牙BLE功能,用户可以利用该语音芯片快速开发离在线语音识别方案:结合离线语音 ...
- 《基于机器视觉的输电线路交叉点在线测量方法及技术方案》论文笔记
<基于机器视觉的输电线路交叉点在线测量方法及技术方案>论文笔记 原文链接:On-line Measurement Method and Technical Scheme of Transm ...
- 百信银行基于 Apache Hudi 实时数据湖演进方案
简介:本文介绍了百信银行实时计算平台的建设情况,实时数据湖构建在 Hudi 上的方案和实践方法,以及实时计算平台集成 Hudi 和使用 Hudi 的方式. 本文介绍了百信银行实时计算平台的建设情况,实 ...
- 行泊一体方案「换道超车」,TOP10本土供应商领跑新赛道
从2021年开始,行泊一体智能驾驶方案成为中国本土供应商「换道超车」的标签.从公开信息显示,有超过20家供应商已经对外发布行泊一体方案,部分企业已经开始进入前装量产阶段. 同时,基于域控制器架构的模式 ...
- 百度天工AIoT打造农业种植方案,用数字经济助力建设农业新模式
近日,农业农村部印发了<"十四五"全国农业农村信息化发展规划>(以下简称<规划>),规划指出将全面推动现代信息技术与农业农村各领域各环节深度融合,统筹推进智 ...
- [数据湖] 基于flink hudi的批流一体实践
1.业务背景介绍 广告主和代理商通过广告投放平台来进行广告投放,由多个媒介进行广告展示 ,从而触达到潜在用户.整个过程中会产生各种各样的数据,比如展现数据.点击数据.其中非常重要的数据是计费数据,以计 ...
- 七月速递:人脸特征值同步私有化部署包发布、EdgeBoard车辆分析软硬一体方案助力交通管理智能化
本月EdgeBoard车辆分析软硬一体方案 全系列发布,包括车牌识别.车型识别等,可对车辆进行全结构化分析,助力交通智能化管理:人脸离线识别SDK配套工具人脸特征值同步私有化部署包正式发布,适用于人脸 ...
最新文章
- 通过反射执行get、set方法
- 粗糙集(Rough sets)、模糊逻辑(Fuzzy Logic)
- Android防止系统休眠
- 皮一皮:高科技产品真是防不胜防...
- 推荐系统笔记:Introduction
- 《Linux》解决Linux端口被占用
- 橡皮擦的英语_英语从零开始怎么学
- c++中的智能指针怎样释放连续的资源?
- jQuery学习之一---选择器
- 屏幕文字识别_手机长按屏幕2秒,能开启4个实用功能,一键提取图片上的文字...
- 【人脸表情识别】基于matlab LBP+LPQ算法融合人脸表情识别【含Matlab源码 432期】
- git add 后git reset --hard xxx的代码丢失,代码如何找回
- android怎实现拼图功能,基于Android的趣味拼图的实现
- Python零基础学习笔记(三十三)—— 窗体的控制...
- Pytorch模型通过paddlelite部署到嵌入式设备
- linux超级好用检索跳转工具hg:hyperlinked_grep (grep+kitty)
- syslog与syslog服务器的配置
- 【大厂面试】面试官看了赞不绝口的Redis笔记
- [Mugeda HTML5技术教程之11]Mugeda API简介
- 基于Spring事件模型实现观察者模式的工程实践