基于WT2605C-32N音频蓝牙语音芯片的实时录音上传技术方案介绍
现代社会,信息技术的发展尤其迅速,信息和数据的重要性和安全性日渐深刻,在某些特殊场合,因为工作上的需要,或者日常生活的需求,往往需要记录和保留一些重要的声音。在某些时刻,录音成为记录生活,保存证据的重要手段,可见,录音技术对于我们现代生活尤为重要。
而随着录音技术的发展,一种实时录音技术受到更多人青睐,相比较于传统录音而言,实时录音技术突破了设备的限制,从单纯的录音设备扩展到我们的云端,随时随地即可分享,实现了我们录音数据的可交互性,在实际应用中给提升了我们产品的应用价值,给用户带来更完美的体验感受。
唯创知音一直致力于成为语音物联网界的领导者,自主研发了一种实时录音技术上传技术,在录音笔,录音耳机等录音设备上面应用广泛,这种实时录音技术,具有数据量小,失真率低,降噪效果明显等特点,通过外部蓝牙设备,即可实现云端存储,云端即时播放等功能。不仅如此,这种录音上传技术因为其通用性强,广泛应用于唯创知音自主研发的各类蓝牙芯片上,下面我们以其中一种方案作简单的介绍:
WT2605C-32N录音上传方案介绍
- 方案概述
录音上传技术近些年在录音笔,录音耳机中应用广泛,实现了移动录音设备和云端的互联,即时播放,即时翻译,同声传译成为产品一大亮点,极大方便了我们的生活。而要保证这些功能的实现,就离不开高品质的录音效果,和高压缩的录音数据,本方案录音采用IMA-ADPCM压缩算法。IMA-ADPCM (ADPCM Adaptive Differential Pulse Code Modulation), 是一种针对 16bit声音波形数据的一种有损压缩算法, 它将声音流中每次采的16bit 数据以 4bit 存储, 所以压缩比1:4。而压缩/解压缩算法非常的简单, 所以是一种低空间消耗,高质量声音获得的好途径。
- 方案框图
本方案采用WT2605C-32N芯片,可外挂本地存储设备,通过串口与蓝牙透传芯片进行通信,将录音数据上发给云端设备。
- 方案原理图
- 用户协议
- 协议命令格式
通讯数据格式是:起始位:1位;数据位:8位;奇偶位:无;停止位:1位。发送的指令都为十六进制的格式,默认波特率为115200,可进行修改,但不可小于115200波特率。使用电脑串口调试助手,需要正确设置串口的参数,设置如图:
起始码 |
长度 |
命令码 |
参数 |
累加和校验 |
结束码 |
0X7E |
见下文 |
见下文 |
见下文 |
见下文 |
0XEF |
注意:“长度”是指长度+命令码+参数+校验和的长度,“累加和校验”是指长度+命令码+参数的累加和的低八位。
- 返回码格式
起始码 |
长度 |
命令 |
参数 |
校验码 |
结束码 |
0X7E |
04 |
XX |
XX |
XX |
0XEF |
参数:00 :表示执行成功, 开始录音
01 :表示执行错误
02 : 表示文件不存在
- 命令列表
- 录音开始命令(D6)
APP发送此条指令,控制录音芯片开始录音,此时录音芯片会返回开始录音成功返回码,录音过程中发送此条命令返回错误;
起始码 |
长度 |
命令 |
校验码 |
结束码 |
7E |
03 |
D6 |
D9 |
EF |
开始录音返回码:
起始码 |
长度 |
命令 |
参数 |
校验码 |
结束码 |
7E |
04 |
D6 |
00 |
DA |
EF |
APP收到开始录音返回码,则开始准备处理接收到的录音数据,此时芯片进入录音状态,同时开始发送录音数据包。
首先录音芯片会发送一包60个字节的音频数据包,该包数据为IMA-ADPCM格式音频数据的音频头,前面包含“RIFF”标志和文件大小,注意此时ChunkSize 为0X00000034不包含当前音频数据包的长度,因此整个音频数据包的头长度为0X08+0X34,也就是60个字节的长度。客户需要录音结束并接收完整个数据包之后,重写这个位置。
例如,当前文件的音频头标识如下,
接下来的音频头包含Format Chunk 块和Fact Chunk,客户不用关心实际数据情况。
最后的音频数据头包含Data Chunk 客户需要录音结束并接收完整个数据包之后,重写DataChunkSize这个位置
音频数据头发送完毕后,紧接着会发送音频数据包,按照目前设置,每个数据包C长度为256个字节,受限于每个手机蓝牙MTU限制,每包数据量不能超过手机默认的MTU值,所以这里按照最小MTU值128字节进行配置,将数据包C分两包A+B数据包发送,A和B每包数据量为128字节, 每包数据的间隔为10MS左右, 每个C包数据包间隔为60MS左右(根据录音码率决定,不可更改),即每一个C包数据包含整个nBlockAlign ,发送过程中即使某包数据丢失,也不会影响整个文件的播放。
当客户开始接收音频数据包的时候,客户APP需要记录录音结束前总的音频数据包的个数,比如APP在结束录音时候共接收到0X36包音频数据包,则总的音频数据的长度为 0X36 * 0X100 = 0X3600;
- 录音结束命令(DA)
APP发送此条指令,录音芯片接收到录音结束命令,停止发送录音数据包,并结束当前录音,返回结束录音返回码;
起始码 |
长度 |
命令 |
校验码 |
结束码 |
7E |
03 |
DA |
DD |
EF |
结束录音返回码:
起始码 |
长度 |
命令 |
参数 |
校验码 |
结束码 |
7E |
04 |
DA |
00 |
DD |
EF |
APP收到结束录音返回码,则保存当前录音文件,并将数据长度重写到文件相关位置,如图所示。至此,录音上传完成。
- 程序设计框图
- 应用实例
下面我们用唯创WT-RS2 APP软件进行实际测试录音上传功能,首先打开APP,选择MP3方案;
连接蓝牙名称为VT-A782的蓝牙设备,连接成功后,APP界面默认会打印当前蓝牙设备的蓝牙MAC地址,唯创知音可以为每台蓝牙设备可以设置不同的的MAC地址,从而形成单独唯一的蓝牙名称,在某些应用场合,为每台产品形成唯一身份码。
点击APP界面开始录音标志,此时APP按照时间创建录音文件,此时开始接收录音数据,每个A和B包数据间隔10MS,每个C包数据间隔60MS,直到点击APP结束录音按钮,此时APP显示录音结束。此时录音文件已经创建完毕,客户可通过APP界面将录音文件通过分享的方式发送到电脑或者其他播放器进行播放!
唯创知音作为一家专注于语音技术研究的高新技术企业,始终坚持以“服务好工程师”
为目标,以行业语音交互器件标准化为方向,致力于让复杂变简单,提供快捷的语音、智能物联网应用解决方案。WT588F02B、WT2003H系列语音芯片应用设计方案,在智能闹钟、智能水杯、雾化器等消费电子行业领域内已有成熟的应用案例。消费类电子产品应用是公司重要的发展领域,未来,唯创知音将在更多行业推出标准化语音芯片,进一步提升工程师的设计体验,为消费类电子行业标准化赋能。
基于WT2605C-32N音频蓝牙语音芯片的实时录音上传技术方案介绍相关推荐
- 【无标题】音频蓝牙语音芯片,WT2605C-32N实时录音上传技术方案介绍
基于WT2605C-32N音频蓝牙语音芯片的实时录音上传技术方案介绍 现代社会,信息技术的发展尤其迅速,信息和数据的重要性和安全性日渐深刻,在某些特殊场合,因为工作上的需要,或者日常生活的需求,往往需 ...
- WT588F02B语音芯片在智能垃圾桶上的应用设计方案介绍
WT588F02B智能垃圾桶方案设计实例 1.方案概述 本设计满足了一下功能要求: )当有人在垃圾桶附近时,垃圾桶便会自动翻盖,并发出垃圾分类的提示音: )当远离垃圾桶5秒后自动合盖,发出感谢的声音: ...
- pyaudio:基于pyaudio利用Python编程从电脑端录制音频保存到指定文件夹+将录音上传服务器+录音进行识别并转为文本保存
pyaudio:基于pyaudio利用Python编程从电脑端录制音频保存到指定文件夹+将录音上传服务器+录音进行识别并转为文本保存 目录 输出结果 代码实现 输出结果 代码实现 # -*- codi ...
- 硬件采集数据怎么上传服务器,如何使用4G蓝牙网关进行数据采集和数据上传
原标题:如何使用4G蓝牙网关进行数据采集和数据上传 从技术效果上看,WiFi拥有宽带高.传输速度快等优点主要用于电脑.智能手机等的通信.蓝牙通信技术拥有功耗低,传输速率快等优点,是目前适用于数据采集和 ...
- 基于ruoyi+vue+elementUI实现列表,新增,附件上传,tab+springBoot+mybatis+oracle序列+批量新增
基于ruoyi+vue+elementUI实现列表,新增,附件上传,tab+springBoot+mybatis+oracle序列+批量新增 页面效果 列表页面 新增页面 详情页面 代码实现 列表+新 ...
- Java服务器部署基于OpenCV的C++图像处理项目(三)图片上传并返回处理图
Java服务器部署基于OpenCV的C++图像处理项目(三)图片上传并返回处理图 1.上传图片并返回灰度图功能 由于使用的springboot开发,直接写一个upload接口供图片上传,以下是spri ...
- 蓝牙语音芯片模块数传音频BLE选型 支持mp3播放外挂spiflash双模
蓝牙系列产品分类 一.简介 目前我们所主推的蓝牙方案,包含BT201方案.BT301方案.BT321F方案.BT401方案.这些方案都是为了满足不同的应用场景.[遵循的原则就是硬件相同 软件不同来满 ...
- 基于红外遥控的智能语音芯片在空调中的应用
启英泰伦开发的红外应用方案,不需要改变空调原有设计,只需要一个语音遥控器,即可让传统空调摇身一变,"能听会说",不仅安装简单,也极大降低了生产和购买成本.现有的成品开发形式主要有两 ...
- c语言实现语音检测vad_TWS+AI?国芯发布超低功耗语音芯片,可能是目前最理想方案...
7月21日,杭州国芯举办以"智慧穿戴,从「芯」启航"为主题的线上发布会,推出了超低功耗AI芯片GX8002,采用MCU+自研NPU架构,单芯片实现实时语音唤醒功能,VAD待机模式下 ...
最新文章
- 数据结构实验之链表二:逆序建立链表
- python 去除多个换行
- python常用操作符_Python--3常用操作符
- 如何将外部邮箱添加至Exchange邮件组中
- centos 输入密码正确进不去系统
- C#中的9个“黑魔法”与“骚操作”
- 1801 不重复的三位数
- TabHost和ActivityGroup用法
- 某集团BI决策系统建设方案分享
- leetcode题库124-- 二叉树中的最大路径和
- 基于MATLAB的图像复原
- 做网赚赚不到钱,你的方法用对了么?
- 磁耦隔离与传统隔离的区别
- 深圳绿色建筑数量和规模居全国榜首 建筑人才需求增加
- java项目经理负责做什么的,项目经理JAVA岗位职责
- html旋转线条,html5 – 为什么我在移动浏览器上看到旋转的条纹?
- 字节、KB、MB、GB 之间的换算关系 Bps和bps的区别
- mysql locate索引_MYSQL索引优化
- 史上最通俗易懂的ASM教程
- .net4.7.2在win7安装失败