一、项目主要依赖

  • vue
  • vue-cli-plugin-electron-builder
  • electron
  • ffi-napi nodejs操作c++的dll库
  • ref-napi c++类型转换
  • js-audio-recorder 录音插件

二、下载SDK

设置好唤醒词后, 下载windowsSdk, 项目需要/bin目录下的msc_x64.dllmsc.dll (分别是64位和32位的dll, 按需使用), 以及/bin/msc/res/ivw目录下的wakeupresource.jet(语音唤醒资源文件)

三、配置项目

1. 配置externals, 用于调用第三方库

module.exports = {pluginOptions: {electronBuilder: {externals: ['ffi-napi', 'ref-napi'],}}
}

2. 配置sdk路径

由于开发模式和打包后的环境, 文件路径会产生差别, 所以需要将打包后的sdk路径进行配置

例如将sdk放在根目录的libs文件夹下, 则可以按下面配置:

module.exports = {pluginOptions: {electronBuilder: {builderOptions: {extraResources: {from: 'libs/',to: './'}}}}
}

在代码中配置路径时, 需要进行判断

let libPath = path.resolve('libs/bin/msc_x64.dll')
if (process.env.NODE_ENV !== 'development') {libPath = path.resolve('resources/bin/msc_x64.dll')
}

3. 通过ffi调用dll

1. 主要需要使用sdk的以下方法:

  • MSPLogin 登录方法
  • QIVWSessionBegin 开启语音唤醒
  • QIVWRegisterNotify 注册唤醒监听事件
  • QIVWAudioWrite 写入音频

头文件都可以在下载的sdk的include文件夹找到

int MSPAPI MSPLogin(const char* usr, const char* pwd, const char* params);typedef int( *ivw_ntf_handler)( const char *sessionID, int msg, int param1, int param2, const void *info, void *userData );const char* MSPAPI QIVWSessionBegin(const char *grammarList, const char *params, int *errorCode);int MSPAPI QIVWSessionEnd(const char *sessionID, const char *hints);int MSPAPI QIVWAudioWrite(const char *sessionID, const void *audioData, unsigned int audioLen, int audioStatus);int MSPAPI QIVWRegisterNotify(const char *sessionID, ivw_ntf_handler msgProcCb, void *userData);int MSPAPI QIVWGetResInfo(const char *resPath, char *resInfo, unsigned int *infoLen, const char *params);

2. ffi配置方法定义

方法的类型需要用到ref-napi进行转义 例如,

char* => string
int => ref.types.int
int* => ref.refType(ref.types.int)
unsigned int => ref.types.uint
回调方法 => 'pointer'

注意: char*char *性质是一样的, 都是字符串

所以, 可以把需要的方法定义如下,

const libm = ffi.Library(libPath, {MSPLogin: [ref.types.int, ['string', 'string', 'string']],QIVWSessionBegin: ['string', ['string', 'string', ref.refType(ref.types.int)]],QIVWSessionEnd: [ref.types.int, ['string', 'string']],QIVWAudioWrite: [ref.types.int, ['string', ref.refType(ref.types.void), ref.types.uint, ref.types.int]],QIVWRegisterNotify: [ref.types.int, ['string', 'pointer', ref.refType(ref.types.void)]]
})

方法的使用,就是通过 libm.MSPLogin()来调用即可

唯一需要注意的就是QIVWRegisterNotify方法, 需要传入的是一个回调函数, 上面定义时, 可以使用’pointer’占位

在调用时, 需要使用ffi.Callback创建一个回调, 传入函数中, 例如:

先查看回调函数的定义

typedef int( *ivw_ntf_handler)( const char *sessionID, int msg, int param1, int param2, const void *info, void *userData );

ffi.Callback的第一个参数是返回参数的类型, 第二个参数是传入回调函数的参数类型, 第三个参数是回调的处理

const notifyCallback = ffi.Callback(ref.types.int,['string', ref.types.int, ref.types.int, ref.types.int, ref.refType(ref.types.void), ref.refType(ref.types.void)],(sessionID, msg, param1, param2, info, userData) => {if (msg === 2) {console.log('err', param1)} else if (msg === 1) {console.log('唤醒了', info, userData)this.wakeText = '唤醒了' + Date.now()}global.sharedObj = notifyCallbackreturn 0}
)const notifyResCode = libm.QIVWRegisterNotify(this.sessionId, notifyCallback, null)

注意, 由于callback会被垃圾回收, 所以需要在调用的时候, 赋值到一个全局变量上, 比如global['变量名'] = 回调函数

3. 实时录音传递

初始化录音, 使用单声道, 16位, 16000采样率

this.recorder = new Recorder({sampleBits: 16, // 采样位数,支持 8 或 16,默认是16sampleRate: 16000, // 采样率,支持 11025、16000、22050、24000、44100、48000,根据浏览器默认值,我的chrome是48000numChannels: 1,compiling: true
})

需要使用js-audio-recorder的 V0.5.7 版本, 通过定时调用getNextData方法, 获取当前音频转成buffer传入QIVWAudioWrite方法

由于录音是一直存在缓存中的, 时间长了就会把内存占满, 导致程序崩了.

而我们使用语音唤醒, 不需要留存录音, 所以需要对使用过的音频缓存进行清除

当前的库里清除缓存的方法是clear, 而clear方法没有清除tempPCM, 还是会导致问题, 所以需要重新写个方法, 重新打包

clearCache(): void {this.lBuffer.length = 0;this.rBuffer.length = 0;this.size = 0;this.fileSize = 0;this.PCM = null;this.tempPCM = []this.audioInput = null;this.duration = 0;this.ispause = false;this.isplaying = false;this.playTime = 0;this.totalPlayTime = 0;
}

之后, 我们就可以定时调用下面方法, 来进行音频写入了

async getBuffer () {const data = this.recorder.getWholeData()let arr = []data.forEach(d => {arr = arr.concat(...Buffer.from(d.buffer))})if (this.isBegin) {const buffer = Buffer.from(arr)if (buffer.length === 0) {return}// this.ws.send(buffer)const writeRes = libm.QIVWAudioWrite(this.sessionId, buffer, buffer.length, 2)if (writeRes !== 0) {console.log('写入失败')}}this.recorder.clearCache()
}

最后

整理了一套《前端大厂面试宝典》,包含了HTML、CSS、JavaScript、HTTP、TCP协议、浏览器、VUE、React、数据结构和算法,一共201道面试题,并对每个问题作出了回答和解析。

有需要的小伙伴,可以点击文末卡片领取这份文档,无偿分享

部分文档展示:



文章篇幅有限,后面的内容就不一一展示了

有需要的小伙伴,可以点下方卡片免费领取

Electron对接语音唤醒Windows SDK相关推荐

  1. 时代拓灵离线自定义语音唤醒词SDK集成调试过程

    离线自定义唤醒词顾名思义,省去上传语音到云端在处理返回结果,直接在本机上进行处理,对于特定的词语给予反馈,不受网络环节因素限制,随时随地,自由操控 拓灵SDK demo运行效果图 集成步骤 1.前往时 ...

  2. 集成百度离在线语音唤醒/语音合成sdk

    在libs和jniLibs加入对应jar包和so库 /*** 唤醒*/ public class WakeUpUtils {private final String TAG = this.getCla ...

  3. 树莓派python语音唤醒_唤醒DuerOS Python SDK(解决声音切回树莓派的问题)

    上一主题介绍了PUTTY SSH连接和Windows远程桌面连接树莓派的方法,本文内容大多是在远程桌面下进行. 1.停止现有小度功能,因为会占用MIC资源 sudo systemctl stop du ...

  4. 科大讯飞Windows麦克风监听语音唤醒+语音识别demo

    最近在学习如何应用API来实现语言交互系统的功能,所以打算写一篇文章来整理和记录自己了解API使用的过程. 有很多平台提供语音识别等功能的API,文章使用的是科大讯飞开发的API. 使用讯飞开放平台S ...

  5. 讯飞语音唤醒SDK集成流程

    唤醒功能,顾名思义,通过语音,唤醒服务,做我们想做的事情. 效果图(开启应用后说讯飞语音或者讯飞语点唤醒) 源码下载 地址:http://download.csdn.net/detail/q48788 ...

  6. Kinect for Windows SDK开发入门

    Kinect for Windows SDK开发入门(一):开发环境配置 首先来看一下Kinect设备: 1. Kinect设备 黑色的Kinect设备如下图:基座和感应器之间有一个电动的马达,通过程 ...

  7. 乐鑫Esp32学习之旅16 学习本地语音唤醒离线识别框架 esp-skainet ,如何修改唤醒词? 如何自定义命令词?如何做意图动作?

    本系列博客学习由非官方人员 半颗心脏 潜心所力所写,仅仅做个人技术交流分享,不做任何商业用途.如有不对之处,请留言,本人及时更改. 1. 爬坑学习新旅程,虚拟机搭建esp32开发环境,打印 " ...

  8. Windows SDK编程之一 窗口示例程序

    /*Win32应用程序框架主要由"初始化窗口类","窗口注册类","窗口的创建"以"窗口消息函数"等组成*/ #incl ...

  9. 小爱同学100个奇葩回复_杰理新一代蓝牙芯片将内置小爱同学,语音唤醒、降噪、连续对话加持蓝牙音箱...

    在 11 月 20 日召开的小米 AI 生态峰会暨小爱同学 3.0 发布会上,珠海杰理科技作为小爱同学在芯片端赋能的代表企业,带来了 3 款内置小爱同学标准 SDK 的第二代降噪.语音唤醒蓝牙芯片.据 ...

最新文章

  1. java remove removeat_2016.3.12 Java中ArrayList类详解(转)
  2. 隐藏SSID无线网络ID 你的无线网络真的安全吗?
  3. mysql 同一字段分别统计,mysql查询同一个字段根据不同值分组成不同列统计
  4. 谷歌能让死去的亲人继续活在网络世界,即便他们从来不上网
  5. C++11多线程---future和promise
  6. 百度地图开发实例文章(一)
  7. 安卓适配屏幕-4.x5.x
  8. Python豆瓣书籍信息爬虫
  9. Android 8.0 VDEX机制简介
  10. sqlserver2012安装
  11. CodeBlocks下载+界面优化+创建文件+常用快捷键
  12. 【友盟+】助力故宫博物院数据化智能运营
  13. matlab变道超车_你们对新能源汽车怎么看?
  14. make: 对“all”无需做任何事
  15. os_pend_multi.c
  16. IPhone手机无法连接蓝牙
  17. 《系统架构设计》-01-架构和架构师概述
  18. linux如何给某个文件加密码,如何通过密码保护Linux上的文件夹或目录?
  19. Vue+Element-UI 上传图片,打开相机,相册
  20. 【设计模式】一:六大基本原则详解

热门文章

  1. 【工业互联网】国内外工业互联网平台对比分析研究
  2. python 权限认证 impala_python操作具有kerberos认证的hive(impala)
  3. Kindle使用指南
  4. scala的两种变量类型 var 和 val
  5. STM32F103C8T6————GPIO工作模式及其部分函数
  6. Linux 用户管理 4 之密码管理
  7. mybatis-plus调用自身的 selectById 方法报错:com.mysql.jdbc.exceptions.jdbc4.MySQLSyntaxErrorException: You hav
  8. 咸鱼ZTMS实例—心率检测
  9. 哈代-温伯格平衡定律(The Hardy-Weinberg Equilibrium)
  10. Android开发唯一的出路:进阶学习,附超全教程文档