Vosk可以用于Unity的离线语音识别
Vosk是一个免费,开业,可商用,支持离线语音识别的东西,关键是可以在Unity中使用。
Vosk可以离线语音识别,也可以自建语音识别服务区,支持多种语言,还支持在Unity中使用。
整体而言,识别率还行,可以发布为windows,应该也能发布为安卓和苹果。性能还行,但是,只支持单一的中文。比如说,无法将12301识别为罗马数字而是识别成幺二三零幺。至于MP3,NBA就更无法识别了。
没找到添加新词的办法,也没找到识别音频文件办法,只能将麦克风录制的语音识别出来。
需要注意的几点
- 语音模型解压目录不能有特殊字符
- 第一次运行会闪退,大概是因为解压和目录
- 发布windows后要复制dll到运行根目录
代码简单说明
初始化语音识别
StartVoskStt();//初始化的方法
开始语音识别
Task.Run(ThreadedWork).ConfigureAwait(false);//开始识别的方法
如果不用官方的麦克风录制,注释掉外面的循环和判断
//while (_threadedBufferQueue.Count > 0)//{//if (_threadedBufferQueue.TryDequeue(out short[] voiceResult))//{_recognizer.AcceptWaveform(voiceResult, voiceResult.Length);lock (_resultLock){_threadedRecognitionResult = _recognizer.Result();}//}//}
录制的语音转换大致代码
float[] fdata
_audioClip.GetData(fdata, 0);
......
short[] sdata
for (int i = 0; i < fdata.Length; i++)
{sdata[i] = (short)Math.Floor(fdata[i] * short.MaxValue);
}
......
_recognizer.AcceptWaveform(sdata, sdata.Length);
......
演示和视频地址(https://www.bilibili.com/video/BV15Y4y1p7hT/)
Vosk可以在Unity中使用的离线语音识别
Vosk可以用于Unity的离线语音识别相关推荐
- 离线语音识别软件_6.语音板使用科大讯飞离线命令词识别
0x00 离线命令词识别简介 语音识别技术(Auto Speech Recognize,简称ASR),就是把人的自然语言音频数据转换成文本数据的技术.理论上在线ASR是可以把所有的语音转换成对应的文本 ...
- 离线语音识别技术品鉴——功能不同各有千秋
日前,Google推出了全新的离线语音识别模型.新模型缩小了系统中被称为"解码器图形"的部分,这个组件的功能类似于书中的索引,将音频波形与书面文字相匹配.但目前它只在谷歌键盘应用程 ...
- 离线语音识别芯片对比
离线语音识别芯片对比 前言 本文关注的重点是语音识别的硬件载体:语音识别芯片,特别是离线语音识别芯片. 一. 语音识别技术的原理 定义:语音识别技术(ASR Automatic SpeechRecog ...
- Unity语音识别(百度AI长语句语音识别Unity原生短语语音识别)
Unity语音识别[百度AI语音识别&Unity原生短语语音识别] 一.百度AI语音识别 1.代码块讲解 2.操作流程 3.主要功能完整代码 二.Unity原生语音识别 主要功能完整代码 三. ...
- 国产离线语音识别芯片哪家强?未来谁才是语音识别芯片NO.1
离线语音识别芯片作为智能家居语音交互最成功的技术之一.在"语音识别.信号处理.发声机理和听觉机理.AI智能等等"为人工智能的支撑,语音识别,语音控制以及和WiFi/蓝牙组合是应用的 ...
- CK6855M1蓝牙离线语音识别灯控模组使用说明书
CK6855M1蓝牙离线语音识别灯控模组使用说明书 一.功能说明 CK6855M1模块是一款专为灯具照明产品设计的离线蓝牙语音识别模组.模组支持红外遥控接收,支持RGB+W+Y灯控制, ...
- 用于 Unity 和虚幻引擎的 Asm.js 与 WebGL
用于 Unity 和虚幻引擎的 Asm.js 与 WebGL 摘要:本文来自微软,是一个 web 开发系列文章的一部分.感谢你对实现了 SitePoint 的成员的支持. Unity 以及 Epic ...
- 【微信公众号开发】获取并保存access_token、jsapi_ticket票据(可用于微信分享、语音识别等等)...
步骤一:首先得开通公众号(目的是 获得appid.AppSecret.设置安全域名)~ [公众号设置]→[功能设置] 设置相应的域名 步骤二:编写帮助类WeixinLuyinHelper中的代码 #r ...
- Android平台使用PocketSphinx做离线语音识别,小范围语音99%识别率
为什么80%的码农都做不了架构师?>>> 最近语音识别很火,但是都是用的在线语音识别,研究了一下离线语音识别,小范围内的语音识别率还不错,在此记录一下 首先本文要说的两个前提1 ...
最新文章
- 全景分割:CVPR2019论文解析
- [SDOI2009]晨跑
- 大话IT职场之办公室环境重要吗?
- python主要用于后端开发还是前端,Django是用于前端还是后端?
- Ajax工作流程(原生Ajax)
- .NET/C# 使用 ConditionalWeakTable 附加字段(CLR 版本的附加属性,也可用用来当作弱引用字典 )...
- java国际化——Locale+数字格式
- 前端_网页编程 Form表单与模板引擎(中)
- 解决exe文件在别人电脑上运行缺失文件情况
- 实现高性能稳定的socket tcp通讯经验分享
- Targeted Topic Modeling for Focused Analysis(TTM的理解)
- 原创设计师如何提高影响力?到集设,让你的原创设计作品展示给世界
- JS:ES10新特性
- CASIA WebFace、WIDDER FACE、FDDB、AFLW、CelebA训练集详解
- 前端 angular 和 bootstrap 的安装步骤
- 最近win7更新后出现第二次打开IDE(delphi2007)的时候提示无法打开EditorLineEnds.ttr这个文件...
- VMware15安装mac10.14
- 2021-2027全球及中国LXP平台行业研究及十四五规划分析报告
- 蒙古文输入法linux版,蒙古文输入法下载 德力海蒙古文输入法 V2.1.3 官方安装版(附使用手册) 下载-脚本之家...
- 利用神经网络识别12306验证码——(五)训练模型