Vosk是一个免费,开业,可商用,支持离线语音识别的东西,关键是可以在Unity中使用。

Vosk可以离线语音识别,也可以自建语音识别服务区,支持多种语言,还支持在Unity中使用。

整体而言,识别率还行,可以发布为windows,应该也能发布为安卓和苹果。性能还行,但是,只支持单一的中文。比如说,无法将12301识别为罗马数字而是识别成幺二三零幺。至于MP3,NBA就更无法识别了。

没找到添加新词的办法,也没找到识别音频文件办法,只能将麦克风录制的语音识别出来。

需要注意的几点

  • 语音模型解压目录不能有特殊字符
  • 第一次运行会闪退,大概是因为解压和目录
  • 发布windows后要复制dll到运行根目录

代码简单说明

初始化语音识别

StartVoskStt();//初始化的方法

开始语音识别

Task.Run(ThreadedWork).ConfigureAwait(false);//开始识别的方法

如果不用官方的麦克风录制,注释掉外面的循环和判断

        //while (_threadedBufferQueue.Count > 0)//{//if (_threadedBufferQueue.TryDequeue(out short[] voiceResult))//{_recognizer.AcceptWaveform(voiceResult, voiceResult.Length);lock (_resultLock){_threadedRecognitionResult = _recognizer.Result();}//}//}

录制的语音转换大致代码

float[] fdata
_audioClip.GetData(fdata, 0);
......
short[] sdata
for (int i = 0; i < fdata.Length; i++)
{sdata[i] = (short)Math.Floor(fdata[i] * short.MaxValue);
}
......
_recognizer.AcceptWaveform(sdata, sdata.Length);
......

演示和视频地址(https://www.bilibili.com/video/BV15Y4y1p7hT/)

Vosk可以在Unity中使用的离线语音识别

Vosk可以用于Unity的离线语音识别相关推荐

  1. 离线语音识别软件_6.语音板使用科大讯飞离线命令词识别

    0x00 离线命令词识别简介 语音识别技术(Auto Speech Recognize,简称ASR),就是把人的自然语言音频数据转换成文本数据的技术.理论上在线ASR是可以把所有的语音转换成对应的文本 ...

  2. 离线语音识别技术品鉴——功能不同各有千秋

    日前,Google推出了全新的离线语音识别模型.新模型缩小了系统中被称为"解码器图形"的部分,这个组件的功能类似于书中的索引,将音频波形与书面文字相匹配.但目前它只在谷歌键盘应用程 ...

  3. 离线语音识别芯片对比

    离线语音识别芯片对比 前言 本文关注的重点是语音识别的硬件载体:语音识别芯片,特别是离线语音识别芯片. 一. 语音识别技术的原理 定义:语音识别技术(ASR Automatic SpeechRecog ...

  4. Unity语音识别(百度AI长语句语音识别Unity原生短语语音识别)

    Unity语音识别[百度AI语音识别&Unity原生短语语音识别] 一.百度AI语音识别 1.代码块讲解 2.操作流程 3.主要功能完整代码 二.Unity原生语音识别 主要功能完整代码 三. ...

  5. 国产离线语音识别芯片哪家强?未来谁才是语音识别芯片NO.1

    离线语音识别芯片作为智能家居语音交互最成功的技术之一.在"语音识别.信号处理.发声机理和听觉机理.AI智能等等"为人工智能的支撑,语音识别,语音控制以及和WiFi/蓝牙组合是应用的 ...

  6. CK6855M1蓝牙离线语音识别灯控模组使用说明书

    CK6855M1蓝牙离线语音识别灯控模组使用说明书        一.功能说明  CK6855M1模块是一款专为灯具照明产品设计的离线蓝牙语音识别模组.模组支持红外遥控接收,支持RGB+W+Y灯控制, ...

  7. 用于 Unity 和虚幻引擎的 Asm.js 与 WebGL

    用于 Unity 和虚幻引擎的 Asm.js 与 WebGL 摘要:本文来自微软,是一个 web 开发系列文章的一部分.感谢你对实现了 SitePoint 的成员的支持. Unity 以及 Epic ...

  8. 【微信公众号开发】获取并保存access_token、jsapi_ticket票据(可用于微信分享、语音识别等等)...

    步骤一:首先得开通公众号(目的是 获得appid.AppSecret.设置安全域名)~ [公众号设置]→[功能设置] 设置相应的域名 步骤二:编写帮助类WeixinLuyinHelper中的代码 #r ...

  9. Android平台使用PocketSphinx做离线语音识别,小范围语音99%识别率

    为什么80%的码农都做不了架构师?>>>    最近语音识别很火,但是都是用的在线语音识别,研究了一下离线语音识别,小范围内的语音识别率还不错,在此记录一下 首先本文要说的两个前提1 ...

最新文章

  1. 全景分割:CVPR2019论文解析
  2. [SDOI2009]晨跑
  3. 大话IT职场之办公室环境重要吗?
  4. python主要用于后端开发还是前端,Django是用于前端还是后端?
  5. Ajax工作流程(原生Ajax)
  6. .NET/C# 使用 ConditionalWeakTable 附加字段(CLR 版本的附加属性,也可用用来当作弱引用字典 )...
  7. java国际化——Locale+数字格式
  8. 前端_网页编程 Form表单与模板引擎(中)
  9. 解决exe文件在别人电脑上运行缺失文件情况
  10. 实现高性能稳定的socket tcp通讯经验分享
  11. Targeted Topic Modeling for Focused Analysis(TTM的理解)
  12. 原创设计师如何提高影响力?到集设,让你的原创设计作品展示给世界
  13. JS:ES10新特性
  14. CASIA WebFace、WIDDER FACE、FDDB、AFLW、CelebA训练集详解
  15. 前端 angular 和 bootstrap 的安装步骤
  16. 最近win7更新后出现第二次打开IDE(delphi2007)的时候提示无法打开EditorLineEnds.ttr这个文件...
  17. VMware15安装mac10.14
  18. 2021-2027全球及中国LXP平台行业研究及十四五规划分析报告
  19. 蒙古文输入法linux版,蒙古文输入法下载 德力海蒙古文输入法 V2.1.3 官方安装版(附使用手册) 下载-脚本之家...
  20. 利用神经网络识别12306验证码——(五)训练模型

热门文章

  1. Layer.js实现表格溢出内容省略号显示,悬停显示全部
  2. python实现京东商城
  3. 软工专硕考研_03 2018年考研经验贴:西安交通大学软件工程专硕
  4. visio里的各种箭头
  5. MySQL数据库整理
  6. isabelle官网
  7. 国产cms java_国产java类cms v3.0.161109
  8. iterator的用法 | reverse_iterator的封装实现
  9. php杂谈【基础篇】之_7.PHP涉及的所有英文单词
  10. 【转】男生,请别亲手毁掉女生的猫性