vosk开源语音识别
文章目录
- 简介
- 安装vosk
- 测试
- 相关参考网址
简介
Vosk是一个离线开源语音识别工具。它可以识别16种语言,包括中文。
API接口,让您可以只用几行代码,即可迅速免费调用、体验功能。
目前支持 WAV声音文件格式,支持中英文等18种语言。
安装vosk
python -m pip install -U vosk
直至成功安装,比如:
Successfully installed vosk-0.3.10
测试
Running the example code with python
git clone https://github.com/alphacep/vosk-api
cd vosk-api/python/example
wget https://alphacephei.com/kaldi/models/vosk-model-small-en-us-0.3.zip
unzip vosk-model-small-en-us-0.3.zip
mv vosk-model-small-en-us-0.3 model
python3 ./test_simple.py test.wav
相关参考网址
- ASR 语音识别(VOSK)API资源/DEMO
- 官网安装说明
- 训练模型下载
- 官网示例代码
vosk开源语音识别相关推荐
- Mozilla “Common Voice” 开源语音识别项目
语音识别技术可能会彻底改变我们与机器的交互方式,但通常技术开发代价昂贵,而且有专利上的使用限制.大多数语音识别技术都被封锁在少数的大公司内.Mozilla认为这样会阻碍创新,因此它发起了"C ...
- NVIDIA背书-Kaldi是目前最受欢迎的开源语音识别框架
全球着名视觉技术厂家NVIDIA在最近的GPU技术大会为Kaldi背书.根据NVIDIA声明,它认为Kaldi是目前全球最受欢迎的开源语音识别框架.该公司在人工智能和语音识别方面投入了大量的资源,重点 ...
- 横向对比5大开源语音识别工具包,CMU Sphinx最佳
目前开源世界里存在多种不同的语音识别工具包,它们为开发者构建应用提供了很大帮助.这些工具各有哪些优劣?数据科学公司 Silicon Valley Data Science 为我们带来了 5 种流行工具 ...
- 资源 | 横向对比5大开源语音识别工具包,CMU Sphinx最佳
选自svds 作者:Cindi Thompson 机器之心编译 参与:李泽南.Smith目前开源世界里存在多种不同的语音识别工具包,它们为开发者构建应用提供了很大帮助.这些工具各有哪些优劣?数据科学公 ...
- 开源python语音识别_5 款不错的开源语音识别/语音文字转换系统
语音文字转换(speech-to-text)(STT)系统就像它名字所蕴含的意思那样,是一种将说出的单词转换为文本文件以供后续用途的方式. 语音文字转换技术非常有用.它可以用到许多应用中,例如自动转录 ...
- TFASR 开源语音识别项目解构
TFASR 开源语音识别项目解构 模型下载 AM pan.baidu.com/s/1NPk17DUr0-lBgwCkC5dFuQ 7qmd aishell-1(20 epochs) LM pan.ba ...
- julius开源语音识别引擎
开源语音识别软件HTK,对Julius和 Kaldi等系统了解者更佳 一.Installation By Source tarball Installation process is simple a ...
- Kaldi简介【开源语音识别工具】
Kaldi是当前最流行的开源语音识别工具(Toolkit),它使用WFST来实现解码算法.Kaldi的主要代码是C++编写,在此之上使用bash和 python 脚本做了一些工具. Kaldi架构如所 ...
- WAV2LETTER ++:最快的开源语音识别系统
WAV2LETTER ++:最快的开源语音识别系统 Vin ...
最新文章
- opencv-contrib-python安装
- 为没有源码的DLL文件添加强名称
- 【MFC】根据菜单创建工具栏
- python信息找人的算法_算法篇-python查找算法
- Silverlight+WCF 新手实例 象棋 棋子定位与象棋类(四)
- c 运算符重载前置++_C ++运算符重载–综合指南
- 使用Java代码发送邮件
- 51单片机8路抢答器c语言,51单片机8路抢答器
- 考研数据结构之队列(3.3)——练习题之设以数组Q.elems[maxSize]存储循环队列的元素,同时以Q.rear和Q.length分别指示循环队列中的队尾位置和队列中所含元素的个数(C表示)
- 大专毕业C/C++零基础学编程难吗?多久能就业?
- Mysql之账号管理、建库以及四大引擎【入门篇】
- 好家伙,微信能设置2个头像了!
- 在高德地图中获取鼠标点击的经纬度
- php关于页面卡顿问题
- C++ RALL机制浅谈
- [NOIP 2015TG D2T3] 运输计划
- 情不知所起,一 网 而深
- 可编程SoC(SoPC),什么是可编程SoC(SoPC)
- Quartz 实现画图片、写文字、画线、椭圆、矩形、棱形等。三
- java为什么计算时间从1970年1月1日开始
热门文章
- 马蜂窝大交通团队故障级别与解决时限
- VS2010 C# WinForm学习视频
- [翻译角]Headline English: A Captain Should Be Pitch Perfect at a Multitude of Skills (ESLPOD Blog)...
- 因为安全层不能与远程计算机协商兼容的参数,788 L2TP 连接尝试失败,因为安全层不能与远程计算机协商兼容...
- 送你一份年终总结模板+特别福利 | 工具
- 各种编程资源,持续更新
- ProcessDB实时/时序数据库——C/C++操作数据点对象
- 【游戏开发日志】【Unity】day_one
- BUUCTF-Crypto-猪圈密码及其变种+银河密码+跳舞的小人
- 8266接入华为hilink Demo之APP验证(三)