文章目录

  • 简介
  • 安装vosk
  • 测试
  • 相关参考网址

简介

Vosk是一个离线开源语音识别工具。它可以识别16种语言,包括中文。
API接口,让您可以只用几行代码,即可迅速免费调用、体验功能。
目前支持 WAV声音文件格式,支持中英文等18种语言。

安装vosk

python -m pip install -U vosk

直至成功安装,比如:

Successfully installed vosk-0.3.10

测试

Running the example code with python

git clone https://github.com/alphacep/vosk-api
cd vosk-api/python/example
wget https://alphacephei.com/kaldi/models/vosk-model-small-en-us-0.3.zip
unzip vosk-model-small-en-us-0.3.zip
mv vosk-model-small-en-us-0.3 model
python3 ./test_simple.py test.wav

相关参考网址

  • ASR 语音识别(VOSK)API资源/DEMO
  • 官网安装说明
  • 训练模型下载
  • 官网示例代码

vosk开源语音识别相关推荐

  1. Mozilla “Common Voice” 开源语音识别项目

    语音识别技术可能会彻底改变我们与机器的交互方式,但通常技术开发代价昂贵,而且有专利上的使用限制.大多数语音识别技术都被封锁在少数的大公司内.Mozilla认为这样会阻碍创新,因此它发起了"C ...

  2. NVIDIA背书-Kaldi是目前最受欢迎的开源语音识别框架

    全球着名视觉技术厂家NVIDIA在最近的GPU技术大会为Kaldi背书.根据NVIDIA声明,它认为Kaldi是目前全球最受欢迎的开源语音识别框架.该公司在人工智能和语音识别方面投入了大量的资源,重点 ...

  3. 横向对比5大开源语音识别工具包,CMU Sphinx最佳

    目前开源世界里存在多种不同的语音识别工具包,它们为开发者构建应用提供了很大帮助.这些工具各有哪些优劣?数据科学公司 Silicon Valley Data Science 为我们带来了 5 种流行工具 ...

  4. 资源 | 横向对比5大开源语音识别工具包,CMU Sphinx最佳

    选自svds 作者:Cindi Thompson 机器之心编译 参与:李泽南.Smith目前开源世界里存在多种不同的语音识别工具包,它们为开发者构建应用提供了很大帮助.这些工具各有哪些优劣?数据科学公 ...

  5. 开源python语音识别_5 款不错的开源语音识别/语音文字转换系统

    语音文字转换(speech-to-text)(STT)系统就像它名字所蕴含的意思那样,是一种将说出的单词转换为文本文件以供后续用途的方式. 语音文字转换技术非常有用.它可以用到许多应用中,例如自动转录 ...

  6. TFASR 开源语音识别项目解构

    TFASR 开源语音识别项目解构 模型下载 AM pan.baidu.com/s/1NPk17DUr0-lBgwCkC5dFuQ 7qmd aishell-1(20 epochs) LM pan.ba ...

  7. julius开源语音识别引擎

    开源语音识别软件HTK,对Julius和 Kaldi等系统了解者更佳 一.Installation By Source tarball Installation process is simple a ...

  8. Kaldi简介【开源语音识别工具】

    Kaldi是当前最流行的开源语音识别工具(Toolkit),它使用WFST来实现解码算法.Kaldi的主要代码是C++编写,在此之上使用bash和 python 脚本做了一些工具. Kaldi架构如所 ...

  9. WAV2LETTER ++:最快的开源语音识别系统

                                                                           WAV2LETTER ++:最快的开源语音识别系统 Vin ...

最新文章

  1. opencv-contrib-python安装
  2. 为没有源码的DLL文件添加强名称
  3. 【MFC】根据菜单创建工具栏
  4. python信息找人的算法_算法篇-python查找算法
  5. Silverlight+WCF 新手实例 象棋 棋子定位与象棋类(四)
  6. c 运算符重载前置++_C ++运算符重载–综合指南
  7. 使用Java代码发送邮件
  8. 51单片机8路抢答器c语言,51单片机8路抢答器
  9. 考研数据结构之队列(3.3)——练习题之设以数组Q.elems[maxSize]存储循环队列的元素,同时以Q.rear和Q.length分别指示循环队列中的队尾位置和队列中所含元素的个数(C表示)
  10. 大专毕业C/C++零基础学编程难吗?多久能就业?
  11. Mysql之账号管理、建库以及四大引擎【入门篇】
  12. 好家伙,微信能设置2个头像了!
  13. 在高德地图中获取鼠标点击的经纬度
  14. php关于页面卡顿问题
  15. C++ RALL机制浅谈
  16. [NOIP 2015TG D2T3] 运输计划
  17. 情不知所起,一 网 而深
  18. 可编程SoC(SoPC),什么是可编程SoC(SoPC)
  19. Quartz 实现画图片、写文字、画线、椭圆、矩形、棱形等。三
  20. java为什么计算时间从1970年1月1日开始

热门文章

  1. 马蜂窝大交通团队故障级别与解决时限
  2. VS2010 C# WinForm学习视频
  3. [翻译角]Headline English: A Captain Should Be Pitch Perfect at a Multitude of Skills (ESLPOD Blog)...
  4. 因为安全层不能与远程计算机协商兼容的参数,788 L2TP 连接尝试失败,因为安全层不能与远程计算机协商兼容...
  5. 送你一份年终总结模板+特别福利 | 工具
  6. 各种编程资源,持续更新
  7. ProcessDB实时/时序数据库——C/C++操作数据点对象
  8. 【游戏开发日志】【Unity】day_one
  9. BUUCTF-Crypto-猪圈密码及其变种+银河密码+跳舞的小人
  10. 8266接入华为hilink Demo之APP验证(三)