文章目录

  • 源码下载
  • 安装依赖及工具
  • 编译kaldi代码
  • egs/yesno脚本运行
  • 结束语

kaldi,我就不做过多介绍了,源码在github上,官方教程网址是 http://kaldi-asr.org/doc/index.html。

源码下载

我的操作系统是Linux。
下载直接利用git版本控制系统就可以了,打开终端,直接在你的实验目录下的命令行输入命令:

git clone https://github.com/kaldi-asr/kaldi.git

稍等一会,提示OK后,能够看到以下文件:

  • egs :此目录为 Kaldi 例子目录,其中例子包含了不乏语音识别、语种识别、声纹识别、关键字识别等。
  • misc : 此目录包含了一些 pdf、以及相关 docker、htk 等资源
  • scripts: 此目录只用来存放 Rnnlm,以及相应的运行脚本。
  • src : 此目录为 Kaldi 的源代码目录,Kaldi 的多数算法的源代码都存放于此,其中不乏GMM、Ivector、Nnet等一系列的算法。
  • tools: 此目录主要存放 Kaldi 依赖库的安装脚本
  • windows: 此目录为在 Windows 平台运行所必须的脚本以及相关的执行程序。

安装依赖及工具

在kaldi文件夹下可以检查依赖库是否已经安装。
运行指令:tools/extras/check_dependencies.sh,会提示没有安装的包,根据脚本输出的提示安装对应包即可。

如果全部安装完成,会显示如下:

关于第三方工具,这里主要介绍必须安装的两个工具:OpenFst及CUB,具体作用就不介绍了。对应命令是在tools文件夹下,命令行依次运行指令

make openfst
make cub

第三方包还有很多,其它基本类似。等待安装成功即可。

编译kaldi代码

这是必要步骤,不要漏这一步。
编译环境kaldi使用configure命令来配置,在src目录下配置即可。
配置完成后分别运行:

make depend
make

大约要几十分钟吧。可以用-j 4作为make的参数,使用多线程加速编译。
编译完成后就可以运行其中的egs目录下的例子了。

egs/yesno脚本运行

yesno脚本是一个最简单的语音识别脚本,只能识别Yes和No(当然还有沉默)。进入对应文件夹,命令行使用./run.sh。如果前面步骤没有出错,很快就会有最后结果。
运行结果如下:

最后一行输出表示,232个测试样例全部判断准确。
最后的识别结果输出在exp/mono0a/decode_test_yesn,打开文件看看即可。

以上就是本次分享的Kaldi的helloworld步骤了。

结束语

跑通一个简单的样例后,就是对源码的阅读、探索、整理了。
希望本文能对Kaldi的新手有帮助。

Kaldi安装+编译+egs/yesno脚本运行相关推荐

  1. .NET下安装卸载WindowsService批处理脚本

    .NET下开发的WindowsService通常是采用命令行的方式进行安装,即通过C:\WINDOWS\Microsoft.NET\Framework\v4.0.30319>InstallUti ...

  2. 语音识别:安装编译Kaldi详细过程及遇到的一些问题汇总

    语音识别-Kaldi的安装编译实录(Ubuntu环境) 本篇博客用于记录一次用开源语音识别(ASR)工具Kaldi来实现中文语音识别功能的经历,记录一路遇到的一些问题.希望本篇文章可以给广大有需要的人 ...

  3. kaldi学习 - egs/yesno —— 数据准备(一)

    参考文档:http://www.cnblogs.com/welen/p/7485151.html 写在前面,本文虽然对大多数脚本进行了解释,但只是初学者的理解,如果你认为读起来不知所云,建议从 kal ...

  4. kaldi学习 - egs/yesno —— 数据准备(二)

    参考文档:http://www.cnblogs.com/welen/p/7485151.html  写在前面,本文虽然对大多数脚本进行了解释,但只是初学者的理解,如果你认为读起来不知所云,建议从 ka ...

  5. 用 powershell 脚本 .ps1 写一个自动化的「编译->链接->运行C++文件」脚本

    │ abc.cpp │ main.cpp │ test.ps1 │ └─.vscodec_cpp_properties.jsonsettings.json 我这人有个毛病:一定要用 VS Code 写 ...

  6. anaconda怎么运行python程序_第一个python程序,从安装python环境到人生第一个py脚本运行全过程...

    文章目录 前言一.安装python运行环境 1.官网https://www.python.org下载安装包.exe 2.安装python二.python模块下载 1.配置pip环境变量 2.下载pyt ...

  7. maven常用命令(编译、测试、运行、打包、安装、部署)

    我们可以在cmd中通过一系列的maven命令来对我们的maven-helloworld工程进行编译.测试.运行.打包.安装.部署. compile compile是maven工程的编译命令,作用是将s ...

  8. MAC安装MacPorts 卡在“正在运行软件包脚本”的解决办法(100%完美解决)

    MAC安装MacPorts 卡在"正在运行软件包脚本"的解决办法(100%完美解决) 1.用活动监视器 - 双击"安装器" - "退出" - ...

  9. Virtual Box+Centos7.0+Kaldi安装

    Kaldi Kaldi是一个强大的语音识别工具库(ASR),主要由Daniel Povey开发和维护.目前支持GMM-HMM.SGMM-HMM.DNN-HMM等多种语音识别的模型的训练和预测.其中DN ...

最新文章

  1. 为什么不推荐使用存储过程?
  2. 在疫情防控一线,技术能发挥什么作用?
  3. Autowired byType 与 byName 策略
  4. Cookie和Session区别
  5. java/javaee基础面试问题
  6. Spring-Aop-注解实现
  7. 常见缓存算法和LRU与LFU的c++实现
  8. trigger 触发器(mysql)
  9. php入口函数,php 常用的系统函数
  10. 【MyBatis框架】MyBatis入门程序第二部分
  11. 验证码识别算法_用Python机器学习搞定验证码
  12. 相位延迟和群延迟的区别
  13. 【干货】房地产基础知识及开发流程.pdf(附下载链接)
  14. js正则看这篇就够了
  15. geddy mysql_以ToDoList应用来学习Geddy
  16. [原]shader实现矩形圆角
  17. R-查询子段元素和 提前储存
  18. 魔方java3d,CSS3 制作魔方 - 相关立体样式
  19. 如何选择适合你的兴趣爱好(五十四),硬笔书法
  20. MySQL 的 max_allowed_packet

热门文章

  1. C语言:数字的拼音读法 (结果这么简单,真是笑死)
  2. 域名注册商评测对比:Namesilo vs Godaddy
  3. 有全量大数据了,还要用估算、抽样吗?
  4. 链表(单链表,双链表)
  5. PHP获取一个月有多少天
  6. C语言scanf()常见报错问题
  7. erp物料报废 oracle_ERP库存报废作业流程
  8. win7系统弹出appcrash错误解决方法
  9. python机器学习-朴素贝叶斯(Naive Bayes)模型建立及评估(完整代码+实现效果)
  10. 长臂挖掘机建模和分析用MapleSim