【 声明:版权所有,欢迎转载,请勿用于商业用途。 联系信箱:feixiaoxing @163.com】

语音识别是一个技术活。之前一直不是很了解,特别是听到梅尔倒谱系数、GMM、HMM、DNN、NLP这些概念的时候就头疼。今天晚上,趁着有时间,看了一下kaldi的基本代码,心里有了一些基本的概念。

1、代码地址

https://github.com/kaldi-asr/kaldi

2、主要目录

tools/,提示安装哪些第三方软件

src/,源代码目录

egs/,示例工程目录

3,主要的开发语言

cc、shell、perl

4、最简单的范例

https://github.com/kaldi-asr/kaldi/tree/master/egs/yesno/s5

5、使用方法

先编译tools下面的第三方库,接着编译src代码,最后选择一个egs工程运行,

可以参考这个链接

6、最简单的范例脚本

上面提到的yesno是最简单的工程,那我们可以看一下最简单的脚本run.sh

kaldi基本上是用脚本驱动来完成各个工程范例的,但是逻辑都比较类似

#!/bin/bashtrain_cmd="utils/run.pl"
decode_cmd="utils/run.pl"if [ ! -d waves_yesno ]; thenwget http://www.openslr.org/resources/1/waves_yesno.tar.gz || exit 1;# was:# wget http://sourceforge.net/projects/kaldi/files/waves_yesno.tar.gz || exit 1;tar -xvzf waves_yesno.tar.gz || exit 1;
fitrain_yesno=train_yesno
test_base_name=test_yesnorm -rf data exp mfcc# Data preparationlocal/prepare_data.sh waves_yesno
local/prepare_dict.sh
utils/prepare_lang.sh --position-dependent-phones false data/local/dict "<SIL>" data/local/lang data/lang
local/prepare_lm.sh# Feature extraction
for x in train_yesno test_yesno; do steps/make_mfcc.sh --nj 1 data/$x exp/make_mfcc/$x mfccsteps/compute_cmvn_stats.sh data/$x exp/make_mfcc/$x mfccutils/fix_data_dir.sh data/$x
done# Mono training
steps/train_mono.sh --nj 1 --cmd "$train_cmd" \--totgauss 400 \data/train_yesno data/lang exp/mono0a # Graph compilation
utils/mkgraph.sh data/lang_test_tg exp/mono0a exp/mono0a/graph_tgpr# Decoding
steps/decode.sh --nj 1 --cmd "$decode_cmd" \exp/mono0a/graph_tgpr data/test_yesno exp/mono0a/decode_test_yesnofor x in exp/*/decode*; do [ -d $x ] && grep WER $x/wer_* | utils/best_wer.sh; done

7、中文范例

thchs30

8、kaldi中文资料

https://download.csdn.net/download/u010384318/7768237

9、搭建自己的语音识别工程

整个kaldi是脚本驱动的,你可以在此基础上搭建自己的项目,比如参考这个链接

https://blog.csdn.net/m0_38055352/article/details/82416633

10、kaldi的学习方法

根据知乎上同学的说法,最好的kaldi学习方法就是跑样例,边看文档边调试,这样效率最高。

可以到https://www.zhihu.com/question/57230747/answer/244383490看看他们详细的说法。

随想录(从kaldi学习语音识别)相关推荐

  1. 语音识别(ASR)-- Kaldi 学习笔记

    语音识别(ASR)-- Kaldi学习笔记 语音识别简介 GMM-HMM基本原理 DNN-HMM(基于神经网络) Kaldi Kaldi架构简介 Kaldi在Windows下的安装 工具准备 编译Op ...

  2. 清华大学出版社-图书详情-《深度学习:语音识别技术实践》

    前 言 作为人工智能技术的重要组成部分,语音识别旨在研究计算机如何听懂人的讲话.来源于人工神经网络的深度学习促进了语音识别技术的发展.本书从使用开源的语音识别构建系统Kaldi开始讲起,引导读者亲自实 ...

  3. PyTorch-Kaldi 深度学习语音识别开源软件

    PyTorch-Kaldi 深度学习语音识别开源软件 论文:Ravanelli M (Mirco Ravanelli), Parcollet T, Bengio Y. The Pytorch-kald ...

  4. 基于Kaldi的语音识别

    cnblog: https://www.cnblogs.com/ye-buaascse/ 第二十九届"冯如杯"学生学术科技作 品竞赛项目论文 基于Kaldi的语音识别 摘要 近年来 ...

  5. Kaldi学习笔记(三)——运行thchs30(清华大学中文语料库)

    Kaldi中文语音识别公共数据集一共有4个(据我所知),分别是: 1.aishell: AI SHELL公司开源178小时中文语音语料及基本训练脚本,见kaldi-master/egs/aishell ...

  6. 浪潮科大讯飞Altera用OpenCL实现FPGA深度学习语音识别加速方案

    11月17日,在正在举行的2015全球超级计算大会(SC15)上,浪潮联合全球可编程逻辑芯片巨头Altera,以及中国最大的智能语音技术提供商科大讯飞,共同发布了一套面向深度学习.基于AlteraAr ...

  7. [转载]kaldi学习笔记:run.sh(egs/timit/s5)详细分析:从数据准备到特征提取

    from:http://blog.csdn.net/xingxingdeyuanwang6/article/details/47401875 首先看一下前三行: . ./cmd.sh [ -f pat ...

  8. Kaldi学习笔记:01(kaldi/egs/sitw/v1)run.sh解析

    kaldi学习笔记-01-sitw 简介 脚本修改 run.sh 简介 研究生阶段入坑了说话人识别方向,最近在学习如何使用Kaldi提取i-vector进行说话人识别,在这里记录一下学习的笔记. 这次 ...

  9. kaldi教程_赠书 | 全球稀缺的Kaldi学习资料,《Kaldi语音识别实战》给补上了

    刚刚过去的十年是语音技术发展的黄金十年.Kaldi的出现,被业内公认为极大地降低了语音识别技术学习与使用的门槛,成为广受欢迎的工具. Kaldi 项目发布不久,就吸引了国内外的大量用户,形成了一个活跃 ...

最新文章

  1. Python 进阶_OOP 面向对象编程_self 的实例绑定
  2. 003_如何创建CSS
  3. ZooKeeper Dynamic Reconfiguration (dynamicConfigFile) ZooKeeper动态配置
  4. elementui el-drawer去除自带黑色边框、允许滚动(亲测有效)
  5. ★☆★ lc 847. Shortest Path Visiting All Nodes
  6. RecyclerView用法--展示多种类型Item数据
  7. mysql adminer 导入csv_mysql导入csv的4种报错的解决方法
  8. hdu4336-Card Collector【min-max容斥,期望概率】
  9. 摩拜大数据杀熟?官方:老用户押金的确退款延迟
  10. 汇编语言---计算有符号数算式的值
  11. 设计师拥有一流导航,即是全世界
  12. java中的反射(二)
  13. HTML 编辑器简介
  14. CentOS7.9 查询内网ip
  15. 关于 “总机服务” 新增功能来电弹屏的功能说明
  16. android编程xml动画,Android中xml设置Animation动画效果详解
  17. 赤壁游戏服务器获取玩家角色信息失败,赤壁进不去呀`````没服务器````
  18. webpack对css文件打包:css-loader和style-loader版本过高问题
  19. ThinkPHP中vendor()方法导入第三方类库的用法!ThinkPHP 3.2 vendor()方法的深入研究!
  20. [react] Target container is not a DOM element

热门文章

  1. 授人以鱼不如授人以渔
  2. 关于linux内核中使用的时钟
  3. MariaDB10.2.6启用Mroonga存储引擎用于全文索引
  4. javascript-DOM-节点
  5. Swift学习之UI开发初探
  6. python 依赖包迁移(本地安装)
  7. 建站如此容易:WordPress3.9建站简明视频教程完成发布啦
  8. Spring boot与Quartz实现任务定时提醒
  9. 冒泡排序、选择排序、插入排序
  10. 在别的函数或者线程函数里使用 PostMessage