kaldi运行thchs30例子

首先，thchs30有两种数据库，kaldi运行的数据库最好是 thchs30-openslr。

修改run.sh里面的语音库路径 thchs30=...

修改nj线程数等于CPU的核心数

修改cmd.sh queue.pl 改为run.pl本地机器跑

运行出现错误:

lexicon.txt验证出错

里面binary file matches

这是grep的问题，grep -v -a '<s>' | grep -v -a '</s>' | sort -u > data/dict/lexicon.txt || exit 1;

---------------------------------------------------------------------------------------------------------------------------

在线识别部分：

去egs下，打开voxforge，里面有个online_demo，直接考到thchs30下。在online_demo里面建2个文件夹online-data work,在online-data下建两个文件夹audio和models，audio下放你要回放的wav，models建个文件夹tri1，把s5下的exp下的tri1下的final.mdl和35.mdl（final.mdl是快捷方式）考过去。把s5下的exp下的tri1下的graph_word里面的words.txt,和HCLG.fst，考到models的tri1下。

类似处理，包括tri2b,tri3b,tri4b，不过后者需要添加转移矩阵，final.mat以及所指的mat文件。

如下所示，例如 tri2b文件夹下，

打开online_demo的run.sh

a)将下面这段注释掉：（这段是voxforge例子中下载现网的测试语料和识别模型的。我们测试语料自己准备，模型就是tri1了）

if [ ! -s ${data_file}.tar.bz2 ]; then
echo "Downloading test models and data ..."
wget -T 10 -t 3 $data_url;

if [ ! -s ${data_file}.tar.bz2 ]; then
echo "Download of $data_file has failed!"
exit 1
fi
fi

b) 然后再找到如下这句，将其路径改成tri1

# Change this to "tri2a" if you like to test using a ML-trained model
ac_model_type=tri2b

if [ -s $ac_model/final.mat ]; then
trans_matrix=$ac_model/final.mat
echo "set matrix"
fi

online-gmm-decode-faster --rt-min=0.5 --rt-max=0.7 --max-active=4000 \
--beam=12.0 --acoustic-scale=0.0769 --left-context=3 --right-context=3 $ac_model/final.mdl $ac_model/HCLG.fst \
$ac_model/words.txt '1:2:3:4:5' $trans_matrix;;

识别效果很差

kaldi运行thchs30例子相关推荐

Kaldi运行thchs30中文语音识别教程
转载自 https://www.jianshu.com/p/c48466d36162 这篇文章写的比较详细,适合新手入门观看,特地摘录下来以供分享和之后学习说明测试环境:Ubuntu16.04 建 ...
Kaldi运行thchs30（清华大学中文语料库）
Kaldi中文语音识别公共数据集一共有4个(据我所知),分别是: 1.aishell: AI SHELL公司开源178小时中文语音语料及基本训练脚本,见kaldi-master/egs/aishell ...
Kaldi学习笔记（三）——运行thchs30（清华大学中文语料库）
Kaldi中文语音识别公共数据集一共有4个(据我所知),分别是: 1.aishell: AI SHELL公司开源178小时中文语音语料及基本训练脚本,见kaldi-master/egs/aishell ...
kaldi训练thchs30做在线识别
机器环境:cpu+ubuntu16.04+24g内存,8g内存训练会出错,只能训练出单音节模型. kaldi的编译源码直接在Github上clone下来<https://github.com/k ...
CentOS 6 安装Hadoop 2.6 （四）运行简单例子
CentOS 6 安装Hadoop 2.6 (一)准备工作 CentOS 6 安装Hadoop 2.6 (二)配置Hadoop CentOS 6 安装Hadoop 2.6 (三)问题收集 CentOS ...
Android-图像识别项目OpenCV（2）：运行官方例子中的脸部识别程序
上一篇文章:Android-图像识别项目OpenCV(1):技术选型以及NDK搭建 3.下载OpenCV4Android官方SDK并进行导入 SDK下载地址:http://pt.sourceforge ...
可运行的GPS获取经纬度和获取基站例子(环境Android Studio 3.5.2扒拉能运行的例子找到太辛苦了要么版本太老。)
可运行的GPS获取经纬度和获取基站例子(环境Android Studio 3.5.2扒拉能运行的例子找到太辛苦了要么版本太老.) 为了检测GPS和基站修改结果,结合网络例子.单独抠出来可运行实例,GP ...
gentos 执行sh文件_学习kaldi跑thchs30记录（run.sh代码过程）
cmd.sh:运行配置目录,并行执行命令,通常分 run.pl, queue.pl 两种 path.sh:环境变量相关脚本(kaldi公用的全局PATH变量的设置) run.sh :整体流程控制脚本, ...
Android Studio 导入OpenCV 并调试运行face-detection例子
系统:Ubuntu 14.04 Studio版本:2.3.3 OpenCV版本:2.4.11 第一部分将OpenCV导入到项目中 1.从Google Android 开发中文网站上下载 Androi ...
kaldi运行yesno例程
按照之前的安装方法,现在运行例程测试一下kaldi是否安装正确: wxy@Lenovo:~/kaldi-trunk/egs/yesno/s5$ ./run.sh --2018-07-17 18:48: ...

kaldi运行thchs30例子

kaldi运行thchs30例子相关推荐

最新文章

热门文章