kaldi运行thchs30例子
首先,thchs30有两种数据库,kaldi运行的数据库最好是 thchs30-openslr。
修改run.sh里面的语音库路径 thchs30=...
修改nj线程数 等于CPU的核心数
修改cmd.sh queue.pl 改为run.pl本地机器跑
运行出现错误:
lexicon.txt验证出错
里面binary file matches
这是grep的问题,grep -v -a '<s>' | grep -v -a '</s>' | sort -u > data/dict/lexicon.txt || exit 1;
---------------------------------------------------------------------------------------------------------------------------
在线识别部分:
去egs下,打开voxforge,里面有个online_demo,直接考到thchs30下。在online_demo里面建2个文件夹online-data work,在online-data下建两个文件夹audio和models,audio下放你要回放的wav,models建个文件夹tri1,把s5下的exp下的tri1下的final.mdl和35.mdl(final.mdl是快捷方式)考过去。把s5下的exp下的tri1下的graph_word里面的words.txt,和HCLG.fst,考到models的tri1下。
类似处理,包括tri2b,tri3b,tri4b,不过后者需要添加转移矩阵,final.mat以及所指的mat文件。
如下所示,例如 tri2b文件夹下,
打开online_demo的run.sh
a)将下面这段注释掉:(这段是voxforge例子中下载现网的测试语料和识别模型的。我们测试语料自己准备,模型就是tri1了)
if [ ! -s ${data_file}.tar.bz2 ]; then
echo "Downloading test models and data ..."
wget -T 10 -t 3 $data_url;
if [ ! -s ${data_file}.tar.bz2 ]; then
echo "Download of $data_file has failed!"
exit 1
fi
fi
b) 然后再找到如下这句,将其路径改成tri1
ac_model_type=tri2b
if [ -s $ac_model/final.mat ]; then
trans_matrix=$ac_model/final.mat
echo "set matrix"
fi
online-gmm-decode-faster --rt-min=0.5 --rt-max=0.7 --max-active=4000 \
--beam=12.0 --acoustic-scale=0.0769 --left-context=3 --right-context=3 $ac_model/final.mdl $ac_model/HCLG.fst \
$ac_model/words.txt '1:2:3:4:5' $trans_matrix;;
识别效果很差
kaldi运行thchs30例子相关推荐
- Kaldi运行thchs30中文语音识别教程
转载自 https://www.jianshu.com/p/c48466d36162 这篇文章写的比较详细,适合新手入门观看,特地摘录下来以供分享和之后学习 说明 测试环境:Ubuntu16.04 建 ...
- Kaldi运行thchs30(清华大学中文语料库)
Kaldi中文语音识别公共数据集一共有4个(据我所知),分别是: 1.aishell: AI SHELL公司开源178小时中文语音语料及基本训练脚本,见kaldi-master/egs/aishell ...
- Kaldi学习笔记(三)——运行thchs30(清华大学中文语料库)
Kaldi中文语音识别公共数据集一共有4个(据我所知),分别是: 1.aishell: AI SHELL公司开源178小时中文语音语料及基本训练脚本,见kaldi-master/egs/aishell ...
- kaldi训练thchs30做在线识别
机器环境:cpu+ubuntu16.04+24g内存,8g内存训练会出错,只能训练出单音节模型. kaldi的编译源码直接在Github上clone下来<https://github.com/k ...
- CentOS 6 安装Hadoop 2.6 (四)运行简单例子
CentOS 6 安装Hadoop 2.6 (一)准备工作 CentOS 6 安装Hadoop 2.6 (二)配置Hadoop CentOS 6 安装Hadoop 2.6 (三)问题收集 CentOS ...
- Android-图像识别项目OpenCV(2):运行官方例子中的脸部识别程序
上一篇文章:Android-图像识别项目OpenCV(1):技术选型以及NDK搭建 3.下载OpenCV4Android官方SDK并进行导入 SDK下载地址:http://pt.sourceforge ...
- 可运行的GPS获取经纬度和获取基站例子(环境Android Studio 3.5.2扒拉能运行的例子找到太辛苦了要么版本太老。)
可运行的GPS获取经纬度和获取基站例子(环境Android Studio 3.5.2扒拉能运行的例子找到太辛苦了要么版本太老.) 为了检测GPS和基站修改结果,结合网络例子.单独抠出来可运行实例,GP ...
- gentos 执行sh文件_学习kaldi跑thchs30记录(run.sh代码过程)
cmd.sh:运行配置目录,并行执行命令,通常分 run.pl, queue.pl 两种 path.sh:环境变量相关脚本(kaldi公用的全局PATH变量的设置) run.sh :整体流程控制脚本, ...
- Android Studio 导入OpenCV 并调试运行face-detection例子
系统:Ubuntu 14.04 Studio版本:2.3.3 OpenCV版本:2.4.11 第一部分 将OpenCV导入到项目中 1.从Google Android 开发中文网站上下载 Androi ...
- kaldi运行yesno例程
按照之前的安装方法,现在运行例程测试一下kaldi是否安装正确: wxy@Lenovo:~/kaldi-trunk/egs/yesno/s5$ ./run.sh --2018-07-17 18:48: ...
最新文章
- 女性程序员占比超17%,平均月薪近2万 | 程序员就业大数据报告
- QT学习-核心类列表-33、QtTest 34、QtUiTools
- ARKit从入门到精通(10)-ARKit让飞机绕着你飞起来
- 30个让人兴奋的视差滚动(Parallax Scrolling)效果网站
- 10张逻辑思维图,迅速提升你的工作能力
- GeForce 硬件 技术 VXGI
- Linux下mail服务器应用之邮件系统的安全性
- 变频器调试工具:ABB Drive Composer
- 用库仑计方法来计量电池容量
- 支付宝h5跳转小程序
- 酉矩阵(幺正矩阵、unitary matrix)
- vue使用插件jsbarcode 生成条码下载
- 嵌入式linux触摸屏校正命令,[转]基于嵌入式Linux的通用触摸屏校准程序
- [docker]dockerfile简介与应用
- 五万字,快速读完《图解TCP/IP》核心内容!!!(建议收藏)
- Python的一点人生经验
- DSP TMS320C5509A 控制DDS AD9854芯片进行AM-MSK调制
- 【C系列6.6】数组训练之金鱼
- GK309协议电子工牌数据模拟器+Socket数据发送 JAVA版-源码
- 怎么将pdf转换excel转换器
热门文章
- 安装天文基本包:kapteyn和pyslalib
- 单片机 多机通讯c语言,【C语言】89c52单片机的多机串口通讯,救助
- python的cubes怎么使用_Python之Cubes框架使用
- 阿里开发者招聘节 | 面试题02-04:给定一个二叉搜索树(BST),找到树中第K小的节点...
- leecode---40---数组,dfs---求所有的组合为target,有重复数组
- 策略模式与简单工厂模式
- 数组Array和字符串String的indexOf方法,以及ES7(ES2016)中新增的Array.prototype.includes方法...
- codevs——1436 孪生素数 2
- Bash之正则表达式
- 博为峰Java技术文章 ——JavaSE Swing焦点事件的处理