首先,thchs30有两种数据库,kaldi运行的数据库最好是 thchs30-openslr。

修改run.sh里面的语音库路径  thchs30=...

修改nj线程数 等于CPU的核心数

修改cmd.sh  queue.pl 改为run.pl本地机器跑

运行出现错误:

lexicon.txt验证出错

里面binary file  matches

这是grep的问题,grep -v -a '<s>' | grep -v -a '</s>' | sort -u > data/dict/lexicon.txt || exit 1;

---------------------------------------------------------------------------------------------------------------------------

在线识别部分:

去egs下,打开voxforge,里面有个online_demo,直接考到thchs30下。在online_demo里面建2个文件夹online-data  work,在online-data下建两个文件夹audio和models,audio下放你要回放的wav,models建个文件夹tri1,把s5下的exp下的tri1下的final.mdl和35.mdl(final.mdl是快捷方式)考过去。把s5下的exp下的tri1下的graph_word里面的words.txt,和HCLG.fst,考到models的tri1下。

类似处理,包括tri2b,tri3b,tri4b,不过后者需要添加转移矩阵,final.mat以及所指的mat文件。

如下所示,例如 tri2b文件夹下,

打开online_demo的run.sh

a)将下面这段注释掉:(这段是voxforge例子中下载现网的测试语料和识别模型的。我们测试语料自己准备,模型就是tri1了)

if [ ! -s ${data_file}.tar.bz2 ]; then
    echo "Downloading test models and data ..."
    wget -T 10 -t 3 $data_url;

if [ ! -s ${data_file}.tar.bz2 ]; then
        echo "Download of $data_file has failed!"
        exit 1
    fi
fi

b) 然后再找到如下这句,将其路径改成tri1

# Change this to "tri2a" if you like to test using a ML-trained model
ac_model_type=tri2b

if [ -s $ac_model/final.mat ]; then
trans_matrix=$ac_model/final.mat
echo "set matrix"
fi

online-gmm-decode-faster --rt-min=0.5 --rt-max=0.7 --max-active=4000 \
--beam=12.0 --acoustic-scale=0.0769 --left-context=3 --right-context=3 $ac_model/final.mdl $ac_model/HCLG.fst \
$ac_model/words.txt '1:2:3:4:5' $trans_matrix;;

识别效果很差

kaldi运行thchs30例子相关推荐

  1. Kaldi运行thchs30中文语音识别教程

    转载自 https://www.jianshu.com/p/c48466d36162 这篇文章写的比较详细,适合新手入门观看,特地摘录下来以供分享和之后学习 说明 测试环境:Ubuntu16.04 建 ...

  2. Kaldi运行thchs30(清华大学中文语料库)

    Kaldi中文语音识别公共数据集一共有4个(据我所知),分别是: 1.aishell: AI SHELL公司开源178小时中文语音语料及基本训练脚本,见kaldi-master/egs/aishell ...

  3. Kaldi学习笔记(三)——运行thchs30(清华大学中文语料库)

    Kaldi中文语音识别公共数据集一共有4个(据我所知),分别是: 1.aishell: AI SHELL公司开源178小时中文语音语料及基本训练脚本,见kaldi-master/egs/aishell ...

  4. kaldi训练thchs30做在线识别

    机器环境:cpu+ubuntu16.04+24g内存,8g内存训练会出错,只能训练出单音节模型. kaldi的编译源码直接在Github上clone下来<https://github.com/k ...

  5. CentOS 6 安装Hadoop 2.6 (四)运行简单例子

    CentOS 6 安装Hadoop 2.6 (一)准备工作 CentOS 6 安装Hadoop 2.6 (二)配置Hadoop CentOS 6 安装Hadoop 2.6 (三)问题收集 CentOS ...

  6. Android-图像识别项目OpenCV(2):运行官方例子中的脸部识别程序

    上一篇文章:Android-图像识别项目OpenCV(1):技术选型以及NDK搭建 3.下载OpenCV4Android官方SDK并进行导入 SDK下载地址:http://pt.sourceforge ...

  7. 可运行的GPS获取经纬度和获取基站例子(环境Android Studio 3.5.2扒拉能运行的例子找到太辛苦了要么版本太老。)

    可运行的GPS获取经纬度和获取基站例子(环境Android Studio 3.5.2扒拉能运行的例子找到太辛苦了要么版本太老.) 为了检测GPS和基站修改结果,结合网络例子.单独抠出来可运行实例,GP ...

  8. gentos 执行sh文件_学习kaldi跑thchs30记录(run.sh代码过程)

    cmd.sh:运行配置目录,并行执行命令,通常分 run.pl, queue.pl 两种 path.sh:环境变量相关脚本(kaldi公用的全局PATH变量的设置) run.sh :整体流程控制脚本, ...

  9. Android Studio 导入OpenCV 并调试运行face-detection例子

    系统:Ubuntu 14.04 Studio版本:2.3.3 OpenCV版本:2.4.11 第一部分 将OpenCV导入到项目中 1.从Google Android 开发中文网站上下载 Androi ...

  10. kaldi运行yesno例程

    按照之前的安装方法,现在运行例程测试一下kaldi是否安装正确: wxy@Lenovo:~/kaldi-trunk/egs/yesno/s5$ ./run.sh --2018-07-17 18:48: ...

最新文章

  1. 女性程序员占比超17%,平均月薪近2万 | 程序员就业大数据报告
  2. QT学习-核心类列表-33、QtTest 34、QtUiTools
  3. ARKit从入门到精通(10)-ARKit让飞机绕着你飞起来
  4. 30个让人兴奋的视差滚动(Parallax Scrolling)效果网站
  5. 10张逻辑思维图,迅速提升你的工作能力
  6. GeForce 硬件 技术 VXGI
  7. Linux下mail服务器应用之邮件系统的安全性
  8. 变频器调试工具:ABB Drive Composer
  9. 用库仑计方法来计量电池容量
  10. 支付宝h5跳转小程序
  11. 酉矩阵(幺正矩阵、unitary matrix)
  12. vue使用插件jsbarcode 生成条码下载
  13. 嵌入式linux触摸屏校正命令,[转]基于嵌入式Linux的通用触摸屏校准程序
  14. [docker]dockerfile简介与应用
  15. 五万字,快速读完《图解TCP/IP》核心内容!!!(建议收藏)
  16. Python的一点人生经验
  17. DSP TMS320C5509A 控制DDS AD9854芯片进行AM-MSK调制
  18. 【C系列6.6】数组训练之金鱼
  19. GK309协议电子工牌数据模拟器+Socket数据发送 JAVA版-源码
  20. 怎么将pdf转换excel转换器

热门文章

  1. 安装天文基本包:kapteyn和pyslalib
  2. 单片机 多机通讯c语言,【C语言】89c52单片机的多机串口通讯,救助
  3. python的cubes怎么使用_Python之Cubes框架使用
  4. 阿里开发者招聘节 | 面试题02-04:给定一个二叉搜索树(BST),找到树中第K小的节点...
  5. leecode---40---数组,dfs---求所有的组合为target,有重复数组
  6. 策略模式与简单工厂模式
  7. 数组Array和字符串String的indexOf方法,以及ES7(ES2016)中新增的Array.prototype.includes方法...
  8. codevs——1436 孪生素数 2
  9. Bash之正则表达式
  10. 博为峰Java技术文章 ——JavaSE Swing焦点事件的处理