1. 命令行格式

在AMI数据集中num-leaves=5000(即5000个不同的states),tot-gauss=80000(平均每个不同states 高斯模型数目是16个).

"Usage: steps/tandem/train_deltas.sh <num-leaves> <tot-gauss> <data1-dir> <data2-dir> <lang-dir> <alignment-dir> <exp-dir>"

2. 训练步骤总览

1)Train a monophone system (or use previously built triphone system) to get time alignments for data.

2)Build a “decision tree” for each “monophone”.

3)For each seen triphone, accumulate sufficient statistics to train a single Gaussian per HMM state。得到的statistics存放在exp/tri1/treeacc文件。

3. Build “decision tree”

1) get questions

We cluster the phones to get questions.

A question is just a set of phones,Would normally be a phonetic category.

Here, just clusters based on acoustic similarity.

# preparing questions, roots file...cluster-phones $dir/treeacc $lang/phones/sets.int $dir/questions.int 2> $dir/log/questions.log || exit 1;

得到的questions如下:

2) Compiling the questions

Program “compile-questions” takes lists of phonemes...  Transforms it into a C++ object (written to disk) that contains questions for each “key” in EventMap.

3) Setting tree roots

4) Building the decision tree

5) Build好后的decision tree存在文件tree里,tree里的信息如下:

4.treeacc文件内容

Kaldi AMI数据集脚本学习7---train_deltas.sh相关推荐

  1. Kaldi AMI数据集脚本学习2----run_prepare_shared.sh

    在学习脚本文件时,重点关注哪些是调用标准函数,哪些是调用特定数据集的数据处理函数; 关注每个阶段处理的输入,输出和控制参数.不要面面俱到,试图理解每行代码. 1. 下载AMI数据集的xml标注文件包: ...

  2. Kaldi AMI数据集脚本学习3---run_ihm.sh stage 1~3

    1. stage 1 在此之前,已经下载了130G的AMI数据在目录$AMI_DIR(wav_db/amicorpus)了. # Prepare ihm data directories, if [ ...

  3. Kaldi AMI数据集脚本学习1----cmd.sh和path.sh

    1.  cmd.sh 我是在个人电脑上运行Kaldi的,所以脚本关键内容如下: export train_cmd=run.pl export decode_cmd=run.pl export tfrn ...

  4. Kaldi AMI数据集脚本学习4---train_mono.sh

    1. 缺省配置 nj=4 并行个数 cmd=run.pl 处理程序 scale_opts="--transition-scale=1.0 --acoustic-scale=0.1 --sel ...

  5. Kaldi AMI数据集脚本学习6---转移模型(Transition Model)

    TransitionModel 涉及到的名词术语如下: phone (one-based): this type of identifier is used throughout the toolki ...

  6. Kaldi AMI数据集脚本学习5---AMI mono phone文件 40.mdl分析

    使用kaldi训练mono phone之后会在esp/mono/目录下产生一个40.mdl文件, 查看exp/mono/40.mdl 命令: kaldi/src/gmmbin/gmm-copy --b ...

  7. 《kaldi语音识别实战》阅读笔记:三音素模型训练—train_deltas.sh解析

    一.使用说明 1.1 描述 训练三音素模型.与单音素模型训练相比,因为建模单元变为三音素,因此多了决策树状态绑定. steps/deltas.sh Usage: steps/train_deltas. ...

  8. Kaldi决策树状态绑定学习笔记(一)

    建议在csdn资源页中免费下载该学习笔记的PDF版进行阅读:)点击进入下载页面 Kaldi决策树状态绑定学习笔记(一) --如何累积相关统计量? 目录 Kaldi决策树状态绑定学习笔记一 如何累积相关 ...

  9. Kaldi三音素GMM学习笔记

    建议在csdn资源页中免费下载该学习笔记的PDF版进行阅读:)点击进入下载页面 Kaldi三音素GMM学习笔记 三音素GMM与单音素GMM的主要差别在于决策树状态绑定,与GMM参数更新相关的原理.程序 ...

最新文章

  1. 中国科学家Cell重要评述文章: 宏基因组学成为病毒分类新方法
  2. 成功解决ValueError: Invalid format string
  3. 选择排序算法,只需这篇文章就够了
  4. 【MSLearn 学习模块】Hi ! ⼀起来学Python
  5. slope one 推荐算法python 代码_基于协同的SlopeOne推荐算法原理介绍和实现
  6. JQuery通过后台获取数据遍历到前台
  7. 01-windows下python爬取网页上的图片
  8. m3u8和HLS下载和分析工具
  9. Strassen算法
  10. 2019小程序没必要做了_企业发展小程序的必要原因
  11. 难道我真的只是你生命中的过客?
  12. Java实现 LeetCode 514 自由之路
  13. 基于R语言利用QQ群进行数据挖掘案例整理
  14. python如何赚外快 淘宝_Python如何爬取淘宝MM呢?教你一招
  15. Pinyin4j之Pinyin4jUtils工具类
  16. Mission Planner中级应用(APM或PIX飞控)4——无人机APM飞控硬件故障简单维修(上)
  17. R安装WGCNA包(MacOS M1芯片)及impute包安装报错的解决方法【已成功】
  18. 遗传算法matlab_史上最强的MATLAB自学网站,你收藏了吗???
  19. Android Things教程:电气基础之直流电路理论
  20. 在word输入上标下标

热门文章

  1. [每天一个知识点]20-Java语言-菱形运算符
  2. Codeforces Round #168 (Div. 2)
  3. 在线代理和缓存工具(转)
  4. BI软件的作用有哪些
  5. 如何提升数据安全治理能力
  6. 大数据给企业带来的好处有哪些
  7. iec104点号_IEC104规约详细讲解全解.ppt
  8. java float存储方式_Java中小数的存储方式
  9. 子类和父类对象在进行类型转换时_不一样的面向对象(三)
  10. mysql5.7zib配置_mysql-5.7.13 解压版安装教程