Kaldi AMI数据集脚本学习7---train_deltas.sh
1. 命令行格式
在AMI数据集中num-leaves=5000(即5000个不同的states),tot-gauss=80000(平均每个不同states 高斯模型数目是16个).
"Usage: steps/tandem/train_deltas.sh <num-leaves> <tot-gauss> <data1-dir> <data2-dir> <lang-dir> <alignment-dir> <exp-dir>"
2. 训练步骤总览
1)Train a monophone system (or use previously built triphone system) to get time alignments for data.
2)Build a “decision tree” for each “monophone”.
3)For each seen triphone, accumulate sufficient statistics to train a single Gaussian per HMM state。得到的statistics存放在exp/tri1/treeacc文件。
3. Build “decision tree”
1) get questions
We cluster the phones to get questions.
A question is just a set of phones,Would normally be a phonetic category.
Here, just clusters based on acoustic similarity.
# preparing questions, roots file...cluster-phones $dir/treeacc $lang/phones/sets.int $dir/questions.int 2> $dir/log/questions.log || exit 1;
得到的questions如下:
2) Compiling the questions
Program “compile-questions” takes lists of phonemes... Transforms it into a C++ object (written to disk) that contains questions for each “key” in EventMap.
3) Setting tree roots
4) Building the decision tree
5) Build好后的decision tree存在文件tree里,tree里的信息如下:
4.treeacc文件内容
Kaldi AMI数据集脚本学习7---train_deltas.sh相关推荐
- Kaldi AMI数据集脚本学习2----run_prepare_shared.sh
在学习脚本文件时,重点关注哪些是调用标准函数,哪些是调用特定数据集的数据处理函数; 关注每个阶段处理的输入,输出和控制参数.不要面面俱到,试图理解每行代码. 1. 下载AMI数据集的xml标注文件包: ...
- Kaldi AMI数据集脚本学习3---run_ihm.sh stage 1~3
1. stage 1 在此之前,已经下载了130G的AMI数据在目录$AMI_DIR(wav_db/amicorpus)了. # Prepare ihm data directories, if [ ...
- Kaldi AMI数据集脚本学习1----cmd.sh和path.sh
1. cmd.sh 我是在个人电脑上运行Kaldi的,所以脚本关键内容如下: export train_cmd=run.pl export decode_cmd=run.pl export tfrn ...
- Kaldi AMI数据集脚本学习4---train_mono.sh
1. 缺省配置 nj=4 并行个数 cmd=run.pl 处理程序 scale_opts="--transition-scale=1.0 --acoustic-scale=0.1 --sel ...
- Kaldi AMI数据集脚本学习6---转移模型(Transition Model)
TransitionModel 涉及到的名词术语如下: phone (one-based): this type of identifier is used throughout the toolki ...
- Kaldi AMI数据集脚本学习5---AMI mono phone文件 40.mdl分析
使用kaldi训练mono phone之后会在esp/mono/目录下产生一个40.mdl文件, 查看exp/mono/40.mdl 命令: kaldi/src/gmmbin/gmm-copy --b ...
- 《kaldi语音识别实战》阅读笔记:三音素模型训练—train_deltas.sh解析
一.使用说明 1.1 描述 训练三音素模型.与单音素模型训练相比,因为建模单元变为三音素,因此多了决策树状态绑定. steps/deltas.sh Usage: steps/train_deltas. ...
- Kaldi决策树状态绑定学习笔记(一)
建议在csdn资源页中免费下载该学习笔记的PDF版进行阅读:)点击进入下载页面 Kaldi决策树状态绑定学习笔记(一) --如何累积相关统计量? 目录 Kaldi决策树状态绑定学习笔记一 如何累积相关 ...
- Kaldi三音素GMM学习笔记
建议在csdn资源页中免费下载该学习笔记的PDF版进行阅读:)点击进入下载页面 Kaldi三音素GMM学习笔记 三音素GMM与单音素GMM的主要差别在于决策树状态绑定,与GMM参数更新相关的原理.程序 ...
最新文章
- 中国科学家Cell重要评述文章: 宏基因组学成为病毒分类新方法
- 成功解决ValueError: Invalid format string
- 选择排序算法,只需这篇文章就够了
- 【MSLearn 学习模块】Hi ! ⼀起来学Python
- slope one 推荐算法python 代码_基于协同的SlopeOne推荐算法原理介绍和实现
- JQuery通过后台获取数据遍历到前台
- 01-windows下python爬取网页上的图片
- m3u8和HLS下载和分析工具
- Strassen算法
- 2019小程序没必要做了_企业发展小程序的必要原因
- 难道我真的只是你生命中的过客?
- Java实现 LeetCode 514 自由之路
- 基于R语言利用QQ群进行数据挖掘案例整理
- python如何赚外快 淘宝_Python如何爬取淘宝MM呢?教你一招
- Pinyin4j之Pinyin4jUtils工具类
- Mission Planner中级应用(APM或PIX飞控)4——无人机APM飞控硬件故障简单维修(上)
- R安装WGCNA包(MacOS M1芯片)及impute包安装报错的解决方法【已成功】
- 遗传算法matlab_史上最强的MATLAB自学网站,你收藏了吗???
- Android Things教程:电气基础之直流电路理论
- 在word输入上标下标
热门文章
- [每天一个知识点]20-Java语言-菱形运算符
- Codeforces Round #168 (Div. 2)
- 在线代理和缓存工具(转)
- BI软件的作用有哪些
- 如何提升数据安全治理能力
- 大数据给企业带来的好处有哪些
- iec104点号_IEC104规约详细讲解全解.ppt
- java float存储方式_Java中小数的存储方式
- 子类和父类对象在进行类型转换时_不一样的面向对象(三)
- mysql5.7zib配置_mysql-5.7.13 解压版安装教程