usage: steps/align_si.sh <data-dir> <lang-dir> <src-dir> <align-dir>

e.g.: steps/align_si.sh data/train data/lang exp/tri1 exp/tri1_ali

对特征进行若干变换

调整模型的静音音素权重

根据词-词标识符映射表(words.txt),将标注转换为词标识符的序列:

tra="ark:utils/sym2int.pl --map-oov $oov -f 2- $lang/words.txt $sdata/JOB/text|";

构建训练图(transition model,转移模型)

H:$dir/final.mdl的转移模型部分;

C:$dir/tree;

L:$lang/L.fst;

G:"$tra";

训练图的输入是GMM的标识符序列,输出是词的标识符序列。

GMM-HMM的final.mdl包含转移模型与状态模型(其概率密度函数为混合高斯模型)。

强制对齐(Force Align)

在HCLG+GMM中对特征进行维特比搜索,得到最优结果,即Alignment(对齐) $dir/ali.JOB.gz。

HCLG+GMM的输入是特征序列,输出是词的标识符序列。

转载于:https://www.cnblogs.com/JarvanWang/p/9152686.html

steps/align_si.sh相关推荐

  1. 解决:steps/make_fbank.sh: line 132: run.pl: command not found

    问题描述 使用kaldi提取特征时,遇到这个问题 原因 应该时run.pl没有添加到环境变量里边 首先,定位run.pl命令所在位置: locate run.pl 找出run.pl路径如下所示: 将第 ...

  2. gentos 执行sh文件_学习kaldi跑thchs30记录(run.sh代码过程)

    cmd.sh:运行配置目录,并行执行命令,通常分 run.pl, queue.pl 两种 path.sh:环境变量相关脚本(kaldi公用的全局PATH变量的设置) run.sh :整体流程控制脚本, ...

  3. Kaldi的英文缩写

    lang language,语言 示例:data/lang Language directory bg binary-grammar,二阶语言模型 示例:data/lang_test_bg_5k La ...

  4. 一些kaldi常用的术语和命令(一)

    /egs里一般存放执行的脚本,.sh文件,讲了每一步要执行什么操作,而真正的算法程序部分,在/src里的.cc..h文件里. archive(.ark).script(.scp) :是表格(table ...

  5. Kaldi入门教程 aishell脚本

    Kaldi入门教程 aishell脚本 文章目录 Kaldi入门教程 aishell脚本 @[toc] 准备词典 准备数据,分为test.dev.train集 词典.语言文件准备,生成对应的数据关系 ...

  6. Kaldi单步完美运行AIShell v1 S5之三:三音tri1,tri2,tri3,tri4,tri5

    Kaldi单步完美运行AIShell v1 S5之三:三音tri1 2 3 4 5 致谢 机器配置 Kaldi下AIShell v1详细输出之三:三音triphone 第五部分:三音结果更新 第六部分 ...

  7. Kaldi的简单介绍和基本使用说明

    Kaldi的简单介绍和基本使用说明 前言 一.ASR简介 1.语音识别系统 特征提取: 声学模型 发音词典 语言模型 语音解码 2. ASR项目 二.Kaldi简介 三.Kaldi项目的结构 四.Ka ...

  8. Kaldi:从零搭建语音识别系统

    参考博客 DNN-HMM 语音识别系统搭建 基于Kaldi平台搭建DNN-HMM语音识别系统,这里针对汉语普通话建立语音识别系统,并在后期对识别率进行了分析.搭建一个完整的DNN-HMM系统首先需要准 ...

  9. 语音识别之Kaldi:学习GMM-HMM

    语音识别之Kaldi kaldi语音识别理论与实践课程学习. 前面的博客介绍了语音识别的基础知识及原理.现在开始学习实战.以Kaldi框架为基础. Kaldi是一个有全套的语音识别代码的工具,由Dan ...

最新文章

  1. matlab画CDF曲线
  2. Linux 运维工程师的六类好习惯
  3. 使用dstat命令的插件查看mysql的io状态
  4. 扩展KMP --- HDU 3613 Best Reward
  5. 成功解决The subservice has not been subscribed.
  6. trackr: An AngularJS app with a Java 8 backend – Part IV 实践篇
  7. iOS之性能优化·优化App的启动速度
  8. php moodle mysql_PHP+XAMPP+MYSQL:从MOODLE数据库提取数据并利用jpgraph生成柱状成绩对比图...
  9. npm包管理器小节一下
  10. 品质生活在于细节 8月6日张朝阳“做饭直播”带货厨房好物
  11. .net 4.0新特性-tuple
  12. java swing 图片上加热点_外卖图片品牌全靠P,4元成本料理包加热后,平台上20元卖出...
  13. jquery调用WebService和WebService输出JSON
  14. [系统安全] 一.什么是逆向分析、逆向分析基础及经典扫雷游戏逆向
  15. 利用qq官方提供的js_sdk实现qq互联登录
  16. 【网页设计自习室#005】网页页面中banner海报设计
  17. 全球移动通信系统GSM
  18. syn重发_TCP/IP中SYN,FIN的缩写意思
  19. java设计大全——计算机设计参考选题(SSM+SpringBoot+vue+html)(持续更新)
  20. python汇率兑换双向_汇率兑换—python第一课

热门文章

  1. 后台获取html控件的值
  2. 【一张图系列】理解安全上下文
  3. vmware不能和主机相连
  4. 在Eclipse RCP中使用Spring AOP/ProxyFactory的问题
  5. 有关于JAVA与后端C应用UTF8字符的通信
  6. Plitch for the final Feb 16
  7. if you are alone with your mac connected to Internet
  8. 唐人街探案3观后感:大四学生的看法
  9. Optimizing graphics performance
  10. LUA GC 简单测试