lang

language,语言

示例:data/lang

Language directory

bg

binary-grammar,二阶语言模型

示例:data/lang_test_bg_5k

Language directory used for test, with big dictionary of 5000 words

用于解码测试的语言目录,其字典为包含5000个单词的大字典

tg

triple-grammar,三阶语言模型

示例:data/lang_test_bd_tg

Language directory used for test, big dictionary, triple-grammar

用于解码测试的语言目录,大字典,三阶语言模型

fg

four-grammar,四阶语言模型

示例:data/lang_test_bd_fg

Language directory used for test, big dictionary, four-grammar

用于解码测试的语言目录,大字典,四阶语言模型

bd

big dict,大字典

示例:data/lang_test_bd_tgpr

Language directory used for test, big dictionary, pruned triple-grammar

用于解码测试的语言目录,大字典,裁剪过的三阶语言模型

pr

pruned,裁剪过的

示例:data/lang_test_tgpr_5k

Language directory used for test, with dictionary of 5000 words, pruned triple-grammar

用于解码测试的语言目录,其字典为包含5000个单词的大字典,裁剪过的三阶语言模型

DAE

Denoising Auto Encoder

降噪自动编码器,常作为DNN的前端,用于降噪

示例:thchs30/local/dae

hires

high resolution

高分辨率,高维数,通常表示40维的MFCC特征

示例:data/train_hires

sp

speed perturb,速度扰动,通常表示通过速度扰动进行增广过的数据集

silence phone,静音音素

nosp

no silence phone,无静音音素,通常用于音素集中没有静音音素的语言目录

示例:data/lang_nosp

nodup

no duplex,无重复的,文本无重复,通常表示已经将训练集相同标注的语句去除

示例:data/train_nodup

2y、7d

数字+字母形式的调优版本,字母可省略。通常出现在kaldi/egs/*/local/{nnet3,chain}/tuning目录以及相关目录中。

a, b,..., z

1a, 1b,..., 1z

...

示例:

  1. swbd/s5c/local/chain/tuning/run_tdnn_blstm_a.sh

    TDNN-BLSTM的基线模型

  2. swbd/s5c/local/chain/tuning/run_tdnn_blstm_2y.sh

    TDNN-BLSTM的调优模型,版本为2y

  3. swbd/s5c/local/chain/tuning/run_tdnn_blstm_7d.sh

    TDNN-BLSTM的调优模型,版本为7d

  4. exp/chain/tri6_7d_tree

    版本为7d的调优模型所使用的决策树目录

  5. data/lang_chain_2y

    版本为2y的Chain调优模型所使用的语言目录

sw1

Switchboard 1

因为Switchboard由多个部分组成,而kaldi/egs/swbd示例只使用了Switchboard-1 Phase 1,因此相关数据集、转录等缩写为sw1。

示例:

  1. data/lang_nosp_sw1_tg

    语言目录,不包含静音音素,其中三阶语言模型使用Switchboard 1转录训练

  2. exp/tri1/graph_nosp_sw1_tg

    解码图目录,不包含静音音素,其中三阶语言模型使用Switchboard 1转录训练

fsh

fisher,egs/fisher_english示例及其相关数据

示例:data/lang_fsh_sw1_tg

语言目录,其中三阶语言模型使用fisher_english和Switchboard 1的转录进行训练得到

xent

Cross Entropy,交叉熵,通常表示Chain模型的交叉熵正则化

示例:xent_regularize=0.1,交叉熵正则化系数

egs

examples,示例,通常表示Kaldi脚本示例

例如:kaldi/egs目录

examples,样本,通常表示训练样本

例如:exp/chain/tdnn_blstm_a/egs目录

eg

example,样本,通常表示训练样本

示例:

  1. --frames-overlap-per-eg 0

    训练样本之间重叠(重复)的帧数为0

  2. --frames-per-eg 50

    一个训练样本包含50帧

si

speeker independent,说话人无关,即没有进行说话人自适应训练(SAT)

示例:steps/align_si.sh

说话人无关的对齐

转载于:https://www.cnblogs.com/JarvanWang/p/11156441.html

Kaldi的英文缩写相关推荐

  1. Virtual Box+Centos7.0+Kaldi安装

    Kaldi Kaldi是一个强大的语音识别工具库(ASR),主要由Daniel Povey开发和维护.目前支持GMM-HMM.SGMM-HMM.DNN-HMM等多种语音识别的模型的训练和预测.其中DN ...

  2. Kaldi aishell 200h小时训练问题集合

    Kaldi aishell 位置: ${Kaldi}/egs/aishell/s5 数据集下载问题 数据集**data_aishell.tgz**在openslr上,该数据集比较大,总共15G.国内网 ...

  3. 【Kaldi安装问题】Nvidia库cub安下载失败

    请注意文件的时效性 在安装kaldi时,tools下的安装如果遇到如下错误,说明在安装cub时,该包下载不了. 不知道什么原因,github.com的地址好像被封了. [解决方案] github下不了 ...

  4. Kaldi不支持Cuda10_1版本

    请注意时效性. 笔者近期下载了Kaldi5.3+Cuda10.1, 系统是Ubuntu16. 编译Kaldi时提示 Unsupported CUDA_VERSION (CUDA_VERSION=10_ ...

  5. Ubuntu16下安装kaldi(使用物理主机)

    Ubuntu16下安装kaldi 准备软件 安装Ubuntu 安装Kaldi 遇到的安装问题 把主机变成云服务器 使用花生壳绑定域名 安装ssh服务 准备软件 最新Ubuntu已经到19版本了,但是鉴 ...

  6. 小米语音首席科学家Daniel Povey:下一代Kaldi将走向何方?

    如果你曾为<十面埋伏>中章子怡"听音辨鼓"的神技所惊艳,那么你也许就会被语音识别工具Kaldi的神通广大所倾倒.作为当前最流行的开源语音识别开发框架,Kaldi集成了多 ...

  7. kaldi上第一个免费的中文语音识别例子

    今天在清华大学cslt实验室王东老师的分享下,kaldi终于有了免费的中文语音识别的例子,网址为:https://github.com/kaldi-asr/kaldi/tree/master/egs/ ...

  8. 几个受益终身的英文缩写

    几个受益终身的英文缩写 赖勇浩(http://blog.csdn.net/lanphaday) 经常在论坛或者 maillist 看到许多朋友发个贴上来问一些小问题,而答案往往是读一下手册或者在网上搜 ...

  9. Kaldi拜拜!PyTorch语音工具包SpeechBrain要来了,支持多种语音任务,实现最强水准...

    郭一璞 假装发自 蒙特利尔  量子位 报道 | 公众号 QbitAI 你厌倦语音工具包Kaldi了么?有没有觉得它不好用? 加拿大也有一群人这么认为. 现在,图灵奖得主.AI三巨头之一Yoshua B ...

最新文章

  1. BZOJ 1589 Trick or Treat on the Farm (tarjan缩点,记忆化搜索)[Usaco 2008 Dec Gold]【BZOJ计划】
  2. Apache安装遇到的相关问题
  3. 全球增长最快域名解析商Top10:DNSPod新网上榜
  4. -webkit-border-radius和-moz-border-radius(转)
  5. Php 取出session中的值,获取php值
  6. drawlinetest.java_Java Graphics2D.setRenderingHint方法代碼示例
  7. Python序列基本操作(四)元组
  8. 降低成本,提高生产力—8句话讲清RPA的部署 1
  9. webpack Babel
  10. JavaScript入门之Canvas(一): 2D Context
  11. 蓝桥杯真题 日期问题 c++代码实现 小明正在整理一批历史文献。这些历史文献中出现了很多日期。小明知道这些日期都在 1960 年 1 月 1 日至 2059 年 12 月 31 日。
  12. 计算机设备自动关机,终于发现电脑自动关机的原因及解决方法
  13. 小程序分享至群群消息小结(包括分享到App)
  14. 服务器怎么增加路由,给Windows服务器添加永久路由的脚本
  15. 苹果电子邮件怎么注册_无需购买 iPhone,可以使用哪些苹果的优质服务?
  16. 数据库-数据模型(分类、三要素、概念)
  17. 2013年12月甘肃省广播电台网络影响力排名
  18. 2017京东实习生笔试题(一)
  19. 操作系统实验报告_ucore_lab1
  20. 机车安装鸿蒙系统,华为鸿蒙系统2.0版本来了:9月11日发布 打通PC、手表、车机等...

热门文章

  1. 利用Office加载项进行持久化控制的6种姿势
  2. 人工智能离前端并不远 一步步教你开发一个机器学习APP(附源码)
  3. 如何在centos上安装epel源
  4. Web前端笔记(9) flex布局
  5. Linux如何安装python pandas科学库
  6. LVS——TUN隧道模式(负载均衡)
  7. 程序员发展职业规划_大厂程序员总结:程序员30岁前,该如何规划自己的职业发展?...
  8. clark变换_电力变换器PWM原理与实践,p43页,空间矢量理解
  9. python获取返回值_【Python】python获取线程的返回值
  10. Python 测试驱动开发读书笔记(三)使用单元测试测试简单的首页