HTK standard lattice format
这个格式描述了HTK词网络,主要包含两部分,头部和节点/边定义。
在头部,主要包含版本信息,以及该词网络包含多少个节点和多少条边,分别以字母N和L表示。
在body部分,分别定义节点的编号和词本体信息;边的编号以及边的起点和终点信息,可选的有语言模型的分数。
下面是典型的SLF文件格式。
VERSION=1.0
N=31 L=62
I=0 W=SENT-END
I=1 W=YOUNG
I=2 W=!NULL
I=3 W=STEVE
I=4 W=LEE
I=5 W=PHIL
I=6 W=WOOD
I=7 W=DAVE
I=8 W=TYLER
I=9 W=JULIAN
I=10 W=LAW
I=11 W=SUE
I=12 W=CALL
I=13 W=!NULL
I=14 W=PHONE
I=15 W=ZERO
I=16 W=!NULL
I=17 W=OH
I=18 W=NINE
I=19 W=EIGHT
I=20 W=SEVEN
I=21 W=SIX
I=22 W=FIVE
I=23 W=FOUR
I=24 W=THREE
I=25 W=TWO
I=26 W=ONE
I=27 W=DIAL
I=28 W=SENT-START
I=29 W=!NULL
I=30 W=!NULL
J=0 S=2 E=0
J=1 S=16 E=0
J=2 S=3 E=1
J=3 S=13 E=1
J=4 S=1 E=2
J=5 S=4 E=2
J=6 S=6 E=2
J=7 S=8 E=2
J=8 S=10 E=2
J=9 S=13 E=3
J=10 S=5 E=4
J=11 S=13 E=4
J=12 S=13 E=5
J=13 S=7 E=6
J=14 S=13 E=6
J=15 S=13 E=7
J=16 S=9 E=8
J=17 S=13 E=8
J=18 S=13 E=9
J=19 S=11 E=10
J=20 S=13 E=10
J=21 S=13 E=11
J=22 S=28 E=12
J=23 S=12 E=13
J=24 S=14 E=13
J=25 S=28 E=14
J=26 S=16 E=15
J=27 S=27 E=15
J=28 S=15 E=16
J=29 S=17 E=16
J=30 S=18 E=16
J=31 S=19 E=16
J=32 S=20 E=16
J=33 S=21 E=16
J=34 S=22 E=16
J=35 S=23 E=16
J=36 S=24 E=16
J=37 S=25 E=16
J=38 S=26 E=16
J=39 S=16 E=17
J=40 S=27 E=17
J=41 S=16 E=18
J=42 S=27 E=18
J=43 S=16 E=19
J=44 S=27 E=19
J=45 S=16 E=20
J=46 S=27 E=20
J=47 S=16 E=21
J=48 S=27 E=21
J=49 S=16 E=22
J=50 S=27 E=22
J=51 S=16 E=23
J=52 S=27 E=23
J=53 S=16 E=24
J=54 S=27 E=24
J=55 S=16 E=25
J=56 S=27 E=25
J=57 S=16 E=26
J=58 S=27 E=26
J=59 S=28 E=27
J=60 S=30 E=28
J=61 S=0 E=29
每个部分,都是以“一行”为基本单位,例如在表示节点/边信息的主题部分,没一行代表一个节点/边,而其内容又可以分为多个filed,每个field被分隔符“=”分为名称和值两部分,分别代表不同的意义。
以描述节点行为例子,“I=0 W=SENT-END”,包含两个field,分别是“I=0”和“W=SENT-END”,它们表示节点编号为0,节点的identity为“SENT-END”,这些都代表了词网络的具体意义。边行信息也类似。
HTK standard lattice format相关推荐
- HTK的解码过程的理解又遇到瓶颈了
再次参考HTK book的12章.13章.重新捋一遍识别网络的构建过程和维特比解码过程. 构建识别网络是重中之重,而它的基础是lattice,描述lattice的是Standard Lattice F ...
- HTKbook翻译之第十三章HVite解码(维特比)
第十三章 HVite解码 前一章描述了如何构建识别网络,指定什么是合法的语音输入,以及每个词是怎么发音的.有了这样一个网络和它对应的HMM集合,输入一段语音,就可以通过网络计算该语音片段经过的所有路径 ...
- GDSII format
GDSII format INDEX introduction bachus nauer forms GDSII BNF Record header Data types record types o ...
- String.Format()方法
String.Format方法是我们在.Net应用开发时经常使用到的,它的灵活使用有时能够达到事半功倍的效果,下面我们就借用MSDN上的一个示例来向大家展示String.Format的各种用法. 该示 ...
- C# 格式化字符串 String.Format
格式化日期和数字的字符串经常要用到这个, 就把帮助里面的东西大概整理了一些列在这里了. 下表描述了用来格式化 DateTime 对象的标准格式说明符. 格式说明符 名称 说明 d 短日期模式 显示由与 ...
- HTK下yes/no的识别
孤立词识别的简单结构 data/: data/train data/test analysis/: training/: model/: def/: test/: 第一步 创建语音文件 录音 命令 ...
- kaldi理解WFST,HCLG,lattice
文章目录 WFST,HCLG lattice 两种lattice结构The Lattice type 和Compact lattices Lattice的产生 获取raw lattice,并将其转换为 ...
- Linux驱动框架之framebuffer驱动框架
1.什么是framebuffer? (1)framebuffer帧缓冲(一屏幕数据)(简称fb)是linux内核中虚拟出的一个设备,framebuffer向应用层提供一个统一标准接口的显示设备.帧缓冲 ...
- Big Data Security Part One: Introducing PacketPig
Series Introduction Packetloop CTO Michael Baker (@cloudjunky) made a big splash when he presented ' ...
最新文章
- Python3 pathlib让编程更美好
- Nginx负载均衡配置实例详解(转)
- 实现单链表--Python
- MobileIMSDK怎样修改服务端核心jar包的源码并替换掉Java服务端的jar包
- $lookup做关联表查询
- java enum.parse_java 枚举的简单使用(enum)
- linux修改目录为nobody,nfs只能挂载为nobody的解决方法
- 实战经验:Oracle recyclebin过大导致的Insert逻辑读暴增问题的解决
- Papervision3D对象
- floyd算法_常用十大算法(九)— 弗洛伊德算法
- labview连接周立功的USB转CAN(一)
- java ssm网上超市购物管理系统
- 斗鱼服务器维护不能改名,斗鱼tv怎么改名字-斗鱼tv修改昵称的方法 - 河东软件园...
- 刘元普双生贵子(但行好事,莫问前程)
- 计算机文化基础0008 17秋在线作业1,【在线】《计算机文化基础0008》17秋在线作业2.doc...
- C中printf()格式代码%g、%f、%e
- 法外之徒第一季/全集Braquo迅雷下载
- `CSS filter` 有哪些神奇用途
- Oracle中反GROUP BY的写法
- 揭秘你所看不见的技术原理 - 游戏世界服