kaldi中文资料最后一章在线解码器遇到的问题及解决方案
本文假设读者看了《在线解码器》的中文博客,并按照该博客里面的指令来进行操作练习。需要注意的有以下几个地方:
1.为了为了使指令检查更简单,把所需要的文件都copy到同一个路径下比较方便,我是都copy到了digits路径下面。值得注意的是,有时候把final.mdl复制出来之后会上锁(仔细看final.mdl文件有一把小锁),这时候就会报文件读取错误(英文报错我忘记了,差不多就是这个意思)。解决方案是:把final.mdl删除,再把35.mdl复制过来(如果找不到的话,可以在digits里面搜索),然后右键创建一个链接,把名字改成final.mdl。
2.博客里面有一条指令是这样的:
online-audio-server-decode-faster --verbose=1 --rt-min=0.5 --rt-max=3.0 --max-active=6000 --beam=72.0 --acoustic-scale=0.0769 final.mdl graph/HCLG.fst graph/words.txt '1:2:3:4:5' 5010 graph/word_boundary_phones.int final.mat
如果运行这条指令肯定会报错。
首先,在Ubuntu下直接运行命令需要输入 ./ 并且需要切换到online-audio-server-decode-faster所在的位置(上文提到我把所需要的文件都复制到digits下面了,所以切到digits下面就可以了),接着运行,依然会报错。此时,报错的时候将报错内容复制到百度去搜索,得出来的第一篇kaldi论坛上的文章就解答了为什么会出错,英语能力足够的读者到时候可以去阅读一下。大致意思就是5010和graph/word_boundary_phones.int 写反了。还有就是,这个final.mat是一个什么矩阵,在这里可以不用传参数,所以可以不用写。
按照我的方法修改之后应该是这样的:
~/kaldi-trunk/egs/digits$ ./online-audio-server-decode-faster --verbose=1 --rt-min=0.5 --rt-max=3.0 --max-active=6000 --beam=72.0 --acoustic-scale=0.0769 final.mdl HCLG.fst words.txt '1:2:3:4:5' word_boundary_phones.int 5010
注意切换成你自己的路径,~/kaldi-trunk/egs/digits$ 是我的路径,我所有需要的文件都是放在digits下面的。到这里,这条命令与应该就可以顺利运行了。
3.接下来是运行~/kaldi-trunk/egs/digits$ ./online-audio-client --htk --vtt localhost 5090 scp:test.scp
这句指令是没有问题的 ,但是直接运行肯定会报错,因为你没有test.scp这个文件。好好想想在哪里写过这个类型的文件呢?回到我们之间写的digits里面搜索.scp,会出来一大堆.scp类型的文件,wav.scp文件就是之前写过的,在digits里面新建一个空白文档命名为test.scp然后复制一条wav.scp里面的内容过来,保存。再运行一遍就成功啦。
4.生成的B11_101.vtt文件内容:
WEBVTT FILE
1
00:00:00.630 --> 00:00:06.010 // 这句话的意思是0.6秒以前和6.01秒以后是静音,在0.6秒之间和6.01之间识别到内容
two //本来应该是三个数据,此处代码有问题,所以输出的是一个值。
kaldi中文资料最后一章在线解码器遇到的问题及解决方案相关推荐
- pybind11中文资料(第五章 面向对象的代码)
在此我要特别感谢pybind11项目创立者 Wenzel Jakob以及众多项目参与者 5面向对象的代码 5.1创建自定义类型的绑定 现在来看一个更复杂的例子,这个例子为名为Pet的自定义数据结构创建 ...
- 【项目实战开发】第三章——在线生鲜商城系统
系列文章目录 第一章--AI人机对战版五子棋游戏 第二章--在线商城系统 第三章--在线生鲜商城系统 文章目录 系列文章目录 前言 1.系统背景介绍 2. 功能需求分析 3.准备工作 3.1 用到的库 ...
- Microchip中文资料下载
PIC24系列参考手册部分章节中文翻译 Section 7. Reset http://ww1.microchip.com/downloads/en/DeviceDoc/39712a_cn.pdf S ...
- Microchip最新中文资料下载
PIC24系列参考手册部分章节中文翻译 Section 7. Reset http://ww1.microchip.com/downloads/en/DeviceDoc/39712a_cn.pdf S ...
- Microchip中文资料下载 .
PIC24系列参考手册部分章节中文翻译 Section 7. Reset http://ww1.microchip.com/downloads/en/DeviceDoc/39712a_cn.pdf S ...
- NDK - JNI官方中文资料
NDK-JNI官方中文资料 声明 该篇文章完全引用自<JNI完全手册>完整版,用来方便查询查阅.感谢原文档作者. 文档所依赖的版本是比较低的,但是恰恰是低版本才能更容易上手学习.文档也有些 ...
- 缓冲器74HC541D/SN74HC541PWR/74HC541PW/AIP74HC541最新中文资料
提供74HC541D/SN74HC541PWR/74HC541PW/SN74HC541DWR/AIP74HC541中文资料_价格_PDF数据手册_引脚图及功能 产品描述 74HC541D/SN74HC ...
- Palabos User Guide中文解读 | 第七章 | Palabos的模型
作者的话:本人在学习palabos时,发现国内中文资料甚少,恰好网上可以直接搜到palabos user guide这种英文资料,加之时间充裕,便打算开始翻译,翻了一节后发现这可能算侵权,就比较伤脑筋 ...
- tl494c封装区别_TL494参数,功能介绍,TL494应用电路图,封装,管脚及TL494 PDF中文资料手册...
TL494中文资料 功能介紹 中文 : 功能介紹 英文 : Voltage mode PWM control circuit. 品牌 : Contek 封装 : 引脚 : 功能介紹 中文 : 功能介紹 ...
最新文章
- VC解析XML--使用CMarkup类解析XML
- 图示评审技术_编制清单报价最需要施工技术课程中的哪些知识?
- Ansible自动化运维笔记1(安装配置)
- Server Develop (三) 多进程实现C/S
- 使用 TABLESAMPLE 限制结果集
- elementary OS下netbeans中文乱码的问题
- nginx程序访问linux任意目录,通过nginx访问linux目录
- C语言删除字符数组中指定的字符(C笔记)
- mysql返回上一层_mysql常用命令大全
- [莫队算法 线段树 斐波那契 暴力] Codeforces 633H Fibonacci-ish II
- JavaWeb之Servlet-注册页面
- 深度学习工作站装机指南
- AOP名词解释Advice,Pointcut,Advisor,Joinpoint,Advised是什么?
- 什么意思中文_中文十级考题,请解释这四句话是什么意思!
- 商业大数据分析报告选题与背景撰写技巧
- 蒙特卡洛未来股票价格matlab,股票组合价格蒙特卡洛matlab
- 2019华为网络精英挑战赛参赛体验
- 2022年济南12行政区高新技术企业补贴政策及认定条件汇总
- Win10修改编辑hosts文件无法保存怎么办
- Vue最low的路由嵌套【电竞杜小帅】