本文假设读者看了《在线解码器》的中文博客,并按照该博客里面的指令来进行操作练习。需要注意的有以下几个地方:

1.为了为了使指令检查更简单,把所需要的文件都copy到同一个路径下比较方便,我是都copy到了digits路径下面。值得注意的是,有时候把final.mdl复制出来之后会上锁(仔细看final.mdl文件有一把小锁),这时候就会报文件读取错误(英文报错我忘记了,差不多就是这个意思)。解决方案是:把final.mdl删除,再把35.mdl复制过来(如果找不到的话,可以在digits里面搜索),然后右键创建一个链接,把名字改成final.mdl。

2.博客里面有一条指令是这样的:
online-audio-server-decode-faster --verbose=1 --rt-min=0.5 --rt-max=3.0 --max-active=6000 --beam=72.0 --acoustic-scale=0.0769 final.mdl graph/HCLG.fst graph/words.txt '1:2:3:4:5' 5010 graph/word_boundary_phones.int final.mat

如果运行这条指令肯定会报错。

首先,在Ubuntu下直接运行命令需要输入 ./  并且需要切换到online-audio-server-decode-faster所在的位置(上文提到我把所需要的文件都复制到digits下面了,所以切到digits下面就可以了),接着运行,依然会报错。此时,报错的时候将报错内容复制到百度去搜索,得出来的第一篇kaldi论坛上的文章就解答了为什么会出错,英语能力足够的读者到时候可以去阅读一下。大致意思就是5010和graph/word_boundary_phones.int 写反了。还有就是,这个final.mat是一个什么矩阵,在这里可以不用传参数,所以可以不用写。

按照我的方法修改之后应该是这样的:
~/kaldi-trunk/egs/digits$ ./online-audio-server-decode-faster --verbose=1 --rt-min=0.5 --rt-max=3.0 --max-active=6000 --beam=72.0 --acoustic-scale=0.0769 final.mdl HCLG.fst words.txt '1:2:3:4:5' word_boundary_phones.int 5010

注意切换成你自己的路径,~/kaldi-trunk/egs/digits$  是我的路径,我所有需要的文件都是放在digits下面的。到这里,这条命令与应该就可以顺利运行了。

3.接下来是运行~/kaldi-trunk/egs/digits$ ./online-audio-client --htk --vtt localhost 5090 scp:test.scp

这句指令是没有问题的 ,但是直接运行肯定会报错,因为你没有test.scp这个文件。好好想想在哪里写过这个类型的文件呢?回到我们之间写的digits里面搜索.scp,会出来一大堆.scp类型的文件,wav.scp文件就是之前写过的,在digits里面新建一个空白文档命名为test.scp然后复制一条wav.scp里面的内容过来,保存。再运行一遍就成功啦。

4.生成的B11_101.vtt文件内容:
WEBVTT FILE

1
00:00:00.630 --> 00:00:06.010 // 这句话的意思是0.6秒以前和6.01秒以后是静音,在0.6秒之间和6.01之间识别到内容
two  //本来应该是三个数据,此处代码有问题,所以输出的是一个值。

kaldi中文资料最后一章在线解码器遇到的问题及解决方案相关推荐

  1. pybind11中文资料(第五章 面向对象的代码)

    在此我要特别感谢pybind11项目创立者 Wenzel Jakob以及众多项目参与者 5面向对象的代码 5.1创建自定义类型的绑定 现在来看一个更复杂的例子,这个例子为名为Pet的自定义数据结构创建 ...

  2. 【项目实战开发】第三章——在线生鲜商城系统

    系列文章目录 第一章--AI人机对战版五子棋游戏 第二章--在线商城系统 第三章--在线生鲜商城系统 文章目录 系列文章目录 前言 1.系统背景介绍 2. 功能需求分析 3.准备工作 3.1 用到的库 ...

  3. Microchip中文资料下载

    PIC24系列参考手册部分章节中文翻译 Section 7. Reset http://ww1.microchip.com/downloads/en/DeviceDoc/39712a_cn.pdf S ...

  4. Microchip最新中文资料下载

    PIC24系列参考手册部分章节中文翻译 Section 7. Reset http://ww1.microchip.com/downloads/en/DeviceDoc/39712a_cn.pdf S ...

  5. Microchip中文资料下载 .

    PIC24系列参考手册部分章节中文翻译 Section 7. Reset http://ww1.microchip.com/downloads/en/DeviceDoc/39712a_cn.pdf S ...

  6. NDK - JNI官方中文资料

    NDK-JNI官方中文资料 声明 该篇文章完全引用自<JNI完全手册>完整版,用来方便查询查阅.感谢原文档作者. 文档所依赖的版本是比较低的,但是恰恰是低版本才能更容易上手学习.文档也有些 ...

  7. 缓冲器74HC541D/SN74HC541PWR/74HC541PW/AIP74HC541最新中文资料

    提供74HC541D/SN74HC541PWR/74HC541PW/SN74HC541DWR/AIP74HC541中文资料_价格_PDF数据手册_引脚图及功能 产品描述 74HC541D/SN74HC ...

  8. Palabos User Guide中文解读 | 第七章 | Palabos的模型

    作者的话:本人在学习palabos时,发现国内中文资料甚少,恰好网上可以直接搜到palabos user guide这种英文资料,加之时间充裕,便打算开始翻译,翻了一节后发现这可能算侵权,就比较伤脑筋 ...

  9. tl494c封装区别_TL494参数,功能介绍,TL494应用电路图,封装,管脚及TL494 PDF中文资料手册...

    TL494中文资料 功能介紹 中文 : 功能介紹 英文 : Voltage mode PWM control circuit. 品牌 : Contek 封装 : 引脚 : 功能介紹 中文 : 功能介紹 ...

最新文章

  1. VC解析XML--使用CMarkup类解析XML
  2. 图示评审技术_编制清单报价最需要施工技术课程中的哪些知识?
  3. Ansible自动化运维笔记1(安装配置)
  4. Server Develop (三) 多进程实现C/S
  5. 使用 TABLESAMPLE 限制结果集
  6. elementary OS下netbeans中文乱码的问题
  7. nginx程序访问linux任意目录,通过nginx访问linux目录
  8. C语言删除字符数组中指定的字符(C笔记)
  9. mysql返回上一层_mysql常用命令大全
  10. [莫队算法 线段树 斐波那契 暴力] Codeforces 633H Fibonacci-ish II
  11. JavaWeb之Servlet-注册页面
  12. 深度学习工作站装机指南
  13. AOP名词解释Advice,Pointcut,Advisor,Joinpoint,Advised是什么?
  14. 什么意思中文_中文十级考题,请解释这四句话是什么意思!
  15. 商业大数据分析报告选题与背景撰写技巧
  16. 蒙特卡洛未来股票价格matlab,股票组合价格蒙特卡洛matlab
  17. 2019华为网络精英挑战赛参赛体验
  18. 2022年济南12行政区高新技术企业补贴政策及认定条件汇总
  19. Win10修改编辑hosts文件无法保存怎么办
  20. Vue最low的路由嵌套【电竞杜小帅】

热门文章

  1. TM4C123 QEI 初始化
  2. ISCC2014 writeup
  3. plsql和sql developer導入導出
  4. NI-DAQmx安装问题,DAQ助手在Labview中不显示,新建时显示缺少编辑所需要的组件
  5. [转]HTML5设计原理
  6. 连续小波变换应用于密集模态参数识别
  7. 咬文嚼字的有趣例子_咬文嚼字的古今中外的例子
  8. #斐济攻略#舔屏君遇上素颜女神,原汁原味撩斐济!
  9. chatgpt赋能python:Python怎么接单子平台有哪些
  10. 【阿里云IoT+YF3300】16.云端一体化,天猫精灵操控YF3300