今天介绍一下HTK语音识别工具包的安装和编译,希望能够帮助到更多做语音相关工作的同仁们。

介绍:

HTK是用来进行自动语音识别研究的工具包,它由剑桥大学工程系的机器智能实验室开发的开源软件,全称叫做HiddenMarkov Toolkit。

官方网站:http://htk.eng.cam.ac.uk

Section 1 

WINDOWS下HTK的安装和编译:

第一步:下载官方源代码,访问:http://htk.eng.cam.ac.uk/download.shtml

进入官网之后,会提示注册才能进行相关的下载。注册之后,密码回发到自己的邮箱,登陆后找到windows版的下载,有两个包:HTKSource code以及HTK samples。

第二步:解压文件

我在D盘中创建了一个名为HTK的文件夹。将这两个包解压到里面,打开htk包里面的README,里面有在windows下安装的前提要求:

1.HTK has been verified tocompile using Microsoft Visual Studio.

2.For testing, you willrequire a Perl interpreter such as ActivePerl.

3.You will need a tool suchas 7-zip or winzip (commercial) for unpacking the HTK source code archive.

4.It is helpful if you havesome familiarity with using the DOS command line interface, as you will need tointeract with it in order to compile, install and run HTK.

5.Ensure that your PATHcontains C:\Program Files\Microsoft Visual Studio .NET 2003\Vc7\bin or if youare using older versions: C:\Program Files\Microsoft Visual Studio\VC98\bin

第三步:开始编译

1.打开cmd

2.进入到htk文件夹

3.创建一个文件夹bin.win32,这个文件夹用来存放各种.exe文件。

4.运行VCVARS32

4.1首先设置环境变量:

4.2输入VCVARS32

5.编译HTKLib

nmake /f htk_htklib_nt.mkfall

成功后会看到上面的显示。

6.编译HTKTools

nmake /f htk_htktools_nt.mkfall

7.编译HLMLib

nmake /f htk_hlmlib_nt.mkfall

8.编译HLMTools

nmake /f htk_hlmtools_nt.mkfall

编译之后我们打开bin.win32之后,如果看到:

说明我们的编译已经成功了。

第四步:测试生成的可执行文件是否可用

设置环境变量:

输入命令HInit测试一下,出现:

测试DEMO:

cd HTKDemo

mkdir hmms

cd hmms

mkdir tmp

mkdir hmm.0

mkdir hmm.1

mkdir hmm.2

mkdir hmm.3

cd ..

mkdir proto

mkdir acc

mkdir test

perl runDemo.plconfigs\monPlainM1S1.dcf

出现以上显示,代表HTK库安装编译成功并测试成功。

Section 2 

LINUX下HTK的安装和编译:

第一步:下载官方源代码,访问:http://htk.eng.cam.ac.uk/download.shtml

这一步同WINDOWS下的编译只不过下载的是linux版的HTK包。

第二步:进行相关准备:

首先确保安装了g++和libx11

$ sudo apt-get install libx11-dev:i386(libX11.so) 

第三步:解压并编译:

解压HTK-3.4.1.tar.gz

sudo tar xzf HTK-3.4.1.tar.gz
sudo ./configure --prefix=/usr/local/
sudo make all
sudo make install
sudo install-hdecode

会出现如下显示:

之后出现:

第四步:测试命令:

如果出现以上显示表示安装已经成功。

第五步:测试DEMO

如果出现以下显示:

表示HTK工具包安装并测试通过。

以上就是在windows和linux下的HTK语音识别工具包的安装和编译方法。

HTK语音识别工具包的安装和编译相关推荐

  1. linux下运行htk,Linux下安装编译并且测试HTK语音识别库

    决定写一个linux下的HTK的安装和测试,如果有人想看windows下的,可以看我之前的那篇文章 http://www.linuxidc.com/Linux/2013-03/80801.htm. 首 ...

  2. 开源语音识别工具包 - CMUSphinx

    开源语音识别工具包 - CMUSphinx 开源语音识别工具包 语音识别简介 语音的构成 识别过程 模型 其他概念 CMU Sphinx 简介 Sphinx初体验 下载 编译 运行 开源语音识别工具包 ...

  3. 资源 | 横向对比5大开源语音识别工具包,CMU Sphinx最佳

    选自svds 作者:Cindi Thompson 机器之心编译 参与:李泽南.Smith目前开源世界里存在多种不同的语音识别工具包,它们为开发者构建应用提供了很大帮助.这些工具各有哪些优劣?数据科学公 ...

  4. sptk安装,编译流程

    SPTK是个有名的语音信号处理工具包. 其sptk安装,编译流程如下: 如果cygwin安装好(gcc,make,等安装好,见我另外的文章), ./configure make make instal ...

  5. Facebook 开源首个全卷积语音识别工具包 wav2letter++

    近日,Facebook 人工智能研究院 ( FAIR ) 宣布开源首个全卷积语音识别工具包 wav2letter++.系统基于全卷积方法进行语音识别,训练语音识别端到端神经网络的速度是其他框架的 2 ...

  6. 横向对比5大开源语音识别工具包,CMU Sphinx最佳

    目前开源世界里存在多种不同的语音识别工具包,它们为开发者构建应用提供了很大帮助.这些工具各有哪些优劣?数据科学公司 Silicon Valley Data Science 为我们带来了 5 种流行工具 ...

  7. HTK语音识别示例(Ubuntu)

    一.简介 HTK(Hidden Markov Model Toolkit)是一款语音识别工具包,诞生于Cambridge University Engineering Department (CUED ...

  8. eclipse安装反编译插件(附jad下载)

    eclipse安装反编译插件(附jad下载) 博客分类: eclipse 一.eclipse反编译插件Jadclipse jadclips插件网站:    http://jadclipse.sourc ...

  9. 鲲鹏服务器设置ip文件,IPFS在鲲鹏云服务器中的安装与编译过程记录

    IPFS星际文件系统是一个旨在创建持久且分布式存储和共享文件的网络传输协议.它是一种内容可寻址的对等超媒体分发协议.在IPFS网络中的节点将构成一个分布式文件系统.它综合了几十年来学术界和开源领域成功 ...

最新文章

  1. 【解决】联想thinkpad E40 如何禁用触摸板
  2. supervisord+supervisorclusterctl+supervisord-monit
  3. html app的登陆、注册,登陆_注册.html
  4. UI组件-UISlider
  5. Spark SQL CLI 运行
  6. Python3 —— 逗号分隔值CSV
  7. LeetCode LCP 33. 蓄水(暴力枚举)
  8. 大前端的自动化工厂(3)—— babel
  9. HZRecorder+科大讯飞语音转换文字
  10. app开发的三大技术框架
  11. 网络安全学习中的工具
  12. UG NX二次开发 - CAM 获取和设置公差的方法,含内外公差、边界内外公差的设置方法
  13. 【算法】【感悟】LCP 03. 机器人大冒险
  14. 密码学之RSA加密原理解析
  15. mybatis定义别名
  16. 国王游戏 [NOIP2012 提高组]
  17. Django項目部署到Ubuntu服務器
  18. 思考 |《爱好》—— 我真的做到了!
  19. 识别假币的三大诀窍!
  20. Python新闻网站项目-5.Django新闻网站前后端展示

热门文章

  1. 磁盘分区怎么恢复回去
  2. Csharp日常笔记
  3. Date.now()和new.Date().getTime()的区别
  4. 视频流TS打包方式详解
  5. 让线程实现暂停,重新启动,停止
  6. 不愧是阿里P8!java如何遍历链表
  7. nginx实现https转发
  8. 大数据数仓建模(3)
  9. 视频增强,去雾的实现 BU6521KV
  10. 单行、多行 注释.HTML