一、简介

HTK(Hidden Markov Model Toolkit)是一款语音识别工具包,诞生于Cambridge University Engineering Department (CUED),后来几经易手,目前的HTK3由CUED和Microsoft维护。现在Microsoft对HTK依旧保留一定的版权,但是源码可以免费获得,用于教学和科研是没有问题的。

这里是我使用的源码与教程的当时版本HTK-3.4.1:

源码:http://pan.baidu.com/s/1gf9qAD9

教程htkbook:https://pan.baidu.com/s/1R-J67qAkG5u3XzoUQeqn2A

其他高手中文版教程(针对windows):http://pan.baidu.com/s/1jHsiPpW

最新源码与文档可以查询官网:

http://htk.eng.cam.ac.uk/

以下是我在范例中使用到的音频和相关脚本文件等资料:

字典文件:http://pan.baidu.com/s/1mgJZPFE

相关脚本:http://pan.baidu.com/s/1i3Hyfv3

训练音频:http://pan.baidu.com/s/1dDEOxtJ

测试音频:http://pan.baidu.com/s/1jGuvyPS

鉴于HTK Book里给的sample一点而都不simple,作为初学者,各种麻烦还是很折腾人的。

这里,我“篡改”了HTM Book示例的部分流程,以求简单。

二、流程概览:

整个流程就如同下图一样,首先我们录制语音,然后HMM模块处理语音文件,之后便被识别出相应的文本文件。

那么,htk扮演的角色是什么呢?如下图,htk的作用就是训练出HMM模块。

为什么说是“训练”呢?简单的说,就是因为各个人的口音不同,所以,如果要“训练”HMM模块来适应不同的口音。

以下,我将训练出这样的HMM模块:识别“RED”, “YELLOW”, “BLUE”三个单词,步骤为

在此,还感谢前辈的探索,帮了我帮了我不少:

http://blog.csdn.net/wbgxx333/article/details/17639373

HTK语音识别示例(Ubuntu)相关推荐

  1. HTK语音识别基础教程.ppt

    您所在位置:网站首页 > 海量文档 &nbsp>&nbsp资格/认证考试&nbsp>&nbsp全国翻译资格认证 HTK语音识别基础教程.ppt33页 ...

  2. HTK语音识别工具包的安装和编译

    今天介绍一下HTK语音识别工具包的安装和编译,希望能够帮助到更多做语音相关工作的同仁们. 介绍: HTK是用来进行自动语音识别研究的工具包,它由剑桥大学工程系的机器智能实验室开发的开源软件,全称叫做H ...

  3. 百度语音识别JAVA代码_【百度语音识别】JavaAPI方式语音识别示例MP3转PCM

    [百度语音识别]JavaAPI方式语音识别示例MP3转PCM Java-API合成语音示例:http://ai.baidu.com/forum/topic/show/496727 REST-API文档 ...

  4. 使用Java的讯飞语音识别示例

    简单介绍 最近看到了语音识别和合成的博客,很多平台都提供了语音识别/合成的接口,比如百度和讯飞.感觉讯飞提供的接口更标准更丰富,详细内容可以看官网:讯飞开放平台.结合了另一篇博客<用Java跟图 ...

  5. HTK 语音识别 ASK

    大词汇量连续语音识别用声韵母建模 在新增加一个读音时 可以只修改dict与gram即可 HTK中识别结果到时间转换 13600000 16320000 hao -1452.207031 直接除以10的 ...

  6. linux下运行htk,Linux下安装编译并且测试HTK语音识别库

    决定写一个linux下的HTK的安装和测试,如果有人想看windows下的,可以看我之前的那篇文章 http://www.linuxidc.com/Linux/2013-03/80801.htm. 首 ...

  7. 基于java的百度语音识别示例

    最近在弄语音识别这块,然后就看了下百度的语音识别: 这里介绍了使用java实验语音识别.首先你需要的东西: 1.一个pcm或这个wav格式的语音文件(我使用的是官网提供的案列16k.pcm)点击下载. ...

  8. htk 语音识别 linux,【语音识别】HTK安装及学习

    Step1:HTK安装 (1)linux安装 进入htk目录, ./configure ./make all ./make install 一切顺利,没有error 测试:HInit,有打印各个选项的 ...

  9. springboot中文语音识别_【记录】语音识别软件包、代码示例、数据集汇集

    语音识别工具 (1)librosa:python,视频与音乐分析 链接:https://github.com/librosa/librosa (2)ASRT_SpeechRecognition:pyt ...

最新文章

  1. 【Spring】ioc的常用注解
  2. 电子技术基础三_电子技术基础
  3. ECSHOP商品详情页”增加自定义TITLE
  4. Python打印格式化与字符串
  5. 【机器学习】SVM线性可分
  6. 5、jeecg 笔记之 minidao 条件判断
  7. 【编译原理】如何编写BNF?
  8. (组合数学笔记)Pólya计数理论_Part.1_群的基本概念
  9. 两个关于JAVA String的小问题
  10. 飞龙的程序员书单 – Linux
  11. mysql sync es 异步双写_mysql数据同步es方案思考
  12. 在Sun新解决方案中心亲历虚拟化(多图)
  13. Pycharm中如何pip下载包更快
  14. 如何使用 区号查询API
  15. [论坛专贴]关于接口
  16. 软件测试需求分析方法有哪些,一起来看看吧
  17. android手机设置固定dns,(图文)安卓手机修改WiFi DNS设置的方法
  18. 每日一道题,划水有意义,看我不卷死你们(评论送书)
  19. vs 设置护眼背景颜色
  20. 编写代码、打印图4-2所示的图形python_Python之turtle库画各种有趣的图及源码(更新中)_一个超会写Bug的程序猿的博客-CSDN博客...

热门文章

  1. 微信开发经常会用到的一些方法
  2. 负载均衡获得真实源IP的6种方法 【转】
  3. 手机流量网络私有地址
  4. 使用eclipse开发hbase程序
  5. iOS :Object-C 语言merge两个字典对象
  6. IAR Embedded Workbench IDE 显示行号
  7. MSDN上的异步socket 服务端例子
  8. Bailian2680 化验诊断【入门】
  9. UVA10696 f91【数学函数+打表】
  10. CCF201409-4 最优配餐(100分)