开源语音识别软件HTK,对Julius和 Kaldi等系统了解者更佳

一.Installation By Source tarball

Installation process is simple and contains the following points:

1. Download the newest source tarbal from Julius official site – link
2. Unpack the archive for example to your user home directory
3. Configure and install julius by following commands:

<span style="color: rgb(122, 8, 116);"><strong>cd</strong></span> ~<span style="font-weight: bold;">/</span>julius-4.2.2<span style="font-weight: bold;">/</span>
<span style="color: rgb(194, 12, 185);"><strong>sudo</strong></span> .<span style="font-weight: bold;">/</span>configure
<span style="color: rgb(194, 12, 185);"><strong>sudo</strong></span> <span style="color: rgb(194, 12, 185);"><strong>make</strong></span>
<span style="color: rgb(194, 12, 185);"><strong>sudo</strong></span> <span style="color: rgb(194, 12, 185);"><strong>make</strong></span> <span style="color: rgb(194, 12, 185);"><strong>install</strong></span>
二.Installation using apt-get in Ubuntu
不要使用sudo apt-get install julius这种方式安装,安装的是老版本,会有一些问题的。

4. Try it by typing in command line:

julius-4.2.1<span style="font-weight: bold;">//</span>output
Julius rev.4.2.2 - based on
JuliusLib rev.4.2.2 <span style="color: rgb(122, 8, 116);"><strong>(</strong></span>fast<span style="color: rgb(122, 8, 116);"><strong>)</strong></span>  built <span style="font-weight: bold;">for</span> i686-pc-linuxCopyright <span style="color: rgb(122, 8, 116);"><strong>(</strong></span>c<span style="color: rgb(122, 8, 116);"><strong>)</strong></span> 1991-2012 Kawahara Lab., Kyoto University
Copyright <span style="color: rgb(122, 8, 116);"><strong>(</strong></span>c<span style="color: rgb(122, 8, 116);"><strong>)</strong></span> 1997-2000 Information-technology Promotion Agency, Japan
Copyright <span style="color: rgb(122, 8, 116);"><strong>(</strong></span>c<span style="color: rgb(122, 8, 116);"><strong>)</strong></span> 2000-2005 Shikano Lab., Nara Institute of Science and Technology
Copyright <span style="color: rgb(122, 8, 116);"><strong>(</strong></span>c<span style="color: rgb(122, 8, 116);"><strong>)</strong></span> 2005-2012 Julius project team, Nagoya Institute of TechnologyTry <span style="color: rgb(255, 0, 0);">'-setting'</span> <span style="font-weight: bold;">for</span> built-in engine configuration.
Try <span style="color: rgb(255, 0, 0);">'-help'</span> <span style="font-weight: bold;">for</span> run <span style="font-weight: bold;">time</span> options.

5. Last additional thing needed to run Julius smoothly is a julius-voxforge package which can be installed via apt-get by typing in command line:

<span style="color: rgb(194, 12, 185);"><strong>sudo</strong></span> <span style="color: rgb(194, 12, 185);"><strong>apt-get install</strong></span> julius-voxforge

That’s all now you can start to configure it, because it’s not coming configured just out of the box. I’ll write a post in next few days about basic configuration to which link will be added here.

注意事项:

1.readme当中的命令已经发生了变化:

sudo mkdfa.pl sample

export TMP=/tmp

使用Julius搭建一个语音识别引擎这里主要就是听写程序,可以进行一段语音的连续识别,而且主要是针对中文:

一.语音识别引擎的基本结构

基本所有的开源语音识别引擎都是如下的结构,包括:Sphinx,Julius等,下面主要以Julius为例,说明相关的内容:

1.Acoustic Model(声学模型):用于音素的识别。

所使用的技术:

1) HMM(Hiden Mokov Model):

2) GMM(Gaussian Mixture Model):

3)DFA&NFA:

构建自己的声学模型:

可以使用的工具:

2.Phoneme Dictionary(读音词典):用于词语的识别。

构建自己的读音词典:

可以使用的工具:

3.Language Model(语言模型):用于语句的识别。

构建自己的读音词典:

可以使用的工具:

上面的三者3=>2=>1 依次成依赖关系,只要把上面的三者配置好,一个语音识别引擎就搭建好了,其他的就是利用开发包提供API进行客制化开发了。

二.具体操作

以Julius-Voxforge当中的Sample为例,使用Julius主要就是涉及三个文件:

1.sample.grammar:语言文法。

2. sample.voca:读音词典。

3. julian.jconf:语音识别引擎的主要配置文件。在这里指定相面的三大要素.

至于其他文件:

sample.dfa

sample.dict

sample.term

都是通过命令自动生成的---mkdfa.pl sample。

julius开源语音识别引擎相关推荐

  1. 如何使用Julius搭建一个语音识别引擎?

    使用Julius搭建一个语音识别引擎这里主要就是听写程序,可以进行一段语音的连续识别,而且主要是针对中文: 一.语音识别引擎的基本结构 基本所有的开源语音识别引擎都是如下的结构,包括:Sphinx,J ...

  2. 开源python语音识别_5 款不错的开源语音识别/语音文字转换系统

    语音文字转换(speech-to-text)(STT)系统就像它名字所蕴含的意思那样,是一种将说出的单词转换为文本文件以供后续用途的方式. 语音文字转换技术非常有用.它可以用到许多应用中,例如自动转录 ...

  3. Mozilla “Common Voice” 开源语音识别项目

    语音识别技术可能会彻底改变我们与机器的交互方式,但通常技术开发代价昂贵,而且有专利上的使用限制.大多数语音识别技术都被封锁在少数的大公司内.Mozilla认为这样会阻碍创新,因此它发起了"C ...

  4. NVIDIA背书-Kaldi是目前最受欢迎的开源语音识别框架

    全球着名视觉技术厂家NVIDIA在最近的GPU技术大会为Kaldi背书.根据NVIDIA声明,它认为Kaldi是目前全球最受欢迎的开源语音识别框架.该公司在人工智能和语音识别方面投入了大量的资源,重点 ...

  5. 横向对比5大开源语音识别工具包,CMU Sphinx最佳

    目前开源世界里存在多种不同的语音识别工具包,它们为开发者构建应用提供了很大帮助.这些工具各有哪些优劣?数据科学公司 Silicon Valley Data Science 为我们带来了 5 种流行工具 ...

  6. 资源 | 横向对比5大开源语音识别工具包,CMU Sphinx最佳

    选自svds 作者:Cindi Thompson 机器之心编译 参与:李泽南.Smith目前开源世界里存在多种不同的语音识别工具包,它们为开发者构建应用提供了很大帮助.这些工具各有哪些优劣?数据科学公 ...

  7. Windows下编译语音识别引擎Wenet

    Windows下编译语音识别引擎Wenet 一.Wenet简介 二.Wenet首次编译过程 2.1下载第三方库源码 2.2替换软链接 2.3下载gRPC的third_party 三.Wenet第二次编 ...

  8. 开源语音识别软件有哪些?

    开源语音识别软件有很多种, 下面列举几种常见的: Kaldi: 是一种用于语音识别的开源工具包, 支持多种语言, 并且在处理大规模语料库方面有较好的表现. HTK: 是一个用于语音识别.语音合成和语音 ...

  9. 开源语音识别工具包 - CMUSphinx

    开源语音识别工具包 - CMUSphinx 开源语音识别工具包 语音识别简介 语音的构成 识别过程 模型 其他概念 CMU Sphinx 简介 Sphinx初体验 下载 编译 运行 开源语音识别工具包 ...

最新文章

  1. yolov3 onnx nms
  2. 厦大的计算机博士好考吗,2018双非学姐的厦大考博逆袭之路——本硕求学生涯历程...
  3. 语义分割损失函数系列(2):IoU损失
  4. 简单的文本片段替换器
  5. (原) Data Blocks, Extents, and Segments
  6. python propresql mysql_python数据库操作mysql:pymysql、sqlalchemy常见用法详解
  7. 关于json包爆红我有话说
  8. h5 px 转dp_西游女儿国h5手游下载-西游女儿国h5手游下载v2.1.4 安卓版
  9. PLY——Python Lex Yacc
  10. android开发者模式调试程序,Android用开发者模式进行调试时出现的问题及解决方案...
  11. excel去重函数的使用方法_excel技巧分享:不同源文件的excel去重技法汇总
  12. 最害怕的是,不知道想要什么
  13. 【直击】腾讯SaaS加速器首期复试现场:122位CEO争夺30席入场券,激烈!
  14. win10系统关机时提示(程序没有响应)需要结束程序
  15. Win8 纯净版安装详细教程
  16. Linux下,为应用程序添加桌面图标(ubuntu18.4)
  17. 计算机专业去,计算机专业去哪个学校_西信院
  18. WebHtmlEditor Version 1.5.2004.729 Beta1 发布测试
  19. web页面中如何唤起打开APP
  20. 回溯法,子集选择合集

热门文章

  1. 重磅发布!GitHub App 正式上架
  2. Layer.js实现表格溢出内容省略号显示,悬停显示全部
  3. 乐园管理系统| 乐园小程序 | 数字化门店会员管理
  4. 基于微信小程序的校园食堂窗口自助点餐系统#毕业设计
  5. firewalld防火墙配置IP伪装和端口转发
  6. 三维旋转(根据转轴和角度)的公式。罗德里格旋转公式
  7. 大数据比赛第一步——数据分析
  8. Sutherland-Hodgeman 多边形裁剪算法
  9. 求某学生8门课的平均分
  10. PHP教程:PHP开发快速入门_v20200418