kaldi中文语音识别
目录
kaldi是什么
kaldi与中文语音识别
编译与安装kaldi
用kaldi进行中文语音识别
本文记录了我编译安装kaldi和两种用kaldi进行中文语音识别的过程,包括如何kaldi的简单介绍、环境的配置、相关模型的训练、导入,算是自己近期学习的一个总结,也希望可以帮助到需要的人~~~
kaldi是什么
kaldi是一个用C++写的语音识别工具包。kaldi旨在供语音识别研究员使用。当然,kaldi也可以用作声纹识别。关于他的详细介绍可以访问kaldi的官方文档
kaldi与中文语音识别
感谢很多大神与科研工作者在kaldi上开源了他们的数据集和训练模型,让我这样的小白可以站在巨人的肩膀上前行。
编译与安装kaldi
注意:为了提高训练的速度,kaldi最好安装在GPU云服务器下。如果没有服务器话,使用虚拟机应该也是可以的,但一定要分配足够的内存空间和存储空间。下面我就以我使用的centos服务器为例,介绍kaldi的编译与安装。
编译与安装大概分为3步
安装git、下载kaldi的源码
安装编译所需依赖包
配置、编译kaldi
1.kaldi的下载
kaldi的所有源码开源在了GitHub上,可以直接git下载到服务器上,首先得确保服务器上安装了git,如果没有安装的话,就先安装git sudo yum install git -y
接着git clone下载kaldi
git clone https://github.com/kaldi-asr/kaldi.git
下载完成kaldi源码后,我们将得到如下一个文件结构的目录。
kaldi/
├── COPYING
├── egs/ //egs目录里存放了使用kaldi完成的开源语音识别/声纹识别项目
├── INSTALL //编译安装kaldi的指导
├── misc/
├── README.md
├── scripts/
├── src/ //src文件夹里存放了kaldi源码
├── tools/ //tools文件夹里存放了语音处理的工具包
└── windows/ //windows文件夹存放了在windows下编译安装kaldi的文件
2.安装编译所需要的依赖包
编译之前需要确操作系统中安装有如下包
subversion
automake
autoconf
libtool
g++
zlib
libatal
wget
sox
首先进入到kaldi/tools目录下,接着在调用check_dependencies.sh脚本检查系统中的包是否安装完全
cd kaldi/tools
extras/check_dependencies.sh
如图所示,这个shell脚本会提示系统需要安装的包,按照提示安装即可。
安装完成后再次运行这个脚本,如果提示OK就可以开始进行kaldi的编译。
3.编译kaldi
首先编译tools,在在kaldi/tools目录下输入
make
我使用的服务器是i7有8个核心,因此输入make -j 8可以使用8个核心一起编译,加快编译速度。
之后转到kaldi/src目录下,输入如下命令
cd ../src
在src目录下首先要运行configure进行配置,由于每个人的cuda版本、安装路径不一定相同,所以这里需要根据自己的服务器情况进行修改,如下是我的configure配置方案,仅供参考。
./configure --static \
--use-cuda=yes \
--cudatk-dir=/home/zy/cuda/cuda-8.0 \
--mathlib=OPENBLAS \
--openblas-root=../tools/OpenBLAS/install \
--threaded-math=no \
--static-math=yes \
--static-fst=yes \
--fst-root=../tools/openfst
配置完成后,就可以进行src的编译了
make depend
make
同样,如果是多核CPU的话,你可以使用make depend -j 8和make -j 8加快编译速度
完成后会有提示成功和失败,结束make后就算完成了kaldi的编译与安装了~
用kaldi进行中文语音识别
完成kaldi的安装后,就可以用kaldi做语音识别了~
参考资料:
kaldi-ctc的安装、编译、测试
{
Author: "byr-zyziszy",
Mail: "test@foxmail.com",
Github: "https://github.com/jbase",
Date: "2020-6-12"
}
kaldi中文语音识别相关推荐
- kaldi中文语音识别(1)
版权声明:本文为博主原创文章,未经博主允许不得转载. https://blog.csdn.net/zyziszy/article/details/82919957 </div><li ...
- kaldi中文语音识别_基于thchs30(3)
接上回,我们继续看run.sh #you can obtain the database by uncommting the following lines #[ -d $thchs ] || mkd ...
- kaldi中文语音识别thchs30模型训练
1.准备thchs30中文数据集 今天开始做语言模型啦,数据集采用的是清华大学的中文数据集thchs30,下载地址在http://www.openslr.org/18/ ,由于是在服务器做训练,以下步 ...
- kaldi中文语音识别_基于thchs30(7)
接上回,mfcc特征咱们暂时看完了,总结一下,此处引用别人的分析: 特征提取 MFCC compute-mfcc-feats.cc Create MFCC feature files. Usage: ...
- 基于Kaldi的语音识别
cnblog: https://www.cnblogs.com/ye-buaascse/ 第二十九届"冯如杯"学生学术科技作 品竞赛项目论文 基于Kaldi的语音识别 摘要 近年来 ...
- kaldi上第一个免费的中文语音识别例子
今天在清华大学cslt实验室王东老师的分享下,kaldi终于有了免费的中文语音识别的例子,网址为:https://github.com/kaldi-asr/kaldi/tree/master/egs/ ...
- 实战:基于tensorflow 的中文语音识别模型 | CSDN博文精选
作者 | Pelhans 来源 | CSDN博客 目前网上关于tensorflow 的中文语音识别实现较少,而且结构功能较为简单.而百度在PaddlePaddle上的 Deepspeech2 实现功能 ...
- 基于深度学习的中文语音识别系统框架(pluse)
目录 声学模型 GRU-CTC DFCNN DFSMN 语言模型 n-gram CBHG 数据集 本文搭建一个完整的中文语音识别系统,包括声学模型和语言模型,能够将输入的音频信号识别为汉字. 声学模型 ...
- 随想录(从kaldi学习语音识别)
[ 声明:版权所有,欢迎转载,请勿用于商业用途. 联系信箱:feixiaoxing @163.com] 语音识别是一个技术活.之前一直不是很了解,特别是听到梅尔倒谱系数.GMM.HMM.DNN.NLP ...
- 基于深度学习的中文语音识别系统框架搭建
基于深度学习的中文语音识别系统框架 转自@https://blog.csdn.net/chinatelecom08/article/details/82557715 本文搭建一个完整的中文语音识别系统 ...
最新文章
- MySQL · 最佳实践 · 什么时候该升级内存规格
- 前端学习(2378):使用vue-cli初始目录说明
- java中实现工厂日历_Java Calendar实现控制台日历
- GridView网格控件
- (转)Docker 基础 : Dockerfile
- Apache的目录结构详细讲解
- 工业相机参数及选型参考
- java代码意思,[求助]java代码的意思?
- C#使用selenium写爬虫提高速度的关键
- C# 颜色的梯度渐变
- IE浏览器版本检测小结
- 南华大学计算机学院软件工程双一流,南华大学计算机学院软件工程与网络工程两个专业喜获湖南省高校专业综合评价A级...
- 2021-5月14日-今日收获
- 美国佐治亚大学计算机专业,美国计算机专业大学排名TOP10
- G - Ugly Numbers
- 锐捷网络2010年程序员C语言试题
- vl6180开发记录
- 夜晚的天空为什么是黑的?
- 南开大学计算机考博参考书目,南开大学考博参考书
- VS添加动态链接库的两种方法
热门文章
- Java图形用户界面(容器)
- 计算机考试后进先出,事业单位考试计算机基础知识:建立单链表——后进先出表...
- oracle英文怎么转中文,ORACLE英文字符集转中文
- espeak 开源离线语音合成工具
- 口算训练 HDU - 6287
- 如何求地球上两点之间的最短距离_高中数学“最实在”的蒙题技巧,让高中数学短时间内突破120分...
- 985大学计算机专业高考录取分数线,985大学历年录取分数线
- 魔兽世界插件编写-第一个插件-空插件 EmptyAddOns
- JetSmartFilters: 如何制作搜索过滤器(1) 使用Jet-Engine
- 2016.11.03回顾 more excel交换两列