今天是周末,想来想去,还是写一篇这样的博文吧。算是对语音识别这一段时间的总结,为后来的人融入铺好前面的路。这个只是工具箱的综述,不是语音识别的综述。希望您有所收获。

目前,语音识别领域公开的开源的代码或者说工具箱有:sphinx,htk,julius,kaldi。也许也有其他的吧。下面我尽量一一介绍:

1.sphinx:这个是李开复的博士论文。后面不断的壮大,有了后来的版本。这个比较小,实现起来也比较简单点吧。

网址:http://cmusphinx.sourceforge.net/

网上有很多sphinx的资料:

1)最著名的当属Sphinx武林秘籍这个系列。作者很详细的说明了一切,值得你去参考和实验。

2)zouxy09博文的这个系列也很清楚的说了sphinx。

如果你想实验,基本这些资料就很全了。你可以很好的做些实验了。最近也看到调用sphinx的接口放到安卓等一些平台上,所以在我看来这个开源虽然有点老,但是我觉得还是很不错的。还是有很多东西需要人去挖掘的。

2.htk :这个虽然说是隐马尔科夫(HMM)工具箱,但是基本是为语音识别专用。与sphinx相比,htk的知名度一直很高,一直长久不衰。很多语音识别的论文的实验都是基于这个实现的。在深度学习之前,基本很多的语音识别实验都是他垄断的。

网址:http://htk.eng.cam.ac.uk/

htk的资料还是很多的,htkbook是最好的资料,虽然是英文,而且很多页。但中国人还是有才的,有人翻译了前三章,大家可以去读读。很经典的书吧,读完你基本会对语音识别过程有个简单的认识吧。当然,想入门就得做实验。前面的几个博文基本介绍了。先贴我的博文吧:

1.语音识别系统之htk------孤立词识别(yesno)

2.语音识别系统之htk-----连续语音识别

其他的资料我在上面的博文里都提到了。htk博大精深,我们后续还会继续添加资料的。

3.julius:这个是日本人弄的一个语音识别系统。我自己不是很熟悉。

网址:http://julius.sourceforge.jp/en_index.php?q=en/index.html

这个网址有很多资料,比如下载和book等等。有人写了一篇论文:基于Julius的机器人语音识别系统构建。其他的资料还是比较少。如果有时间我也愿意去把这个补全。

4.kaldi :这个我一直比较有兴趣吧。因为有深度学习的内容。最近,深度学习在语音识别上的运行已经很好了,把语音识别提高到了一个很高的标准了。

网址:http://kaldi.sourceforge.net/

中文的资料可以参加我的博文:

1.语音识别工具箱之kaldi介绍 ,比如一些实例,你也可以去看看我的博文了。具体的不贴链接了。

2.povey写的四篇文章。在kaldi代码里有个doc里面有。大家自己去查看下吧。这个工具箱的中文资料实在太少,我也就根据自己的实验写出了些东西。希望你们可以有所收获吧。还有自己可以去看povey的个人主页,里面有资料哦。http://www.danielpovey.com/index.html这个是主页网址。

许多使用kaldi的原因大多由于kaldi支持深度学习的dnn模型。希望kaldi能够壮大吧,如果你有数据库,在kaldi上实验是件简单的事情。因为脚本都写好了。

至此,工具箱就介绍完毕。

下面我们就介绍些目前的市场产品说说吧。

国内产品有:讯飞语点,百度助手等。

国外产品有:谷歌的google now ,苹果的siri,微软的Speech SDK 和操作系统里的语音识别。

我用过的讯飞语点,原来的不是很准,但越用越准确。感觉和推荐系统差不多吧。百度助手的确不是还好,不知道现在改进没?百度的深度学习研究院还是很好的,有余凯老师在,希望可以很好的推出自己的产品。如果明年招了我,那就好了。呵呵……希望余凯老师可以把语音产品做的更好吧……讯飞就不用说了,国内语音的领导者,关键在我大安徽,呵呵……其他的语音公司有云知声,腾讯微信的语音识别,等等其他的。科研机构有中国科技大学,清华大学,中科院的自动化研究所等等都很不错的。唯独我们学校似乎没什么进展。

国外的科技公司在语音上面都很猛的,暑假上过微软邓力老师的深度学习的课。微软的语音识别还是很不错的。谷歌的和苹果的就不用说了。我希望中文的比他们好就可以了。呵呵……

大家可以多去用用这些产品吧。多帮这些去改进自己的识别系统。

感觉写的有点多了,以上也就是我的一些认识吧。希望对你有用,欢迎和我交流和讨论。争取早日自己可以写一个语音识别的综述。加油……

语音识别工具箱综述和产品介绍相关推荐

  1. 【miscellaneous】语音识别工具箱综述和产品介绍

    原文:http://www.thinkface.cn/thread-893-1-1.html 今天是周末,想来想去,还是写一篇这样的博文吧.算是对语音识别这一段时间的总结,为后来的人融入铺好前面的路. ...

  2. 语音识别工具箱之HTK安装与使用

    转自@http://www.cnblogs.com/mingzhao810 语音识别工具箱之HTK安装与使用 HTK(HMM Toolkit)一款基于hmm模型的语音处理工具,早就听说它了,一直因为用 ...

  3. 端到端流式语音识别研究综述——语音识别(论文研读)

    端到端流式语音识别研究综述(2022.09) 摘要: 引言: 1 端到端流式语音识别模型 1.1 可直接实现流式识别的端到端模型 1.2 改进后可实现流式识别的端到端模型 1.2.1 基于单调注意力机 ...

  4. python调用htk工具箱_语音识别工具箱之HTK安装与使用

    HTK(HMM Toolkit)一款基于hmm模型的语音处理工具,早就听说它了,一直因为用MATLAB中的工具箱在学习,或自己写代码在做HMM方面的试验,所以没有接触到它.现在,上海朋友家里的网速超赞 ...

  5. 语音识别研究综述——阅读笔记4(总结与展望)

    总结 目前主流的语音识别方法大多基于深度神经网络,这些方法大体分为两类: 一类是采用一定的神经网络取代传统语音识别方法中的个别模块,如特征提取.声学模型或语言模型等:另一类是基于神经网络实习端到端的语 ...

  6. 语音识别技术综述(转)

    语音识别是一门交叉学科,语音识别正逐步成为信息技术中人机接口的关键技术,语音识别技术与语音合成技术结合使人们能够甩掉键盘,通过语音命令进行操作.语音技术的应用已经成为一个具有竞争性的新兴高技术产业. ...

  7. 语音识别研究综述——阅读笔记3(端到端语音识别、语音识别的难度与热点)

    端到端语音识别 传统语音识别由多个模块组成,彼此独立训练,但各个子模块的训练目标不一致,容易产生误差积累,使得子模块的最优解并不一定是全局最优解. 针对这一问题,提出了端到端语音识别,直接对等式(1) ...

  8. Kaldi学习笔记——The Kaldi Speech Recognition Toolkit(Kaldi语音识别工具箱)(上)

    最近看了有关KALDI的论文,在这里介绍一下. Abstract: We describe the design of Kaldi, a free, open-source toolkit for s ...

  9. 语音识别工具箱之kaldi介绍

    最近有几个人在群里问我kaldi的问题,不巧的是最近我在忙我的开题.我对kaldi的了解也就是语音识别+深度学习.如果不是kaldi有dnn模型,或许我更愿意用htk吧.其实,基本的都差不多吧.kal ...

最新文章

  1. java中strictfp关键字,java strictfp关键字用法大全详解
  2. php word组件使用方法,快速解决PHP调用Word组件DCOM权限的问题讲解
  3. 如何在Linux(CentOS, Debian, Fedora和Ubuntu)上安装MyCLI
  4. NO_CHANGE_ALLOWED error code
  5. bem什么意思_BEM命名法
  6. Java高并发编程详解系列-线程生命周期观察者
  7. 键盘扫描并控制数码管C语言,CH454 数码管显示驱动和键盘扫描控制芯片
  8. Netty源码解析1-Buffer 1
  9. CIO:IT优化刻不容缓
  10. android烧写固定MAC,小系统SN号和MAC地址快速烧录的方法与流程
  11. 【处理办法】USB插入TF卡或SD卡,计算机提示需格式化
  12. 【0709作业】简易的购房商贷月供计算器
  13. Oracle学习3:dual详解
  14. 2020最新版python基础入门学习视频教程
  15. python寻峰算法_在python中快速查找峰和质心
  16. 用Python写一个UI界面
  17. 一文网尽CV/Robotics顶会论文常用高级词汇/句式!
  18. 数据转移高效方法(oracle)
  19. C++最精准的RGB-HSB(HSV)-HSL的色值转换
  20. MySql进阶-间隙锁(gap-key)

热门文章

  1. Java学习之旅-04
  2. FPGA——FIFO
  3. ftp主动模式和被动模式的区别
  4. 用于播放硬盘中avi视频的简单程序(opencv)
  5. 看尚学堂视频Java学习笔记
  6. Java-通过年和月获取当前月有几个周一并获取周一的日期
  7. 10款超级优雅的Go语言开发工具
  8. Unity正在将云渲染市场拱手相让!
  9. 问题 E: 来淄博旅游
  10. 分别利用opencv和matplotlib.pyplot来展示图片