DEMO简介:

这是一个中文普通话语音识别的最简单DEMO,LilyMandarinSpeechRecognition V1.0。

首先给出这款软件的下载链接:

或者 http://vdisk.weibo.com/s/AUDeE/1368171209

语音不仅是人类之间进行信息交流最自然,最有效,最方便的工具,而且也是人与机器之间进行通信的重要工具。语音识别(Automatic Speech Recognition,ASR)技术能够让机器听懂人的声音,并做出正确的反应。本DEMO完全通过HTK工具()搭建。感谢HTK工作组对语音识别研究领域做出的伟大贡献。

使用方法:

将所有文件解压到同一文件夹下,要求此文件夹的完整路径(例如D:Demos_ProjectsLilyMandarinSpeechRecognitionDEMO_LilyMandarinSpeechRecognition)中没有空格或者其他奇怪的符号(例如&等)。然后双击LilyMandarinSpeechRecognition.exe,可以得到如下界面

然后点击OPEN打开波形文件,例如F05A62.wav,得到如下界面

然后我们可以选择播放PLAY或者其他的操作,这里我们仅演示DEMO的主要功能—语音识别,点击识别RECOGNIZE,这时候HTK就上场了,得到如下的界面

现在就是用HVite进行解码识别,速度较慢,识别一句话需要10秒左右,所以请稍微耐心一些。识别结束之后,就会出现如下的识别结果

此时用户可以播放音频,并对照识别结果。

后期我们的主要工作将是提高识别速度以及识别精度。

谢谢您的阅读和时间。

DEMO Description:

This is a Mandarin Chinese speech recognition easiest Demo LilyMandarinSpeechRecognition V1.0.

Voice is not only a human between the exchange of information is the most natural, the most effective, most convenient tool, but also an important tool of communication between man and machine. Speech recognition (Automatic Speech Recognition, ASR) technology enables the machine to understand the human voice, and make the right response. The DEMO completely through the the HTK Tools (http://htk.eng.cam.ac.uk/) structures. Thanks for the great contribution made by the the HTK working group on the field of speech recognition research.

转载本文请联系原作者获取授权,同时请注明本文来自石自强科学网博客。

链接地址:http://blog.sciencenet.cn/blog-907554-714371.html

上一篇:wav文件切割小工具LilyWavCut.exe

下一篇:参加IJCAI2013会议

科学网—中文普通话语音识别DEMO,LilyMandarinSpeechRecognition V1.0 - 石自强的博文...相关推荐

  1. 基于HTK中文普通话语音识别DEMO,LilyMandarinSpeechRecognition V1.0

    DEMO简介: 这是一个中文普通话语音识别的最简单DEMO,LilyMandarinSpeechRecognition V1.0. 首先给出这款软件的下载链接: DEMO_LilyMandarinSp ...

  2. 中文普通话语音识别开源数据集(持续更新)

    中文普通话语音识别开源数据集,截止到2022.11.21 数据集 时长(h) 人数 标注准确率 下载链接 开源协议 备注 thchs30 30 40 - openslr.org Apache Lice ...

  3. 荧光平均值计算matlab,科学网—使用Image J进行自动荧光定量分析 - 陆绮的博文...

    在这里我整理我最近使用ImageJ软件自动数细胞以及定量分析荧光强度的步骤. ImageJ的主面板: 打开文件 File → Open →'.zvi' 先把2D的所有图叠加起来,选项选max inte ...

  4. bam文件读取_科学网—Pacbio Sequel两种bam文件解析 - 卢锐的博文

    pacbio目前有两种主流的测序平台,RSII和Sequel,后者是前者的升级版. pacbio sequel下机是bam格式的reads文件,它和reads比对到参考基因组上生成的bam文件,内容有 ...

  5. 摄影测量学和计算机视觉,科学网—摄影测量与计算机视觉——系列1 光与视觉 - 季顺平的博文...

    摄影测量与计算机视觉 (1)光与视觉 1.要有光 137亿年前,婴儿宇宙仅仅存在了三分钟.这是一个核熔炉,空间充满了疯狂的等离子体.电磁力已从超力中分离出来:作为电磁力的信使,光子,随之诞生.然而,在 ...

  6. linux中怎么卸载gamit,科学网—Windows下自带Linux使用GAMIT问题 - 陈超的博文

    1.安装略微变化 sudo apt-get update sudo apt-get install gcc sudo apt-get install gfortran sudo apt-get ins ...

  7. dynamic time warping matlab,科学网—【科研速记】Dynamic time warping - 李冰的博文

    DTW的作用 Dynamic time warping 简称DTW,用于计算两个时间序列之间的相似性的算法,也可以理解找到两个时间序列之间的最佳匹配.DTW最著名的用途应该是用于语音识别. Figur ...

  8. 计算机专业教育,科学网—中国大学计算机教育路在何方? - 吴军的博文

    硕士研究生毕业的时候,因成都的高校都只要博士,当初又特别想进高校,于是去了重庆的一所三流本科院校应聘.由于我是搞工程实践的,做的东西偏应用,理论研究较少.我发表的第一篇论文没有经过我的导师审核,完全由 ...

  9. linux中硬链接文件,科学网—Linux:文件的符号链接和硬链接 - 刘洋洋的博文

    参考:中国大学MOOC课程<Linux系统管理>,授课教师:颜晨阳. 推荐阅读: t.cn/RLXkhpc 1 符号(symbolic)链接 与Windows的快捷方式很像,这些文件很小, ...

最新文章

  1. Linux之查找文件命令
  2. eip协议通信_3月免费公开课伺服、通信等课程重磅发布,火热报名中
  3. 交互流程_交互装置详细创作流程全解
  4. arcgis 卸载和注册表相关总结
  5. 为什么Nginx性能比Apache高
  6. SAP Fiori Elements 公开课第一单元概要介绍
  7. (四)RabbitMQ消息队列-服务详细配置与日常监控管理
  8. java作业——Day0014
  9. controller层没反应_一脚踏空就没命!57岁民警33层楼顶飞身救人
  10. 我整理的一份来自于线上的Nginx配置(Nginx.conf),希望对学习Nginx的有帮助
  11. fuzzy仿真 MATLAB,基于Matlab的Fuzzy-PID控制器的设计与仿真
  12. vue项目 报sockjs.js?9be2:1606 GET http://192.168.43.226:8080/sockjs-node/info?t=1584966826465 net::ERR
  13. windows开机后一键启动应用程序
  14. IPAD2降级ios6教程整合
  15. 杨幂晒七月孕肚揭怀孕只胖baby不胖身材的女星
  16. Unity2D入门(二):图层layer和角色建立
  17. Qt(一)消息提示框
  18. 2563: 阿狸和桃子的游戏
  19. opencv需要安装mysql吗_OpenCV2.4.3的新特征以及安装方法
  20. 多模态交互在,数智化营销服中的技术实践

热门文章

  1. MFC Bitmap::FromBITMAPINFO返回空问题
  2. mybatis(数据库增删改查)
  3. windows服务与前台交互
  4. 《网管员世界2009超值精华本》上市啦!!!
  5. 【Python 安装】安装第三方库时 PermissionError: [WinError 5] Access is denied
  6. sklearn 文本处理
  7. 辨异 —— 逻辑之辨、人文社科观念
  8. 正则表达式 —— 一种模式描述语言(贪婪匹配与惰性匹配)
  9. 古文观止 —— 千古名篇
  10. python怎么读write_python中write方法是如何使用?