为什么80%的码农都做不了架构师?>>>   

最近语音识别很火,但是都是用的在线语音识别,研究了一下离线语音识别,小范围内的语音识别率还不错,在此记录一下

首先本文要说的两个前提1.android平台离线语音识别 2.小范围语音

小范围语音指的是相对固定的命令。本文的例子大概实现了20条语音命令,超出范围的无法识别。因此本文中离线语音的使用范围也有限,对于一些固定的输入可能有用,比如用语音命令代替打开,播放,重启这些简单的固定的命令。

先上个例子

1.按照 http://leiwuluan.iteye.com/blog/1287305 的方法,先跑一个PocketSphinxDemo的例子起来。跑起来之后会发现语音识别率很低,大概20%不到。下面来优化一下

2.编写自己的命令集

<s>百度</s>
<s>谷歌</s>
<s>音乐</s>
<s>抬头</s>
<s>低头</s>

保存为command.txt

在http://www.speech.cs.cmu.edu/tools/lmtool.html上点Browse,提交command.txt,在线生成语言模型文件。这里只要生成的lm文件,命名为test.lm。从这里下载pocketsphinx-win32,解压后在/model/lm/zh_cn有个mandarin_notone.dic的文件,打开后,搜索command.txt里面的词,然后替换相应的内容,替换后的内容如下

 存为test.dic

3.替换语言模型文件。下载附件中的data.zip,解压后文件如下(之前附件中的data不可用,已更新)

分别放到一下目录

/sdcard/Android/data/test/hmm/tdt_sc_8k
/sdcard/Android/data/test/lm/test.dic
/sdcard/Android/data/test/lm/test.lm

如果要换目录的话,对应修改RecognizerTask.RecognizerTask()里的如下代码

c.setString("-hmm", "/sdcard/Android/data/test/hmm/tdt_sc_8k");
  c.setString("-dict", "/sdcard/Android/data/test/lm/test.dic");
  c.setString("-lm", "/sdcard/Android/data/test/lm/test.lm");

lm和dic文件即3中生成的文件,tdt_sc_8k也可以从这里下载。

4.文件准备完毕,重新跑1中的demo。语音输入2中的命令,识别率99%以上,但是输入命令集以外的无法识别。

6.附件为工程文件,将data解压,按照3里面写的位置放到sd卡里面即可。以下字典内的词可以识别

转载于:https://my.oschina.net/VenusV/blog/703397

Android平台使用PocketSphinx做离线语音识别,小范围语音99%识别率相关推荐

  1. 离线语音识别软件_从音乐识别软件起家,这家公司如何备战车载AI语音市场GGAI对话...

    加入高工智能汽车专业行业群(自动驾驶5群,车联网智能座舱3群,智能网联商用车2群),加微信:17157613659,出示名片,仅限智能网联汽车软硬件供应商及OEM厂商. 早在2016年,亚马逊推出的语 ...

  2. Ubuntu20.04 使用Python实现全过程离线语音识别(包含语音唤醒,语音转文字,指令识别,文字转语音)

    一.简单说点   因为手头有一个项目,该项目需要在香橙派上实现语音控制,并且带有语音唤醒功能.简单来说,就是通过唤醒词唤醒香橙派,然后说出相关指令,香橙派去执行指令.   但是,在弄香橙派的时候,自带 ...

  3. 搭乘百度语音识别技术,录音啦识别率最高可达95%

    [猎云网(微信:)武汉]12月22日报道(文/盛佳莹) 在开会.演讲.采访等多个工作场景中,由于传统记录形式对大量快速信息的收取不足,我们都会运用到录音来帮助我们记录.然而,录音整理却又成为了一项耗时 ...

  4. 高通android平台修改开机小企鹅logo

    高通平台修改开机画面 小企鹅LOGO 高通android平台修改开机小企鹅logo 方法一 方法二 高通android平台修改开机小企鹅logo 高通android平台开机lk阶段默认使用小企鹅log ...

  5. CMUSphinx免费离线语音识别开源库教程iOS开发

    CMUSphinx开源语音识别工具包,可以基于CMUSphinx开发iOS版本的语音识别和语音合成库. 本文介绍的语音识别库使您可以轻松快速地将多种语言的离线语音识别和合成语音添加到iOS应用程序中. ...

  6. 移植cocos2d-x 游戏从Android平台到IOS平台分辨率问题及解决办法

    问题描述: 因为游戏刚开始设计时是在Android平台上运行的,所以使用的是当时Android主流的分辨率(800 * 480), 使用cocos2d-x在其他Android平台可以做到等比例缩放,所 ...

  7. Android App开发语音处理之系统自带的语音引擎、文字转语音、语音识别的讲解及实战(超详细 附源码)

    需要源码请点赞关注收藏后评论区留下QQ~~~ 一.系统自带的语音引擎 语音播报的本质是将书面文字转换成自然语言的音频流,这个转换操作被称作语音合成,又称TTS(从文本到语音)在转换过程中,为了避免机械 ...

  8. android 人脸识别 方法研究,基于Android平台的人脸识别技术研究

    摘要: 在计算机视觉与模式识别领域中,人脸检测与识别技术是一个非常热门的研究课题,同时也具备非常广阔的商业价值.在诸多的目标检测算法中,基于AdaBoost算法的目标检测方法具有检测速度快,检测效果好 ...

  9. android 语音识别 离线,Android离线语音识别 PocketSphinx

    本文将使用PocketSphinx来实现Android平台的离线语音识别 优点: 离线,不用联网 识别较准(大家都说99%  我觉得只有80%) 缺点: 自定义语音命令麻烦  只能小范围识别 网上看了 ...

最新文章

  1. 取出json中的数据php,怎么从Json中取出数据放到一个新组中
  2. 在Mac上使用Nginx和FastCGI部署Flask应用
  3. B2B行业网站编辑轻松创造内容,提高搜索权重
  4. 阿里云异构计算团队亮相英伟达2018 GTC大会
  5. mime设置 压缩html,MIME设置功能
  6. 编辑器笔记——sublime text3 编译sass
  7. 关于select标签曾经踩过的几个坑!
  8. VC6.0+XT库+OPENCV1.0调试笔记
  9. 中国省份城市0-N编号
  10. 配置修改Tomcat端口
  11. Unity 真机调试工具 LogViewer
  12. asterisk注册河南联通ims
  13. Java IO中涉及到的哪些类以及哪些设计模式
  14. IAR下载: Failed to get cpu status after 4 retrie 的解决方法
  15. properties解耦数据库参数和SQL参数的传递
  16. 面试系列之-如何选择外包与自研公司
  17. QT运行时问题CreateDC failed
  18. 之江汇空间如何加音乐背景_互动课堂的使用|之江汇互动课堂如何使用?之江汇互动课堂使用方法...
  19. 《大学章句集注》-读书笔记之二
  20. 梦几月,醒几年,今夕是何年。又一年,任时光流逝,回首已是2022年

热门文章

  1. AI人工智能开发的路径有三条,最成功的是机器学习技术:强化学习
  2. 如何实践AI深度学习的十大惊艳案例
  3. 任正非:管理就要铲除公司夹心层!
  4. CTO多要会刷脸--
  5. jieba之sedict(自定义字典)
  6. 秦川团队《科学》刊发研究:新冠感染恒河猴康复后不会再感染
  7. RISC-V会彻底改变计算吗?
  8. 物理史2000年来最精彩的对决!
  9. 在物理学的语言里,“生命”是什么?
  10. 2019 半导体领袖新年展望(一)| 半导体行业观察