一.目的

本人需要一个开源免费的语音库,目的是用来给机器人发指令,也就是说只需要只个简单的词。

二.准备

在windows10、ubuntu18.04下需要成功实现了中文识别。
windows下可以采用:大佬的方法
ubuntu下,依然是这位大佬的延伸,其中en-US文件在

~/.local/lib/python3.6/site-packages/speech_recognition/pocketsphinx-data

中,而不是在~/.local/lib/python3.6/site-packages/pocketsphinx/model中,这个一定要注意,本人就改错了。
别外如果上述大佬的文件链接失效了,本人提供如下:
(本人没有百度网盘会员,下载微有痛苦,特以天翼云盘的方式给出)

https://cloud.189.cn/web/share?code=NNr2E3NzaeEb(访问码:8gnk)

三.详细步骤

  1. 首先把包给安了,既然说了要离线的,还有免费的,所以下面的都是开源的,尽管拿去用。

  2. pip install SpeechRecognition(win)
    pip3 install SpeechRecognition(ubuntu)(下面就不说了,ubuntu下我用的是python3.6)

  3. 接着同样把sphinx、PyAudio给安了,然后将提示的包全安了,嫌速度慢可以参考:如下:
    (注意ubuntu下最好用sudo apt-get install pocketsphinx)(pip3会报错,当然也可以解决pip3报错问题:https://blog.csdn.net/weixin_44895651/article/details/104445102)
    win下链接:https://blog.csdn.net/wxkhturfun/article/details/100387273
    linux下:
    关于pyaudio:https://blog.csdn.net/LCCFlccf/article/details/108313149
    (备注:上述图片截图于https://www.fujieace.com/python/pypi.html)

  4. 然后就是偷梁换柱了
    找到这个路径(没安上面的包当然找不到)

D:\Python\Python37\Lib\site-packages\speech_recognition\pocketsphinx-data

当然,自己的路径自己找,用pip安装的话是在“speech_recognition\pocketsphinx-data”包里了,ubuntu下也一样,在这个路径下你会发现一个名为en-US的文件夹,没错,要是不动这个文件夹,你可以识别英文,比如执行以下代码:

# -*- coding: utf-8 -*-
import speech_recognition as srr = sr.Recognizer()
with sr.Microphone() as source:r.adjust_for_ambient_noise(source) print('say something')# print("")audio = r.listen(source)try:print("Sphinx thinks you said " + r.recognize_sphinx(audio))print("ok")
except sr.UnknownValueError:print("Sphinx could not understand audio")
except sr.RequestError as e:print("Sphinx error; {0}".format(e))

但是我要是想改成中文呢?这里可以用我的中文包拿去(2020年4月初下的),直接用下面的包替换原来的en-US即可(当然做人要留条后路,万一以后要识别英文呢,还是备份原来的吧)
天翼云盘链接:(百度网盘本人没有会员,等有会员再改吧)
https://cloud.189.cn/t/yArAbyIVZb6r
同样运行上面的代码,大概率事件是可以识别中文了。

  1. 精确一点?
    有些词识别的不是很准?总不能自己去训练语音吧,本人上次把PC跑死也没跑动(当然你有服务器另说)。
    下面给出一个“将错就错”的办法,比如:上述python代码,我说“右转”,它老是显示“柔道”;那么找到en-US下的“pronounciation-dictionary.dict”,直接将“柔道”两字改为“右转”。
    呃—本人也觉得粗暴了点,但是赶时间,能用就行。
    然后你还可以缩小范围,毕竟大不了让它识别不出来重复识别自己多说几次就行了,总比识别出一个错误的好。直接删除“pronounciation-dictionary.dict”里面不需要的,比如提取成这样:
    https://cloud.189.cn/t/qE7zii7baqqa
    现在确实大功造成了,ubuntu18.04(其他版本的不知道)下同样适用。
    参考:
    https://blog.csdn.net/qq_40965177/article/details/86766703
    https://blog.csdn.net/itas109/article/details/78999477

ubuntu离线中文语音识别相关推荐

  1. 开源(离线)中文语音识别ASR(语音转文本)工具整理

    开源(离线)中文语音识别ASR(语音转文本)工具整理 目录 文章目录 目录 @[toc] open ai 的开源工具:whisper whisper介绍 引用 ASRT语音识别项目 ASRT介绍 引用 ...

  2. Android应用离线中文语音识别PocketSphinx (免费哦~)

    该文章重点在中文语音识别的应用上 目录 前言 一.不太推荐的知名demo 1.官方demo PocketSphinx (https://github.com/cmusphinx/pocketsphin ...

  3. DFRobot语音识别模块推荐-Gravity: I2C离线中文语音识别模块

    语音识别模块介绍 DFRobot语音识别模块使用Gravity I2C接口通信,兼容绝大部分主控,非常适合接入教育场景使用.三种语音识别模式和三种语音输入方式使模块可以集成入更多的场景. 这块语音识别 ...

  4. IOS音视频(四十六)离线在线语音识别方案

    IOS音视频(四十六)离线在线语音识别方案 IOS音视频(四十六)离线在线语音识别方案 方案一:Siri语音识别 Siri语音识别简介 Siri语音识别功能类介绍 Siri语音识别功能集成 方案二:百 ...

  5. 【项目管理】Java离线版语音识别-语音转文字

    Java离线版语音识别-语音转文字 1.项目前言 2.Vosk介绍 3.项目开发 3.1 项目准备 3.2 model 准备 3.3 测试音频准备 3.4 代码实现 4.效果演示 4.1 界面效果 4 ...

  6. 实战:基于tensorflow 的中文语音识别模型 | CSDN博文精选

    作者 | Pelhans 来源 | CSDN博客 目前网上关于tensorflow 的中文语音识别实现较少,而且结构功能较为简单.而百度在PaddlePaddle上的 Deepspeech2 实现功能 ...

  7. kaldi上第一个免费的中文语音识别例子

    今天在清华大学cslt实验室王东老师的分享下,kaldi终于有了免费的中文语音识别的例子,网址为:https://github.com/kaldi-asr/kaldi/tree/master/egs/ ...

  8. 解决Ubuntu系统中文乱码显示问题,终端打开文件及查看目录

    解决Ubuntu系统中文乱码显示问题 [日期:2014-02-20] 来源:Linux社区  作者:njchenyi [字体:大 中 小] 我是先安装了Ubuntu 12.04 Server,然后安装 ...

  9. 【ubuntu】中文输入法安装二三事

    本来很愉快地刷着JS程序,很有感慨啊,想写篇博客记一下学习笔记,结果忘记了博客账号,后来通过邮箱找回了之后想要开始写..发现ubuntu的中文输入法不能用啊(其实不是不能用,就是小白没搞清楚状况,双系 ...

  10. 学典教育计算机二级,层次化分类的离线中文签名真伪鉴别方法-计算机工程与应用.PDF...

    层次化分类的离线中文签名真伪鉴别方法-计算机工程与应用 112 2018 ,54(8) Computer Engineering and Applications 计算机工程与应用 层次化分类的离线中 ...

最新文章

  1. oracle的for和i++
  2. 7能进安全模式但正常启动黑屏_电脑进入系统后黑屏怎么解决
  3. jQuery版AJAX简易封装
  4. reactor线程模型_从TCP服务器到I/O模型,带你学习Netty
  5. 由奥迪车灯想到的前端动画
  6. 由百度 “PHP薪资” 引发的思考
  7. 如何在CentOS 7.x / RHEL 7.x上搭建Docker Private Registry(Docker私有仓库)
  8. awk if 不包含_linux高级运维必会命令——AWK命令详解及实例分享
  9. Spring与SpringMVC的区别
  10. 解题:POI 2008 Station
  11. 分享餐饮管理组织结构流程图模板
  12. python(分隔符)
  13. 苹果录屏没声音_iPhone XR突然没声音如何解决?西安苹果售后维修点教你几招方法...
  14. java实现身份证正反面图片的身份信息的识别
  15. python重启路由器_Python实现路由器的重启和查看实时流量
  16. 储能国际IPFS百城节点峰会广州站完美落幕,引领IPFS新时代!
  17. Linux编程入门四进程
  18. python怎么画人像_教你如何用Python画出心目中的自己
  19. Java ee 应用层重点协议http协议
  20. 洛谷 P1219八皇后

热门文章

  1. android 8.1官方刷机包,一加5T安卓8原生系统刷机包(安卓原生固件升级包V8.1.0)...
  2. jar文件打不开,用什么打开
  3. Postman使用详解
  4. react router BrowserRoute部署后页面空白问题
  5. 医药行业的销售数据如何分析?
  6. 2021申请邓白氏编码最新操作手册
  7. 关于天猫(淘宝)评论爬虫
  8. 1194:移动路线(递推)
  9. Java并发练习:exchange简单使用
  10. FPGA零基础学习之旅#1 AC620V2开发板测试