一、PocketSphinx  安装

1、RedHat/CentOS:yum install pulseaudio-libs-develUbuntu/Debian:apt install libpulse-dev2、git clone --recursive https://github.com/bambocher/pocketsphinx-python
3、cd pocketsphinx-python
4、vim pocketsphinx-python/deps/sphinxbase/src/libsphinxad/ad_openal.cChange#include <al.h>#include <alc.h>to#include <OpenAL/al.h>#include <OpenAL/alc.h>
5、python setup.py install

二、SpeechRecognition安装

 pip install SpeechRecognition

三、中文模型安装

1、下载 cmusphinx-zh-cn-5.2.tar.gz
地址: https://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/Mandarin/2、解压后重命名部分文件:cmusphinx-zh-cn-5.2 -> zh-CNzh_cn.cd_cont_5000 ->  acoustic-modelzh_cn.lm.bin -> language-model.lm.binzh_cn.dic -> pronounciation-dictionary.dict3、拷贝到安装目录
cp zh-CN  /xxx/python3/lib/python3.7/site-packages/speech_recognition/pocketsphinx-data/

四、视频抽取音频got_wav.py

import subprocess
import sysdef main(my_file_path, result_file_path):command = "ffmpeg -i {my_file} -ab 160k -ac 2 -ar 44100 -vn {result_file}".format(my_file = my_file_path,result_file = result_file_path,)print(command)subprocess.call(command, shell=True)if __name__ == "__main__":if len(sys.argv)<3:raise Exception("python3 got_wav.py my_file_path result_file_path")my_file_path,result_file_path = sys.argv[1:] main(my_file_path,result_file_path)

五、win10录制语音命名为2.m4a

执行脚本
python3 got_wav.py 2.m4a my16k.wav生成2.wav

六、测试

# -*- coding:utf-8 -*-import speech_recognition as sr def wav2txt(wav_file,language):r = sr.Recognizer()audio= ""with sr.AudioFile(wav_file) as src:audio= r.record(src)print(r.recognize_sphinx(audio,language=language))#print(r.recognize_google(audio,language=language)) #google的语言识别库,需要翻墙fp1=r'my16k.wav'
fp2=r'audio-file.flac'wav2txt(fp1,"zh-CN")
wav2txt(fp2,"en-US")

SpeechRecognition离线语音识别相关推荐

  1. Ubuntu16.04实现Sphinx离线语音识别

    Ubuntu16.04实现Sphinx离线语音识别 版权声明:本文为博主原创文章,未经博主允许不得转载. https://blog.csdn.net/boke14122621/article/deta ...

  2. 离线语音识别芯片对比

    离线语音识别芯片对比 前言 本文关注的重点是语音识别的硬件载体:语音识别芯片,特别是离线语音识别芯片. 一. 语音识别技术的原理 定义:语音识别技术(ASR Automatic SpeechRecog ...

  3. python离线语音唤醒算法_python实现离线语音识别

    1.先安装PyAudio python -m pip install PyAudio-0.2.11-cp37-cp37m-win_amd64.whl 2.安装语音识别 pip install Spee ...

  4. Android平台使用PocketSphinx做离线语音识别,小范围语音99%识别率

    为什么80%的码农都做不了架构师?>>>    最近语音识别很火,但是都是用的在线语音识别,研究了一下离线语音识别,小范围内的语音识别率还不错,在此记录一下 首先本文要说的两个前提1 ...

  5. python音频转文字speech recognition_使用SpeechRecognition进行语音识别

    操作系统 : CentOS7.7.1908_x64 gcc版本 :4.8.5 Python 版本 : 3.6.8 安装语音识别环境: virtualenv -p /usr/bin/python3 py ...

  6. 离线语音识别软件_6.语音板使用科大讯飞离线命令词识别

    0x00 离线命令词识别简介 语音识别技术(Auto Speech Recognize,简称ASR),就是把人的自然语言音频数据转换成文本数据的技术.理论上在线ASR是可以把所有的语音转换成对应的文本 ...

  7. 离线语音识别_离线语音识别库_离线语音识别sdk - 云+社区 - 腾讯云

    广告关闭 2017年12月,云+社区对外发布,从最开始的技术博客到现在拥有多个社区产品.未来,我们一起乘风破浪,创造无限可能. 是的,录音文件识别服务就是离线语音识别服务... 录音文件识别(即:离线 ...

  8. 离线语音识别技术品鉴——功能不同各有千秋

    日前,Google推出了全新的离线语音识别模型.新模型缩小了系统中被称为"解码器图形"的部分,这个组件的功能类似于书中的索引,将音频波形与书面文字相匹配.但目前它只在谷歌键盘应用程 ...

  9. 本地离线语音识别芯片厂家盘点,哪一家实力更强

    随着人工智能化的快速发展,传统的家居行业也开始向智能家居转变,其中的语音交互技术被广泛应用.实现这些功能都少不了离线 广州九芯电子科技有限公司 简介:广州市九芯电子科技有限公司是一家行业内杰出的高新技 ...

最新文章

  1. GdiPlus[59]: 图像(十一) IGPImageAttributes 之颜色矩阵(TGPColorMatrix)变换
  2. 幼儿园计算机知识培训内容,幼儿园教师计算机培训计划
  3. Pytorch实践中文教程(1)
  4. ASP.NET MVC应用迁移到ASP.NET Core及其异同简介
  5. ming window 交叉编译_如何在Linux for Windows上与MinGW交叉编译?
  6. (stack栈)rails
  7. 计算机网络 ospf重点,计算机网络:OSPF协议概述
  8. disruptor RingBuffer初始化与生产者事件产生
  9. 首发联发科天玑820!Redmi 10X发布:售价1599元起
  10. 高度等于动态宽度(CSS流体布局)
  11. python-day74--知识总体总结
  12. opencv 光流法
  13. [C++系列] 66. 超详解C++阶段性总结思维导图
  14. 阿里平头哥发布首个产品玄铁910 但这并不是CPU
  15. python个人简历-个人简历
  16. KafKa 启动异常 : ERROR Failed to clean up log for __consumer_offsets-30 in dir 另一个程序正在使用此文件,进程无法访问
  17. Python开发——做一个简单的【表白墙】网站
  18. TI 927 928 947 948 940串行器解串器系列
  19. 【unity插件】Rewired插件-unity3d实现主机、PC手柄震动Vibration
  20. 宽带信号的DOA估计学习笔记(四):空间分辨率

热门文章

  1. 滴水逆向学习笔记 -1-
  2. vmm_xactor
  3. 电脑端滚动截屏工具FastStone Capture
  4. 能被2,3,4,5,6,7,8,9...等数整除的数特征
  5. 文章8:多功能智能跟随行李箱控制系统设计 | 本科毕业设计 - 【毕设答辩问答记录】
  6. 【计算机网络】——体系结构
  7. python图像锐化,图像加强、锐化,利用 Python-OpenCV 来实现 4 种方法!
  8. python 识图点击_Python图片识别——人工智能篇
  9. 台大李宏毅课程笔记3——New Optimization for Deep Learning深度学习新优化
  10. Linux LKM suterusu代码分析(一)