SpeechRecognition离线语音识别

一、PocketSphinx 安装

1、RedHat/CentOS:yum install pulseaudio-libs-develUbuntu/Debian:apt install libpulse-dev2、git clone --recursive https://github.com/bambocher/pocketsphinx-python
3、cd pocketsphinx-python
4、vim pocketsphinx-python/deps/sphinxbase/src/libsphinxad/ad_openal.cChange#include <al.h>#include <alc.h>to#include <OpenAL/al.h>#include <OpenAL/alc.h>
5、python setup.py install

二、SpeechRecognition安装

 pip install SpeechRecognition

三、中文模型安装

1、下载 cmusphinx-zh-cn-5.2.tar.gz
地址： https://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/Mandarin/2、解压后重命名部分文件：cmusphinx-zh-cn-5.2 -> zh-CNzh_cn.cd_cont_5000 ->  acoustic-modelzh_cn.lm.bin -> language-model.lm.binzh_cn.dic -> pronounciation-dictionary.dict3、拷贝到安装目录
cp zh-CN  /xxx/python3/lib/python3.7/site-packages/speech_recognition/pocketsphinx-data/

四、视频抽取音频got_wav.py

import subprocess
import sysdef main(my_file_path, result_file_path):command = "ffmpeg -i {my_file} -ab 160k -ac 2 -ar 44100 -vn {result_file}".format(my_file = my_file_path,result_file = result_file_path,)print(command)subprocess.call(command, shell=True)if __name__ == "__main__":if len(sys.argv)<3:raise Exception("python3 got_wav.py my_file_path result_file_path")my_file_path,result_file_path = sys.argv[1:] main(my_file_path,result_file_path)

五、win10录制语音命名为2.m4a

执行脚本
python3 got_wav.py 2.m4a my16k.wav生成2.wav

六、测试

# -*- coding:utf-8 -*-import speech_recognition as sr def wav2txt(wav_file,language):r = sr.Recognizer()audio= ""with sr.AudioFile(wav_file) as src:audio= r.record(src)print(r.recognize_sphinx(audio,language=language))#print(r.recognize_google(audio,language=language)) #google的语言识别库，需要翻墙fp1=r'my16k.wav'
fp2=r'audio-file.flac'wav2txt(fp1,"zh-CN")
wav2txt(fp2,"en-US")

SpeechRecognition离线语音识别相关推荐

Ubuntu16.04实现Sphinx离线语音识别
Ubuntu16.04实现Sphinx离线语音识别版权声明:本文为博主原创文章,未经博主允许不得转载. https://blog.csdn.net/boke14122621/article/deta ...
离线语音识别芯片对比
离线语音识别芯片对比前言本文关注的重点是语音识别的硬件载体:语音识别芯片,特别是离线语音识别芯片. 一. 语音识别技术的原理定义:语音识别技术(ASR Automatic SpeechRecog ...
python离线语音唤醒算法_python实现离线语音识别
1.先安装PyAudio python -m pip install PyAudio-0.2.11-cp37-cp37m-win_amd64.whl 2.安装语音识别 pip install Spee ...
Android平台使用PocketSphinx做离线语音识别，小范围语音99%识别率
为什么80%的码农都做不了架构师?>>> 最近语音识别很火,但是都是用的在线语音识别,研究了一下离线语音识别,小范围内的语音识别率还不错,在此记录一下首先本文要说的两个前提1 ...
python音频转文字speech recognition_使用SpeechRecognition进行语音识别
操作系统 : CentOS7.7.1908_x64 gcc版本 :4.8.5 Python 版本 : 3.6.8 安装语音识别环境: virtualenv -p /usr/bin/python3 py ...
离线语音识别软件_6.语音板使用科大讯飞离线命令词识别
0x00 离线命令词识别简介语音识别技术(Auto Speech Recognize,简称ASR),就是把人的自然语言音频数据转换成文本数据的技术.理论上在线ASR是可以把所有的语音转换成对应的文本 ...
离线语音识别_离线语音识别库_离线语音识别sdk - 云+社区 - 腾讯云
广告关闭 2017年12月,云+社区对外发布,从最开始的技术博客到现在拥有多个社区产品.未来,我们一起乘风破浪,创造无限可能. 是的,录音文件识别服务就是离线语音识别服务... 录音文件识别(即:离线 ...
离线语音识别技术品鉴——功能不同各有千秋
日前,Google推出了全新的离线语音识别模型.新模型缩小了系统中被称为"解码器图形"的部分,这个组件的功能类似于书中的索引,将音频波形与书面文字相匹配.但目前它只在谷歌键盘应用程 ...
本地离线语音识别芯片厂家盘点，哪一家实力更强
随着人工智能化的快速发展,传统的家居行业也开始向智能家居转变,其中的语音交互技术被广泛应用.实现这些功能都少不了离线广州九芯电子科技有限公司简介:广州市九芯电子科技有限公司是一家行业内杰出的高新技 ...

SpeechRecognition离线语音识别

SpeechRecognition离线语音识别相关推荐

最新文章

热门文章