python语音转换为文字的软件_如何使用Python将语音转换为文本
语音识别是计算机软件识别口语中的单词和短语,并将其转换为可读文本的能力。那么如何在 Python 中将语音转换为文本?如何使用 SpeechRecognition 库在 Python 中将语音转换为文本?我们不需要从头开始构建任何机器学习模型,该库为我们提供了各种著名的公共语音识别 API 的便捷包装。
使用 pip 安装库:
pip3 install SpeechRecognition
Okey,打开一个新的 Python 文件并导入它:
import speech_recognition as sr
从文件读取
确保当前目录中有一个包含英语语音的音频文件 (如果您想跟我一起学习,请在此处获取音频文件):
filename = “speech.wav”
该文件是从 LibriSpeech 数据集中获取的,但是您可以带上任何想要的东西,只需更改文件名,就可以初始化语音识别器:
# initialize the recognizer
r = sr.Recognizer()
以下代码负责加载音频文件,并使用 Google Speech Recognition 将语音转换为文本:
# open the filewith sr.AudioFile(filename) as source:www.zpedu.com/
# listen for the data (load audio to memory)
audio_data = r.record(source)
# recognize (convert from speech to text)
text = r.recognize_google(audio_data)
print(text)
这需要几秒钟才能完成,因为它将文件上传到 Google 并获取了输出,这是我的结果:
I believe you’re just talking nonsense
从麦克风读取
这需要在您的计算机中安装 PyAudio,以下是取决于您的操作系统的安装过程:
视窗
您可以点安装它:
pip3 install pyaudio
的 Linux
您需要首先安装依赖项:
sudo apt-get install python-pyaudio python3-pyaudio
pip3 install pyaudio
苹果系统
您需要先安装 portaudio,然后才可以点安装它:
brew install portaudio
pip3 install pyaudio
现在,让我们使用麦克风转换语音:
with sr.Microphone() as source:
# read the audio data from the default microphone
audio_data = r.record(source, duration=5)
print(“Recognizing…”)
# convert speech to text
text = r.recognize_google(audio_data)
print(text)
这会从您的麦克风听到 5 秒钟,然后尝试将该语音转换为文本!
它与先前的代码非常相似,但是我们在这里使用 Microphone () 对象从默认麦克风读取音频,然后在 record () 函数中使用 duration 参数在 5 秒后停止读取,然后上传音频数据向 Google 获取输出文本。
您还可以在 record () 函数中使用 offset 参数在偏移几秒钟后开始记录。
另外,您可以通过将语言参数传递给 accept_google () 函数来识别不同的语言。例如,如果您想识别西班牙语语音,则可以使用:
text = r.recognize_google(audio_data, language=”es-ES”)
python语音转换为文字的软件_如何使用Python将语音转换为文本相关推荐
- python人工智能文字识别软件_怎么用Python人工智能识别图片-百度AI文字识别使用方法分享 - Iefans...
如果你是个Python初学者,那么你可以试着做做看这个教程,毕竟编程技能都是在实战中成长的,这篇教程是教你如何用Python来进行人工智能识别图片,可以帮助你解决日常办公时遇到的图片转换文字的问题. ...
- python如何制作一个工程软件_如何利用python制作一个解压缩软件-Go语言中文社区...
如何利用python制作一个解压缩软件 python实现解压缩的重要模块就是--zipfile,其次是os 安装zipfile模块 首先得安装zipfile模块,打开cmd输入一下命令即可安装 pip ...
- 大学计算机python期末考试用什么软件_大学计算机--Python算法实践_章节测验,期末考试,慕课答案查询公众号...
[单选题]IP 地址10.0.10.65 和掩码255.255.255.224 代表的是一个 A. 主机地址 B. 网络地址 C. 广播地址 D. 以上都不对 [单选题]一般而言,在常年定期.定量交易 ...
- python 怎么得到图像深度图 软件_如何用 Python 和 fast.ai 做图像深度迁移学习?...
本文带你认识一个优秀的新深度学习框架,了解深度学习中最重要的3件事. 框架 看到这个题目,你可能会疑惑:老师,你不是讲过如何用深度学习做图像分类了吗?迁移学习好像也讲过了啊! 说得对!我要感谢你对我专 ...
- 用python做思维导图软件_分享一下python数据处理工具思维导图
声明:内容来自博主亲手制作,转发请先通知. Numpy: Numpy优势 内存存储风格 ndarray在中存储的是相同格式的数据 并行化运算 底层是C语言实现 ndarray属性 形状 类型 基本操作 ...
- 不知道有哪些可以语音转文字的软件?推荐你用这个
在工作中,我们有时候会将会议过程录音下来,这样方便会后进行整理记录,如果采用手动记录的方式,会花费我们的时间和精力,其实我们可以借助一些语音转文字软件来进行转换.那你们知道语音转文字软件电脑版免费有哪 ...
- 语音转换文字的软件怎么使用
语音转换文字的软件怎么使用?这个问题问的好,语音转换文字的软件其实有很多种的,如果让小编来为大家讲解怎么使用这个软件的话,那就拿迅捷文字转语音软件为例吧,这个软件里也可以将语音转换成为文字,那么下面就 ...
- python语音转文字-【一点资讯】使用Python 进行语音识别---将音频转为文字
今天给大家讲一个案例,在不联网的情况下,依然可以通过python来将语音文件转换成文字.这里用到的包为sphinx,sphinx是由美国卡内基梅隆大学开发的大词汇量.非特定人.连续英语语音识别系统.有 ...
- python电脑截图文字识别软件_Python实现文字识别,来看看大牛怎么实现截图/
python有截屏的包吗 有你可以试试pyscreenshot. 地址:https://github.com/ponty/pyscreenshot 使用:import pyscreenshot as ...
最新文章
- fileinputstream自定义类序列化和反序列化_Rest Assured篇:Java中的序列化和反序列化...
- PHP 各种实用资源
- 微服务精华问答:什么是微服务架构中的DRY?| 技术头条
- Spring Boot swagger之前后端分离
- liunx-mysql-password重置(初始化)
- C++笔记-using的进一步用法
- 东欧视频游戏市场概况
- redmine一键安装
- php模板怎么导入数据类型,smarty模板引擎之分配数据类型,smarty模板数据类型_PHP教程...
- 11th Iran Nationwide Internet Contest 解题报告
- 今天发现的一个小问题,找不到模拟器和手机设备
- 如何做肌电信号手势识别?
- 5月1日起入境新加坡可使用IATA通行证,五一假期新加坡亲子游攻略
- Windows Server 2016 NTP服务端和客户端配置
- 如何用matlab绘制心形线,心形线的matlab程序
- 如何用python画出自己喜欢的表情包
- nmn什么功效,烟酰胺单核苷酸的功效和作用,在忙也要看一看
- 【T3】打印单据(非新打印)表头显示不全
- mysql 修改结束符_MySQL数据库中DELIMITER修改结束符教程及应用实例
- Java实现 蓝桥杯VIP 算法训练 反置数
热门文章
- 系统集成项目管理工程师(软考中级)—— 第十八章 合同管理 笔记分享
- 1460 卡布列克常数
- 我的理想计算机作文300字,我的理想作文300字
- Android连接Wifi详细源码
- 电脑计算机公式应用,知识:不能使用wps公式编辑器_计算机软件和应用程序_IT /计算机_数据...
- 基于中国剩余定理的秘密共享方案(Python实现)
- 【MySQL】汇 总 数 据
- CSP-S2019颓废总结暨游记
- 应届生拿到offer之后的流程_后Offer时期的信息总结—拿到Provisional Offer后的各种流程(NUS PhD )...
- STL核心知识总结(1)常用容器的用法