咪哥杂谈

本篇阅读时间约为 6 分钟。

1

前言

今天开始进入近期系列文章的第一篇,如何用 Python 来实现录音功能。

在开始"造轮子"之前,个人一直强调一个观点,如果有些东西已经有了,不妨直接去 github 上搜,用现成的就好。关于这个想法,其实 github 上已经有人实现了。

但是有些细节点,和我想的不太一样。所以呢,我还是决定自己体验一波流程,顺便踩踩坑,毕竟是从兴趣出发。

而在上篇文章留言区中,有个小伙伴也提出,其实在去年,就已经用树莓派实现了这系列的功能,我觉得还是蛮有意思的一件事。

下面进入正题。

2

环境准备

开始之前,先要介绍的是今天的主角,PyAudio

这款第三方库,是一个跨平台音频库。

跨平台的性质,不用多说了吧!就是多面兼容你的系统,不论你是用的 windows 、mac、linux,它都是支持的。

安装命令如下:

pip install PyAudio

mac的同志们,需要注意下,安装的时候可能会报错,安装如下即可。

brew install portaudio

完备的第三方库都会有对应的文档,地址如下:

https://people.csail.mit.edu/hubert/pyaudio/docs/#pyaudio

3

录音功能实现

先来介绍一下,如何使用它来进行录制音频功能!

PS: 音频方面的东西,我之前也没过多了解,近期写了 PyAudio 库的代码实现后才发现,要想明白代码的含义,还要有一些音频方面的知识作为前置储蓄,所以下面我会结合代码去通俗讲解,若有哪里不对的地方,欢迎评论区留言指出!

先来看代码。

设定参数:

CHUNK = 1024  # 每个缓冲区的帧数FORMAT = pyaudio.paInt16  # 采样位数CHANNELS = 1  # 单声道RATE = 44100  # 采样频率

设定具体实现的参数,分别有 缓冲区帧数、采样位数、声道模式、采样频率

具体实现录音代码:

def record_audio(wave_out_path, record_second):    """ 录音功能 """    p = pyaudio.PyAudio()  # 实例化对象    stream = p.open(format=FORMAT,                    channels=CHANNELS,                    rate=RATE,                    input=True,                    frames_per_buffer=CHUNK)  # 打开流,传入响应参数    wf = wave.open(wave_out_path, 'wb')  # 打开 wav 文件。    wf.setnchannels(CHANNELS)  # 声道设置    wf.setsampwidth(p.get_sample_size(FORMAT))  # 采样位数设置    wf.setframerate(RATE)  # 采样频率设置    for _ in range(0, int(RATE * record_second / CHUNK)):        data = stream.read(CHUNK)        wf.writeframes(data)  # 写入数据    stream.stop_stream()  # 关闭流    stream.close()    p.terminate()    wf.close()

先用正常代码逻辑思维解释下,其中涉及到的专业名词,继续往下看,后面会有相应的解释。

首先对 pyaudio 库进行实例化。用其生成的实例化对象对数据流进行相应的打开,也就是 open 函数。在这块,分别传入了参数,采样位数、声道、采样频率,以及最后的缓冲区帧数。

调用 Python 自带的 wave 库,再次进行写入 wav 的相关设置。此处的操作类似 Python 写 txt ,只不过多了点音频设置而已。

采样频率 * 音频秒数/ 每个缓冲区帧数 ,得到的就是你要写入多少个块缓冲区的数量。最终,只需要每次循环写入固定的 1024,一共循环得出的多少个块缓冲区。即可得到最终的数据。

这里的公式计算,如果在不了解下述基础概念之前,是很难理解的。

4

音频基础知识普及

看了上面的代码解释,是不是一脸懵逼。来普及下所涉及到的专业名词。

首先, wav 和 mp3 的后缀结尾,有什么不同?

其次,关键的名词解释。

采样位数:可以理解数字音频设备处理声音的解析度,即对声音的辨析度。就像表示颜色的位数一样(8位表示256种颜色,16位表示65536种颜色),有8位,16位等。这个数越大,解析度就越高,录制和回放的声音也就越真实。

采样频率:就是对声音信息1秒钟采样多少次,以记录成数字信息。如CD音频是44.1KHz采样率,它对声音以每秒44100次的频率来记录信息。原则上采样率越高,声音的质量越好。

截取了一段百度百科的例子,关于采样频率的设定,代码中选择的即 44100 Hz 。

每个缓冲区帧数:通俗的举个例子,你手里有 102400 块钱,现在要上交给女朋友。但是,你心想一口气全给她,怕撑爆了她的钱包。于是你定了一个值,每次只给她 1024 元。

这里的 1024 元即每个缓存区的帧数。你想全部上交,需要几次才能完成呢?是不是得重复上交这个动作 100 次!此时,这里的 100 次,便对应了上述代码的循环次数,即公式算出来的有多少个块缓存区

弄懂音频基础知识后,再去回看代码,你会发现那些参数的意义就一目了然了。

5

播放功能实现

有了以上知识点,对于读文件来说,就相当 easy 了!直接放上核心代码:

def play_audio(wave_input_path):    p = pyaudio.PyAudio()  # 实例化    wf = wave.open(wave_input_path, 'rb')  # 读 wav 文件    stream = p.open(format=p.get_format_from_width(wf.getsampwidth()),                    channels=wf.getnchannels(),                    rate=wf.getframerate(),                    output=True)    data = wf.readframes(CHUNK)  # 读数据    while len(data) > 0:        stream.write(data)        data = wf.readframes(CHUNK)    stream.stop_stream()  # 关闭资源    stream.close()    p.terminate()

读文件的话,没有什么可讲的,我是直接从官方文档的例子中 copy 的,修改了一下相应的参数,即可实现。

6

总结

总的来说,音频的操作,Python中的 PyAudio 库是非常友好的,当然,经过各种查阅资料,发现在写入音频文件时,不同人有不同的写法,而文中的这套公式算法,应该是较为简洁的一种。

放上一段,我用 Python 录制的 wav 音频文件。短暂的 3 s。

老规矩,有想要本章全部源码的同学,后台回复 音频 ,即可获得地址。

文中关于音频的解释,哪里有错误,欢迎评论区留言指出!


往期精彩回顾

Python零基础福利来了!

Python减少代码量的两个内置函数

Python打造自己的语音机器人设计思路

你点的每个在看,我都认真当成了喜欢

Python实现电脑录音(含音频基础知识讲解)相关推荐

  1. python录音详解_Python实现电脑录音(含音频基础知识讲解)

    咪哥杂谈 本篇阅读时间约为 6 分钟. 1 前言 今天开始进入近期系列文章的第一篇,如何用 Python 来实现录音功能. 在开始"造轮子"之前,个人一直强调一个观点,如果有些东西 ...

  2. python实现录音并去燥_Python实现电脑录音(含音频基础知识讲解)

    Python实现电脑录音(含音频基础知识讲解) 前言 今天开始进入近期系列文章的第一篇,如何用 Python 来实现录音功能. 在开始"造轮子"之前,个人一直强调一个观点,如果有些 ...

  3. python人像录制加声音_Python实现电脑录音(含音频基础知识讲解)

    Python实现电脑录音(含音频基础知识讲解) 前言 今天开始进入近期系列文章的第一篇,如何用 Python 来实现录音功能. 在开始"造轮子"之前,个人一直强调一个观点,如果有些 ...

  4. python计算wav的语谱图_Python实现电脑录音(含音频基础知识讲解)

    前言 今天开始进入近期系列文章的第一篇,如何用 Python 来实现录音功能. 在开始"造轮子"之前,个人一直强调一个观点,如果有些东西已经有了,不妨直接去 github 上搜,用 ...

  5. Python之音频信号处理(一)音频基础知识

    一.音频基础知识 1.声音的三要素 (1)音调 人耳对声音高低的感觉称为音调(也叫音频).音调主要与声波的频率有关.声波的频率高,则音调也高.一般音频 儿童>女生>男生. 人耳听觉音频范围 ...

  6. Android录音-音频基础知识

    音频基础知识 文章目录 音频基础知识 一.采样率 二.采样位深 三.比特率 四.声道(单声道.双声道) 五.PCM元数据 音频基本概念:采样率.采样位深.比特率.声道.PCM 一.采样率 采样率(也称 ...

  7. python实时采集与处理声音信号_Python之音频信号处理(一)音频基础知识

    一.音频基础知识 1.声音的三要素 (1)音调 人耳对声音高低的感觉称为音调(也叫音频).音调主要与声波的频率有关.声波的频率高,则音调也高.一般音频 儿童>女生>男生. 人耳听觉音频范围 ...

  8. PCM音频基础知识及采样数据处理

    PCM音频基础知识及采样数据处理 目录 PCM简介 采样频率.量化精度(采样位数)和声道数 音频帧 录播过程 音频混音 PCM音频采样数据处理 转载自:音频PCM知识整理 视音频数据处理入门:PCM音 ...

  9. 百万调音师—音频基础知识

    百万调音师-音频基础知识 音频基本属性 1).音频理论 2).音频格式 3).音频声道 声音如何传输到电脑? 模拟信号 数字信号 脉冲编码调制 1).滤波 2).采样 3).量化 4).编码 分贝 音 ...

最新文章

  1. 各种开发API文档+开发工具
  2. Windows Phone 实用开发技巧(9):自定义Windows Phone 页面切换动画
  3. CesiumLab V1.3 新功能 MAX场景处理(免费Cesium处理工具集)
  4. java char指针数组_sizeof与strlen使用,字符串指针数组
  5. 牛客假日团队赛10 L 乘积最大 (dp,大数)
  6. if test 多条件_秒懂Python编程中的if __name__ == #39;main#39; 作用和原理
  7. python ui自动化测试框架_Python自动化测试框架
  8. 查看文章影响因子的插件_Scholarscope--在新版PubMed中实现基于影响因子的文献筛选...
  9. mutable和volatile关键字
  10. Myeclipse学习总结(15)——Eclipse/MyEclipse中Maven项目常见问题解决汇总
  11. 实战Node:Node实现留言板
  12. 数学建模十大常用软件(转)
  13. 新浪微博如何批量删除以前发过的微博
  14. 金融学习之四——插值法求远期国债收益率
  15. 机器人零力拖动技术路线
  16. 互联网金融牌照有哪些 金融牌照一览表
  17. Cortex-M3单片机的IAP在线升级上位机和下位机
  18. CSU2020:Artwork(并查集)
  19. 9.2.1 Python图像处理之图像数学形态学-二值形态学应用之噪声消除
  20. canvas实现动态点线背景,鼠标画点连线。

热门文章

  1. 微信小程序案例——简易前端与云数据库的使用
  2. Java实现新闻门户网站
  3. 廖雪峰Java10加密与安全-4加密算法-4密钥交换算法
  4. 单片机学习笔记(三)
  5. VB/VBA的整数,你真的了解?
  6. 图书管理系统(C语言)
  7. 化工原理 --- 热量传递(补充)
  8. pycharm翻译插件失效解决方法
  9. 选购蓝牙耳机的几大误区,双11选到适合自己的蓝牙耳机就是这么简单
  10. java后端接收map参数vue前端传递