python人像录制加声音_Python实现电脑录音(含音频基础知识讲解)
Python实现电脑录音(含音频基础知识讲解)
前言
今天开始进入近期系列文章的第一篇,如何用 Python 来实现录音功能。
在开始"造轮子"之前,个人一直强调一个观点,如果有些东西已经有了,不妨直接去 github 上搜,用现成的就好。关于这个想法,其实 github 上已经有人实现了。
但是有些细节点,和我想的不太一样。所以呢,我还是决定自己体验一波流程,顺便踩踩坑,毕竟是从兴趣出发。
而在上篇文章留言区中,有个小伙伴也提出,其实在去年,就已经用树莓派实现了这系列的功能,我觉得还是蛮有意思的一件事。
下面进入正题。
环境准备
开始之前,先要介绍的是今天的主角,PyAudio。
这款第三方库,是一个跨平台音频库。
跨平台的性质,不用多说了吧!就是多面兼容你的系统,不论你是用的 windows 、mac、linux,它都是支持的。
安装命令如下: pip install PyAudio
mac的同志们,需要注意下,安装的时候可能会报错,安装如下即可。
brew install portaudio
完备的第三方库都会有对应的文档,地址如下:
https://people.csail.mit.edu/hubert/pyaudio/docs/#pyaudio
录音功能实现
先来介绍一下,如何使用它来进行录制音频功能!
PS: 音频方面的东西,我之前也没过多了解,近期写了 PyAudio 库的代码实现后才发现,要想明白代码的含义,还要有一些音频方面的知识作为前置储蓄,所以下面我会结合代码去通俗讲解,若有哪里不对的地方,欢迎评论区留言指出!
先来看代码。
设定参数:
CHUNK
设定具体实现的参数,分别有 缓冲区帧数、采样位数、声道模式、采样频率。
具体实现录音代码:
def
先用正常代码逻辑思维解释下,其中涉及到的专业名词,继续往下看,后面会有相应的解释。
首先对 pyaudio 库进行实例化。用其生成的实例化对象对数据流进行相应的打开,也就是 open 函数。在这块,分别传入了参数,采样位数、声道、采样频率,以及最后的缓冲区帧数。
调用 Python 自带的 wave 库,再次进行写入 wav 的相关设置。此处的操作类似 Python 写 txt ,只不过多了点音频设置而已。
用 采样频率 * 音频秒数/ 每个缓冲区帧数 ,得到的就是你要写入多少个块缓冲区的数量。最终,只需要每次循环写入固定的 1024,一共循环得出的多少个块缓冲区。即可得到最终的数据。
这里的公式计算,如果在不了解下述基础概念之前,是很难理解的。
音频基础知识普及
看了上面的代码解释,是不是一脸懵逼。来普及下所涉及到的专业名词。
首先, wav 和 mp3 的后缀结尾,有什么不同?
其次,关键的名词解释。
采样位数:可以理解数字音频设备处理声音的解析度,即对声音的辨析度。就像表示颜色的位数一样(8位表示256种颜色,16位表示65536种颜色),有8位,16位等。这个数越大,解析度就越高,录制和回放的声音也就越真实。
采样频率:就是对声音信息1秒钟采样多少次,以记录成数字信息。如CD音频是44.1KHz采样率,它对声音以每秒44100次的频率来记录信息。原则上采样率越高,声音的质量越好。
截取了一段百度百科的例子,关于采样频率的设定,代码中选择的即 44100 Hz 。
每个缓冲区帧数:通俗的举个例子,你手里有 102400 块钱,现在要上交给女朋友。但是,你心想一口气全给她,怕撑爆了她的钱包。于是你定了一个值,每次只给她 1024 元。
这里的 1024 元即每个缓存区的帧数。你想全部上交,需要几次才能完成呢?是不是得重复上交这个动作 100 次!此时,这里的 100 次,便对应了上述代码的循环次数,即公式算出来的有多少个块缓存区。
弄懂音频基础知识后,再去回看代码,你会发现那些参数的意义就一目了然了。
播放功能实现
有了以上知识点,对于读文件来说,就相当 easy 了!直接放上核心代码:
def
读文件的话,没有什么可讲的,我是直接从官方文档的例子中 copy 的,修改了一下相应的参数,即可实现。
总结
总的来说,音频的操作,Python中的 PyAudio 库是非常友好的,当然,经过各种查阅资料,发现在写入音频文件时,不同人有不同的写法,而文中的这套公式算法,应该是较为简洁的一种。
老规矩,有想要本章全部源码的同学,后台回复 音频 ,即可获得地址。
文中关于音频的解释,哪里有错误,欢迎评论区留言指出!
python人像录制加声音_Python实现电脑录音(含音频基础知识讲解)相关推荐
- python录音详解_Python实现电脑录音(含音频基础知识讲解)
咪哥杂谈 本篇阅读时间约为 6 分钟. 1 前言 今天开始进入近期系列文章的第一篇,如何用 Python 来实现录音功能. 在开始"造轮子"之前,个人一直强调一个观点,如果有些东西 ...
- python人像录制加声音_Python自动化测试入门必读
入门自动化测试必读 自动化测试概念 自动化测试是把以人为驱动的测试行为转化为机器执行的一种过程.通常,在设计了测试用例并通过评审之后,由测试人员根据测试用例中描述的规程一步步执行测试,得到实际结果与期 ...
- python人像录制加声音_Python教父推荐的一份Python学习清单,秀儿拿走学去吧,最适合你...
站在风口上,猪都能飞起来.人工智能风口,让Pyhon这门胶水语言转变成非常火的网红语言. 编程功力深厚的程序员花一两个星期就能上手Python,而一些新手程序员花几个月就可以上手. 学编程,用Pyth ...
- python实现录音并去燥_Python实现电脑录音(含音频基础知识讲解)
Python实现电脑录音(含音频基础知识讲解) 前言 今天开始进入近期系列文章的第一篇,如何用 Python 来实现录音功能. 在开始"造轮子"之前,个人一直强调一个观点,如果有些 ...
- python计算wav的语谱图_Python实现电脑录音(含音频基础知识讲解)
前言 今天开始进入近期系列文章的第一篇,如何用 Python 来实现录音功能. 在开始"造轮子"之前,个人一直强调一个观点,如果有些东西已经有了,不妨直接去 github 上搜,用 ...
- Python实现电脑录音(含音频基础知识讲解)
咪哥杂谈 本篇阅读时间约为 6 分钟. 1 前言 今天开始进入近期系列文章的第一篇,如何用 Python 来实现录音功能. 在开始"造轮子"之前,个人一直强调一个观点,如果有些东西 ...
- python人像录制加声音_简单易用的录制屏幕与摄像头工具
EaseUS RecExperts 是一款简单易用的 Windows 录制屏幕工具,支持同时录制屏幕.摄像头和麦克风,支持网络摄像头,4K 游戏模式,并且可以对视频进行编辑. EaseUS RecEx ...
- python实时采集与处理声音信号_Python之音频信号处理(一)音频基础知识
一.音频基础知识 1.声音的三要素 (1)音调 人耳对声音高低的感觉称为音调(也叫音频).音调主要与声波的频率有关.声波的频率高,则音调也高.一般音频 儿童>女生>男生. 人耳听觉音频范围 ...
- python classmethod知识_python基础知识讲解——@classmethod和@staticmethod的作用
python基础知识讲解--@classmethod和@staticmethod的作用 在类的成员函数中,可以添加@classmethod和@staticmethod修饰符,这两者有一定的差异,简单来 ...
最新文章
- 基于SEAL库实现PSI-报错实录2
- 一眼定位问题,函数计算发布日志关键词秒检索功能
- map,存储多个键值对的数据集合
- 负载均衡—几种常见算法
- Collections带有的排序方法 传入的元素类型 需是子类或者这个类的实例
- Java Break和continue实现goto功能
- 为什么我们使用volatile关键字? [重复]
- idea离线安装lombock插件
- syslog (cactiez)
- mybatis(12) mybatis-plus源码分析之sql注入器
- windows7点击安全删除硬件并弹出媒体无反应解决方法
- Http免费升级Https详细步骤【Let's Encrypt】
- debian7 软件源更新
- Web前端如何快速的兼容手机
- 三星s8android pie,三星修改Galaxy S8的Android Pie更新时间表,并添加M2
- 解决vue项目格式报错问题_@jie
- shiro权限拦截失效
- 用指针实现将字符串2合并在字符串1后面
- RANSAC和SAC-IA
- Ubuntu/Linux Terraform oci 一键脚本抢购​ 甲骨文Oracle VM.Standard.A1.Flex​ 4个OCPU,24 GB 内存的vps