Python玩转各种多媒体,视频、音频到图片
我们经常会遇到一些对于多媒体文件修改的操作,像是对视频文件的操作:视频剪辑、字幕编辑、分离音频、视频音频混流等。又比如对音频文件的操作:音频剪辑,音频格式转换。再比如我们最常用的图片文件,格式转换、各个属性的编辑等。因为多媒体文件的操作众多,本文选取一些极具代表性的操作,以代码的形式实现各个操作。
很多人学习python,不知道从何学起。
很多人学习python,掌握了基本语法过后,不知道在哪里寻找案例上手。
很多已经做案例的人,却不知道如何去学习更加高深的知识。
那么针对这三类人,我给大家提供一个好的学习平台,免费领取视频教程,电子书籍,以及课程的源代码!
QQ群:1097524789
一、图片操作
操作图片的模块有许多,其中比较常用的两个就是 Pillow
和 opencv
,两个模块各有优势。其中 opencv
是计算机视觉处理的开源模块,应用的范围更加广泛,从图像处理到视频处理,再到物体检测等。而 pillow
相比直线就单纯的多,其大多数操作都是围绕图像而展开的。
1.1、格式转换
图片格式有多种多样,最直观的感受就是图片后缀。而格式之间的差异不仅仅是后缀的差异,最为明显的就是 png
格式图片,同其它图片有着最为直观的区别。下面我们就看看在Python中如何转换格式,我们先安装 pillow
模块:
pip install pillow
然后看看如何导入模块以及如何读取图像:
from PIL import Image # 读取图像 img = Image.open('ycjc.jpg') # 显示图像 img.show()
我们有了上面的基础操作之后,就可以开始进行格式转换了,我们用有村大妹子的图片作为素材:
我们可以看到这是一张白色背景的图片,我们将它转成 png
看看效果:
from PIL import Image # 读取图像 img = Image.open('ycjc.jpg') # 格式转换,其中A为透明度 png = img.convert('RGBA') # 保存图像,因为是RGBA格式,所以后缀应该为png png.save('ycjc.png')
输出的图片我就不放了,我们观察输出图片会发现,白色背景好像变透明了。不要怀疑,这只是心理作用,其实图片看上去是不会有任何变化的。但是实际上图片从原来的 RGB
三个色道变成了 RGBA
四个色道,我们会发现,图片变大了:
在这里插入图片描述
虽然 A
色道的透明度全部都是0,但是实际上还是存在这个色道,所以大小方面有了明显的增加。更多转换模式可以参考超全Python图像处理讲解(多图预警)。
1.2、图片裁剪
图片裁剪的操作也非常常用,我们来看看 pillow
如何裁剪图片:
from PIL import Image # 读取图像 img = Image.open('ycjc.jpg') # 裁剪图像,调用crop方法,传入裁剪区域的元组 img_crop = img.crop((100, 100, 400, 400)) # 保存裁剪后的图像 img_crop.save('ycjc_crop.jpg')
我们调用 crop
方法,传入裁剪区域的元组进行裁剪,元组的内容为左上角的坐标(前两个参数)即右下角的坐标(后两个参数)。效果图如下:
1.3、截屏
虽然算不上是图像操作,但是还是个非常实用的操作。我们实现截屏是通过ImageGrap类实现的:
from PIL import ImageGrab # 截取全屏 im = ImageGrab.grab() # 保存图像 im.save('win.png')
除了截取全屏我们也可以区域截屏:
im =ImageGrab.grab((300, 100, 1400, 600))
参数元组含义与 crop
方法一致。
除了上述操作,还有更多像是添加滤镜、对比度调节、亮度调节、色彩调节等,由于内容众多,所以不在本文详细讨论。
二、音频操作
音频的操作也比较繁多,我们最常用到的就是音频剪辑和音量调节了。我们这里使用 pydub
模块来进行音频文件的操作。
2.1、pydub的安装以及读取音频
安装我们还是使用pip:
pip install pydub
然后我们来读取一个 wav
文件:
from pydub import AudioSegment # 读取wav格式的音频文件 music = AudioSegment.from_wav('百年孤独.wav')
这样我们就完成了音频文件的读取, wav
文件是一种未经压缩的文件,我们可以通过 pydub
直接读取。读取其它类型的文件 pydub
同样提供了相应的方法:
music = AudioSegment.from_mp3('music.mp3') music = AudioSegment.from_ogg("music.ogg") music = AudioSegment.from_flv("music.flv")
因为在实际操作过程中遇到了一个未找明缘由的错误,所以本文的音频操作只针对 wav
格式。
2.2、音频剪切
音频剪辑的实现我们是通过类似ndarray的中括号操作的:
# 截取前20秒 clip = music[:20*1000] # 截取后20秒 clip = music[-20000:] # 从第20秒截取到第40秒 clip = music[20*1000:40*1000]
剪切好的片段我们可以另外存一个文件:
# 保存文件为clip.mp3,格式为mp3 clip.export('clip.mp3', format='mp3')
3.3、增加/减少音量
音量的控制我们只需要用音频对象加一个常数即可:
# 音量减5 music -= 5 # 音量加5 music += 5
3.4、音频拼接
我们先看看重复拼接:
# 在音频文件末尾重复拼接该音频 music = music*2
拼接后的音频的效果就是原音频循环两次。接下来我们看看拼接不同的音频:
# 裁剪前20秒音频 clip1 = music[:20*1000] # 裁剪后20秒音频 clip2 = music[-20*1000:] # 拼接音频 clip = clip1 + clip2
3.5、 交叉渐入渐出
交叉渐入渐出是一种比较柔和的音频转场方式,在两个音频切换的间歇会有一个重合,用代码实现如下:
# 截取前20秒 begin = music[20*1000:40*1000] # 截取后20秒 end = music[-20*1000:] # 添加交叉渐入渐出 效果 clip = begin.append(end, crossfade=1500)
我们可以看到我们一共裁剪了40秒,在生成的文件我们可以看到只有38秒,因为转场的时候有个重合的效果。当然还有更多的操作,大家可以自己去了解。
三、视频操作
视频的操作可以通过 moviepy
和 opencv
进行,我们先分别安装两个模块:
pip install opencv-python pip install moviepy
3.1、视频剪辑
相比之下 moviepy
操作视频要更便利,我们看看使用 moviepy
如何剪辑视频:
from moviepy.editor import * # 剪切视屏bws.mp4中第50秒到第60秒 clip = VideoFileClip('bws.mp4').subclip(50, 60) # 将剪切的片段保存 clip.write_videofile("clip.mp4")
3.2、提取音频文件
在 VideoFileClip
类中,音频文件作为其中的一个参数,我们可以直接获取:
from moviepy.editor import * # 读取视频文件 video = VideoFileClip('bws.mp4') # 获取其中音频 audio = video.audio # 保存音频文件 audio.write_audiofile('audio.mp3')
3.3、混流
我们还可以将音频同视频混流,在moviepy中,提供了一个读取音频文件的类,我们设置视频的音频需要创建这个类的对象:
from moviepy.editor import * # 读取视频 video = VideoFileClip('bws.mp4') # 读取音频 audio = AudioFileClip('百年孤独.mp3') # 设置视频的音频 video = video.set_audio(audio) # 保存新的视频文件 video.write_videofile('bws_audio.mp4')
3.4、逐帧提取画面
我们都知道,视频是由一帧一帧的图片组成的,我们也可以将画面一帧一帧提取出来:
import cv2 # 读取视频 video = cv2.VideoCapture('bws.mp4') # 逐帧读取,当还有画面时ret为True,frame为当前帧的ndarray对象 ret, frame = video.read() i = 0 # 循环读取 while ret:i += 1cv2.imwrite('v'+str(i) + '.jpg', frame)ret, frame = video.read()
上述代码就能将视屏的每一帧以图片的形式保存下来。
3.5、截取gif
截取gif和截取视频没有什么区别,不过为了减少gif的大小,我们通常会对视频进行尺寸缩放:
from moviepy.editor import * # 读取视频 video = VideoFileClip('bws.mp4') # 裁剪视频,并缩小一半 video = video.subclip(20, 30).resize((0.5)) # 保存gif图片 video.write_gif('bws.gif')
在上面subclip方法中,我们可以传入元组,例如:
video.subclip((1, 20), (2, 30))
其含义为从1分20秒截取到2分30秒
Python玩转各种多媒体,视频、音频到图片相关推荐
- Python: 玩转各种多媒体+视频+音频+图片
我们经常会遇到一些对于多媒体文件修改的操作,像是对视频文件的操作:视频剪辑.字幕编辑.分离音频.视频音频混流等.又比如对音频文件的操作:音频剪辑,音频格式转换.再比如我们最常用的图片文件,格式转换.各 ...
- python玩转大数据视频[非原创视频]
python玩转大数据:简介 http://v.youku.com/v_show/id_XNTk3NDcwMTg4.html python玩转大数据:网络爬虫 http://v.youku.com/v ...
- 【干货】Python玩转各种多媒体,视频、音频到图片
我们经常会遇到一些对于多媒体文件修改的操作,像是对视频文件的操作:视频剪辑.字幕编辑.分离音频.视频音频混流等.又比如对音频文件的操作:音频剪辑,音频格式转换.再比如我们最常用的图片文件,格式转换.各 ...
- python 玩玩乐 - moviepy 剪辑视频变成 gif 图
python 的一些有趣的操作,还有解决 RuntimeError: No ffmpeg exe could be found. 的问题 此篇来源于被迫营业,但是我很开心 目录 前置需要 提示:安装 ...
- Python 技术篇-用base64库对音频、图片等文件进行base64编码和解码实例演示
最近在研究项目,需要调用百度语音的api,传入参数需要本地语音文件 base64 位编码后内容.下面来演示一下. 其实很简单,base64 是系统自带的库. base64.b64encode() 进行 ...
- python使用视频_Python中操作各种多媒体,视频、音频到图片的代码详解
我们经常会遇到一些对于多媒体文件修改的操作,像是对视频文件的操作:视频剪辑.字幕编辑.分离音频.视频音频混流等.又比如对音频文件的操作:音频剪辑,音频格式转换.再比如我们最常用的图片文件,格式转换.各 ...
- python播放视频代码_Python中操作各种多媒体,视频、音频到图片的代码详解
我们经常会遇到一些对于多媒体文件修改的操作,像是对视频文件的操作:视频剪辑.字幕编辑.分离音频.视频音频混流等.又比如对音频文件的操作:音频剪辑,音频格式转换.再比如我们最常用的图片文件,格式转换.各 ...
- python opencv PIL 视频分割成图片 图片合成为视频 修改图片大小(抗锯齿)
Python代码将原有的视频分割成图片,我的例子是一帧一帧的分割 用python+opencv完成视频的分割 import cv2 #导入opencv模块 print(2) #测试是否运行 vc=cv ...
- python英雄联盟万图视频制作
python英雄联盟万图视频制作 前言 图片数据采集 图片合成视频 视频添加音效 前言 数据来源: 英雄联盟官网 开发环境:win10.python3.7 开发工具:pycharm 图片数据采集 爬虫 ...
最新文章
- 大厂前端高频面试问题与答案精选
- 数据库的设计(一些观点) _转
- P1967 货车运输
- 【视频课】先搞懂你用的模型,深度学习模型分析课程来了!
- 1037. 在霍格沃茨找零钱(20)
- 6.Random Forests
- 转载:互联网盈利模式
- java抽奖代码_纯java代码实现抽奖系统
- 2022-10-10 Android 在其他应用上的悬浮窗View
- STM8S103之串口查询发送+中断发送
- cdr多页面排版_cdr排版实例图文教程,教你CorelDRAW杂志内页排版方法
- 运用regedit编辑器恢复清空回收站之后的文件
- Ps“反转负冲”人像处理一例
- Matlab中常用的清除命令clc,clear,clf等
- python中function takes exactly_Python error TypeError: function takes exactly 1 argument (5 given)
- 什么是Java的序列化?
- 单片机课程设计——基于51单片机温湿度检测系统的设计与实现
- IDEA插件系列(20):Grep Console插件——显示多颜色调试日志
- 操作系统--操作系统
- MATLAB数字图像处理练习六
热门文章
- python-演练-数据排除-从学生得分中去除题目源中并不存在的题
- 不能使用for循环,传入n和m, 生成一个长度为n,每一项都是m的数组
- 部署Docker----解决删除none镜像问题
- 设置windows网络连接别名和linux网络连接别名
- asp.net core 教程(六)-中间件
- 第十二单元 打包,压缩,主机传送文件
- 利用Android属性动画实现Banner的原理与实践
- 轻松搞定vmware + win2003Cluste
- 容器编排技术 -- Kubernetes入门概述
- Spring @Autowired Annotation教程