我们经常会遇到一些对于多媒体文件修改的操作,像是对视频文件的操作:视频剪辑、字幕编辑、分离音频、视频音频混流等。又比如对音频文件的操作:音频剪辑,音频格式转换。再比如我们最常用的图片文件,格式转换、各个属性的编辑等。因为多媒体文件的操作众多,本文选取一些极具代表性的操作,以代码的形式实现各个操作。

一、图片操作

操作图片的模块有许多,其中比较常用的两个就是 Pillow 和 opencv ,两个模块各有优势。其中 opencv 是计算机视觉处理的开源模块,应用的范围更加广泛,从图像处理到视频处理,再到物体检测等。而 pillow 相比直线就单纯的多,其大多数操作都是围绕图像而展开的。

1.1、格式转换

图片格式有多种多样,最直观的感受就是图片后缀。而格式之间的差异不仅仅是后缀的差异,最为明显的就是 png 格式图片,同其它图片有着最为直观的区别。下面我们就看看在Python中如何转换格式,我们先安装 pillow 模块:

pip install pillow

然后看看如何导入模块以及如何读取图像:

from PIL import Image

# 读取图像

img = Image.open('ycjc.jpg')

# 显示图像

img.show()

我们有了上面的基础操作之后,就可以开始进行格式转换了,我们用有村大妹子的图片作为素材:

我们可以看到这是一张白色背景的图片,我们将它转成 png 看看效果:

from PIL import Image

# 读取图像

img = Image.open('ycjc.jpg')

# 格式转换,其中A为透明度

png = img.convert('RGBA')

# 保存图像,因为是RGBA格式,所以后缀应该为png

png.save('ycjc.png')

输出的图片我就不放了,我们观察输出图片会发现,白色背景好像变透明了。不要怀疑,这只是心理作用,其实图片看上去是不会有任何变化的。但是实际上图片从原来的 RGB 三个色道变成了 RGBA 四个色道,我们会发现,图片变大了:

虽然 A 色道的透明度全部都是0,但是实际上还是存在这个色道,所以大小方面有了明显的增加。更多转换模式可以参考超全Python图像处理讲解(多图预警)。

1.2、图片裁剪

图片裁剪的操作也非常常用,我们来看看 pillow 如何裁剪图片:

from PIL import Image

# 读取图像

img = Image.open('ycjc.jpg')

# 裁剪图像,调用crop方法,传入裁剪区域的元组

img_crop = img.crop((100, 100, 400, 400))

# 保存裁剪后的图像

img_crop.save('ycjc_crop.jpg')

我们调用 crop 方法,传入裁剪区域的元组进行裁剪,元组的内容为左上角的坐标(前两个参数)即右下角的坐标(后两个参数)。效果图如下:

1.3、截屏

虽然算不上是图像操作,但是还是个非常实用的操作。我们实现截屏是通过ImageGrap类实现的:

from PIL import ImageGrab

# 截取全屏

im = ImageGrab.grab()

# 保存图像

im.save('win.png')

除了截取全屏我们也可以区域截屏:

im =ImageGrab.grab((300, 100, 1400, 600))

参数元组含义与 crop 方法一致。

除了上述操作,还有更多像是添加滤镜、对比度调节、亮度调节、色彩调节等,由于内容众多,所以不在本文详细讨论。

二、音频操作

音频的操作也比较繁多,我们最常用到的就是音频剪辑和音量调节了。我们这里使用 pydub 模块来进行音频文件的操作。

2.1、pydub的安装以及读取音频

安装我们还是使用pip:

pip install pydub

然后我们来读取一个 wav 文件:

from pydub import AudioSegment

# 读取wav格式的音频文件

music = AudioSegment.from_wav('百年孤独.wav')

这样我们就完成了音频文件的读取, wav 文件是一种未经压缩的文件,我们可以通过 pydub 直接读取。读取其它类型的文件 pydub 同样提供了相应的方法:

music = AudioSegment.from_mp3('music.mp3')

music = AudioSegment.from_ogg("music.ogg")

music = AudioSegment.from_flv("music.flv")

因为在实际操作过程中遇到了一个未找明缘由的错误,所以本文的音频操作只针对 wav 格式。

2.2、音频剪切

音频剪辑的实现我们是通过类似ndarray的中括号操作的:

# 截取前20秒

clip = music[:20*1000]

# 截取后20秒

clip = music[-20000:]

# 从第20秒截取到第40秒

clip = music[20*1000:40*1000]

剪切好的片段我们可以另外存一个文件:

# 保存文件为clip.mp3,格式为mp3

clip.export('clip.mp3', format='mp3')

3.3、增加/减少音量

音量的控制我们只需要用音频对象加一个常数即可:

# 音量减5

music -= 5

# 音量加5

music += 5

3.4、音频拼接

我们先看看重复拼接:

# 在音频文件末尾重复拼接该音频

music = music*2

拼接后的音频的效果就是原音频循环两次。接下来我们看看拼接不同的音频:

# 裁剪前20秒音频

clip1 = music[:20*1000]

# 裁剪后20秒音频

clip2 = music[-20*1000:]

# 拼接音频

clip = clip1 + clip2

3.5、 交叉渐入渐出

交叉渐入渐出是一种比较柔和的音频转场方式,在两个音频切换的间歇会有一个重合,用代码实现如下:

# 截取前20秒

begin = music[20*1000:40*1000]

# 截取后20秒

end = music[-20*1000:]

# 添加交叉渐入渐出 效果

clip = begin.append(end, crossfade=1500)

我们可以看到我们一共裁剪了40秒,在生成的文件我们可以看到只有38秒,因为转场的时候有个重合的效果。当然还有更多的操作,大家可以自己去了解。

三、视频操作

视频的操作可以通过 moviepy 和 opencv 进行,我们先分别安装两个模块:

pip install opencv-python

pip install moviepy

3.1、视频剪辑

相比之下 moviepy 操作视频要更便利,我们看看使用 moviepy 如何剪辑视频:

from moviepy.editor import *

# 剪切视屏bws.mp4中第50秒到第60秒

clip = VideoFileClip('bws.mp4').subclip(50, 60)

# 将剪切的片段保存

clip.write_videofile("clip.mp4")

3.2、提取音频文件

在 VideoFileClip 类中,音频文件作为其中的一个参数,我们可以直接获取:

from moviepy.editor import *

# 读取视频文件

video = VideoFileClip('bws.mp4')

# 获取其中音频

audio = video.audio

# 保存音频文件

audio.write_audiofile('audio.mp3')

3.3、混流

我们还可以将音频同视频混流,在moviepy中,提供了一个读取音频文件的类,我们设置视频的音频需要创建这个类的对象:

from moviepy.editor import *

# 读取视频

video = VideoFileClip('bws.mp4')

# 读取音频

audio = AudioFileClip('百年孤独.mp3')

# 设置视频的音频

video = video.set_audio(audio)

# 保存新的视频文件

video.write_videofile('bws_audio.mp4')

3.4、逐帧提取画面

我们都知道,视频是由一帧一帧的图片组成的,我们也可以将画面一帧一帧提取出来:

import cv2

# 读取视频

video = cv2.VideoCapture('bws.mp4')

# 逐帧读取,当还有画面时ret为True,frame为当前帧的ndarray对象

ret, frame = video.read()

i = 0

# 循环读取

while ret:

i += 1

cv2.imwrite('v'+str(i) + '.jpg', frame)

ret, frame = video.read()

上述代码就能将视屏的每一帧以图片的形式保存下来。

3.5、截取gif

截取gif和截取视频没有什么区别,不过为了减少gif的大小,我们通常会对视频进行尺寸缩放:

from moviepy.editor import *

# 读取视频

video = VideoFileClip('bws.mp4')

# 裁剪视频,并缩小一半

video = video.subclip(20, 30).resize((0.5))

# 保存gif图片

video.write_gif('bws.gif')

在上面subclip方法中,我们可以传入元组,例如:

video.subclip((1, 20), (2, 30))

其含义为从1分20秒截取到2分30秒。

总结

到此这篇关于Python中操作各种多媒体,视频、音频到图片的代码详解的文章就介绍到这了,更多相关python多媒体视频音频图片内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

python播放视频代码_Python中操作各种多媒体,视频、音频到图片的代码详解相关推荐

  1. python使用视频_Python中操作各种多媒体,视频、音频到图片的代码详解

    我们经常会遇到一些对于多媒体文件修改的操作,像是对视频文件的操作:视频剪辑.字幕编辑.分离音频.视频音频混流等.又比如对音频文件的操作:音频剪辑,音频格式转换.再比如我们最常用的图片文件,格式转换.各 ...

  2. python非贪婪匹配_Python中关于正则表达式非贪婪以及多行匹配功能详解

    这篇文章主要介绍了Python正则表达式非贪婪.多行匹配功能,结合实例形式分析了Python正则表达式中非贪婪及多行匹配功能的实现方法与相关注意事项,需要的朋友可以参考下 本文实例讲述了Python正 ...

  3. python中的json函数_python中装饰器、内置函数、json的详解

    装饰器 装饰器本质上是一个Python函数,它可以让其他函数在不需要做任何代码变动的前提下增加额外功能,装饰器的返回值也是一个函数对象. 先看简单例子: def run(): time.sleep(1 ...

  4. python 视频分段_Python中使用moviepy进行视频分割

    场景 moviepy官网: 是一个用于视频编辑的Python库:切割.连接.标题插入.视频合成.非线性编辑,视频处理和定制效果的创建. Github: 实现 首先你需要安装moviepy 打开cmd输 ...

  5. python的mysql模块_Python中操作mysql的pymysql模块详解

    前言 pymsql是Python中操作MySQL的模块,其使用方法和MySQLdb几乎相同.但目前pymysql支持python3.x而后者不支持3.x版本. 本文测试python版本:2.7.11. ...

  6. python绕过验证码登录_python接口自动化(十三)--cookie绕过验证码登录(详解)...

    简介 有些登录的接口会有验证码:短信验证码,图形验证码等,这种登录的话验证码参数可以从后台获取的(或者查数据库最直接).获取不到也没关系,可以通过添加cookie的方式绕过验证码.(注意:并不是所有的 ...

  7. python中x y表示_Python中表达式x += y和x = x+y 的区别详解

    前言 本文主要给大家介绍的是关于Python中表达式x += y和x = x+y 区别的相关内容,分享出来供大家参考学习,下面来看看详细的介绍: 直接看下面代码: x +=y In [66]: id( ...

  8. python输入什么就输出什么意思_python中的输入与输出是什么?(实例详解)

    对于第一次接触到python这门编程语言的朋友来说,刚刚开始学习python编程的时候对于python中的输入与输出这一方面的了解比较少,在这篇文章之中我们就来了解一下python输入与输出的相关知识 ...

  9. python写界面文字游戏_Python:pygame游戏编程之旅五(游戏界面文字处理详解)

    再简单的游戏界面中均涉及文字处理,本节主要解读一下pygame模块中对文字及字体的处理方式. 同样,以实例进行讲解,先看看代码: #!/usr/bin/env python # -*- coding: ...

最新文章

  1. Java获取小程序带参二维码(太阳码)
  2. 垃圾回收算法与实现系列-Java堆内存溢出原因
  3. 判断Windows操作系统位数的方法
  4. ifconfig没有ip地址_虚拟机创建后该如何获取IP地址并访问互联网实用教程
  5. 拓端tecdat|matlab使用样条插值重采样估计INR数据研究
  6. wxpython仿写记事本
  7. ISO50001认证咨询,ISO50001能源管理体系建立的基本步骤及企业的管理权限范围
  8. 基于linker实现so加壳补充从dex中加载so
  9. 啊哈C语言-20220823学习练习
  10. html 实现复制功能
  11. 动态链接库劫持--libc
  12. 3个办法解决:微信删除的聊天记录怎么恢复?
  13. TI DM36X 名词
  14. 使用AppiumDesktop控制手机
  15. 用navicat访问linux数据库,成功实现Navicat访问Linux中安装的MySQL数据库
  16. 如何在windows电脑上完成原神签到、祈愿抽卡分析等功能
  17. 试推导取自总体X(期望为μ,方差为σ^2)的样本X1,X2...Xn的样本方差S^2的期望
  18. android elf 加固_Android so加固的简单脱壳
  19. SpringBoot 系列教程(六十):SpringBoot整合Swagger-Bootstrap-Ui
  20. 每瓶海天酱油都有“大数据”

热门文章

  1. 蓝桥杯 四阶幻方 C语言
  2. 每日小知识:windows和操作系统
  3. 阿里云 mysql 100_阿里云RDS实例CPU超过100%
  4. 深情回眸 经典软件十五年风雨兼程
  5. [附源码]SSM计算机毕业设计智能视频推荐网站JAVA
  6. Java制作简易画图板
  7. WebSockets通信
  8. SpringBoot教程四定时任务cron表达式Shedule
  9. velocity指导手册
  10. 防火墙基础--包过滤