嗨嗨, 我是小圆~

现在是短视频时代,很多人都开始拍摄短视频或者网上找视频制作短视频。越来越多的人也开始往自媒体发展,但是有时候我们剪辑视频的时,总会用到一些搞怪的音效,一些背景音乐等等 ~

一个个去找再去下载太麻烦了, 还有些慢。

所以今天来教大家用python实现批量下载!

环境/模块/目标

1、目标

2、开发环境

兄弟们,刚学Python的话,不要安装一些其它的软件,就装这两个就可以了~

Python 环境
Pycharm 编辑器

3、模块

本次使用的模块主要是这两个

requests # 数据请求模块
re # 正则表达式模块

流程讲解

这次我详细写流程,小白都能看懂的那种,看完大家记得三连,给我一点创作的动力吧 ,嘿嘿~

首先我们打开网址后右键选择检查

选择network ,刷新页面往下滑,会出现一个 page-4 和 page-5 的页面。

这两个页面很多数据是直接在这里有的,我们随便找一个点击播放,然后点击media ,在headers里面会有一个音频文件,就是我标注的下载地址。

可以直接播放也可以直接下载

那想获得这个这个地址怎么搞呢?

我们直接复制这串数字,比如32716 ,然后点击左上角的这个搜索框,搜索一下。

搜索之后我们可以看到page-5这里就有音频的声音链接地址。

音频标题也在这里可以找到

然后我们点击headers,直接对于这个url地址发送请求。

首先导入requests模块

import requests

url就是刚刚的链接

url = 'https://手动替换一下/search/word-/page-5'

然后我们加一个headers进行伪装

这里直接复制 headers 下面的 user-agent 里面的内容就好了

记得加上引号

headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/98.0.4758.102 Safari/537.36'
}

然后发送请求,打印一下看看结果


response = requests.get(url=url, headers=headers)
print(response.text)

打印出来的内容太多了,我们直接在上面搜索MP3,精准定位,它的标题就在mp3文件下面那个链接那里。

然后我们把它复制过来,用正则去匹配中间这段内容,中间的url用(.*?)代替。

首先导入re模块

import re

刚刚那段内容复制过来,.*?用括号括起来。

从 response.text 里面去匹配,匹配到的内容用play_url_list这个变量接收。

play_url_list = re.findall('<div class="ui360 ui360-vis"><a href="(.*?)"></a></div>', response.text)

然后打印一下看看有没有匹配到内容

print(play_url_list)

可以看到直接匹配到了mp3文件,它包含在一个列表里面。

那我们还需要它的标题名字,同样的复制过来。

还是一样的操作,url和名字都替换为 .*?

从 response.text 里面去匹配,匹配到的内容用name_list这个变量接收。

name_list = re.findall('<a class="h6 text-white font-weight-bold" target="_blank" href=".*?" title="(.*?)">.*?</a>', response.text)

打印一下

print(name_list)

可以看到名字这些数据,都已经获取到了。

遍历一下,把获取到的数据打包到一起,然后一个个提取出来,获取它的一个二进制数据内容,用mp3_content 这个变量接收一下

for play_url, name in zip(play_url_list, name_list):mp3_content = requests.get(url=play_url, headers=headers).content

然后直接保存,with open 给它一个文件夹的名字,加上名字,加上 .mp3的后缀,保存方式 mode = wb , 用 f.write 这个变量接收一下 mp3_content

    with open('音效\\' + name + '.mp3', mode='wb') as f:f.write(mp3_content)

这里咱们没有写自动创建文件夹, 所以需要手动创建一下文件夹,然后把你命名的名字写入进来。


然后我们打印一下,看看结果。

print(name)


相关的数据内容就保存在你创建的文件夹了

注:所有的url大家自己手动替换一下,我这里把它们删了,不然会误杀

全部代码

import requests
import re
url = 'https://这里大家自己替换一下/search/word-/page-5'
headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/98.0.4758.102 Safari/537.36'
}
response = requests.get(url=url, headers=headers)
# print(response.text)
play_url_list = re.findall('<div class="ui360 ui360-vis"><a href="(.*?)"></a></div>', response.text)
name_list = re.findall('<a class="h6 text-white font-weight-bold" target="_blank" href=".*?" title="(.*?)">.*?</a>', response.text)
print(play_url_list)
print(name_list)
for play_url, name in zip(play_url_list, name_list):mp3_content = requests.get(url=play_url, headers=headers).contentwith open('音效\\' + name + '.mp3', mode='wb') as f:f.write(mp3_content)print(name)

朋友们,今天的分享就到这里,溜了溜了~

记得点赞收藏,赐予我动力~

16行代码让你拥有用不完的音乐素材相关推荐

  1. python爬虫代码1000行-Python爬虫教程(16行代码爬百度)

    最近在学习python,不过有一个正则表达式一直搞不懂,自己直接使用最笨的方法写出了一个百度爬虫,只有短短16行代码. 首先安装必背包: pip3 install bs4 pip3 install r ...

  2. python小游戏-16行代码实现3D撞球小游戏!-源码下载

    python小游戏-16行代码实现3D撞球小游戏!-源码下载 所属网站分类: 资源下载 > python小游戏 作者:搞笑 链接: http://www.pythonheidong.com/bl ...

  3. Python爬虫教程(16行代码爬百度)

    最近在学习python,不过有一个正则表达式一直搞不懂,自己直接使用最笨的方法写出了一个百度爬虫,只有短短16行代码. 首先安装必背包: pip3 install bs4 pip3 install r ...

  4. python爬取豆瓣读书简单_Python用16行代码就搞定了爬取豆瓣读书页面

    点击蓝字"python教程"关注我们哟! 我们一直说Python比较简单,代码体量没有别的程序那么大,对于初学者,尤其是零编程基础的初学者来说,感触没有那么明显,那么今天就让你见识 ...

  5. python爬取豆瓣读书简单_Python用16行代码就搞定了爬取豆瓣读书页面!

    我们一直说Python比较简单,代码体量没有别的程序那么大,对于初学者,尤其是零编程基础的初学者来说,感触没有那么明显,那么今天就让你见识一下:爬取豆瓣读书页面,Python用16行代码就搞定了! p ...

  6. 每年扫码千亿次!微信官方开源了自家优化的二维码引擎!3行代码让你拥有微信扫码能力...

    本文转载自OpenCV团队. 十天前,微信官方开发团队在 opencv_contrib 开源了自家优化9年的二维码引擎!各位读者可编译最新版OpenCV及opencv_contrib ,直接使用! 2 ...

  7. 重磅!微信二维码引擎OpenCV开源!3行代码让你拥有微信扫码能力

    点击上方"CVer",选择加"星标"置顶 重磅干货,第一时间送达 本文转载自:OpenCV团队 2011年12月微信3.5版本正式上线"扫一扫&quo ...

  8. 16行代码AC——例题6-4破损的键盘(Broken Keyboard,UVa 11988)——解题报告

    励志用尽量少的代码做高效的表达. 题目(提交)链接→UVa-11988 题目大意: 输入一个字符串,输出在原本应该是怎么样的? 具体方法是: 若读取到'[', 则执行Home键:将光标移到行首. 若读 ...

  9. 解题报告+优化——试题 基础练习 矩形面积交——16行代码AC

    励志用少的代码做高效的表达. 心路历程: 第一阶段: 最初想独立AC出这题来着,但考虑来考虑去,总觉得没想到点子上,缺点什么似的.于是搜网,果不其然,是一种全新的算法"线段交".当 ...

最新文章

  1. 企业创新系列之:青苹之末
  2. C/S与B/S的区别
  3. 用sqlplus为oracle创建用户和表空间
  4. 数据结构---并查集
  5. P7444-「EZEC-7」猜排列【dp】
  6. java编译机制_java的编译机制
  7. python读csv最快方法_使用Python读写csv文件的三种方法
  8. Python机器学习:线型回归法02最小二乘法
  9. python中用于循环结构的关键字_详解Python的循环结构知识点
  10. 【转】socket提交http表单 [C++]
  11. SQL Server 数据库所有表增加同一列
  12. SpringCloud教程合集
  13. innerHTML、innerText和outerHTML的区别
  14. 7-4 华氏度转摄氏度 (5分)_PTA_Java基础练习
  15. 算法题目打卡:Ques20201017
  16. c语言 界面编程 毕业设计,基于c语言的毕业设计.docx
  17. 如此详细的尾灯模组方案,不看看吗?
  18. 创建套接字socket函数的详解(sock_stream和sock_dgram的分析)
  19. 第108章 属性关键字 - Required
  20. css超出显示...(单行、多行)

热门文章

  1. Vue.js 源码分析—— Slots 是如何实现的
  2. cadence capture之元器件创建“Homogeneous和Heterogeneous“的区别
  3. matlab中调用函数
  4. Darknet运行提示Video-stream stopped
  5. xcx欢迎使用CSDN-markdown编辑器
  6. 【安卓辅助】安卓批量管理器
  7. 做一个小exe,双击它使用指定的浏览器打开指定的网页
  8. 什么是手机App界面设计规范?
  9. 模具随形透气成为现实 毅速推出新一代透气钢技术
  10. 笔试常见输入总结(Java)