20行Python代码爬取2W多条音频文件素材【内附源码+详细解析】新媒体创作必备
大家好,我是辣条。
今天的内容稍显简单,不过对于新媒体创作的朋友们还是很有帮助的,你能用上的话记得给辣条三连!
爬取目标
网站:站长素材
工具使用
开发工具:pycharm
开发环境:python3.7, Windows10
使用工具包:requests,lxml
重点学习内容
1.requests的网络请求应用
2.获取全部音频的网络地址
3.设置数据保存文件
项目思路解析
请求首页数据 通过修改url的值来改变数据 获取首页数据信息
获取到网页源代码 通过xpath方式提取出对应的音乐播放地址 提取出对应音频标题
保存对应音频数据信息
简易源码分享
import requests
from lxml import etree
for page in range(1, 2):url = 'http://sc.chinaz.com/yinxiao/index_{}.html'.format(page)headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'}response = requests.get(url=url, headers=headers).texthtml_data = etree.HTML(response)div_list = html_data.xpath('//div[@class="audio-item"]')for div in div_list:new_url = div.xpath('./audio/@src')[0]title = div.xpath('.//p[@class="name"]/text()')[0].strip()print(new_url, title)res = requests.get(url=new_url, headers=headers).contentfilename = '音效/' + title + '.mp3'with open(filename, 'wb') as f:f.write(res)print("下载完毕{}".format(title))
20行Python代码爬取2W多条音频文件素材【内附源码+详细解析】新媒体创作必备相关推荐
- 20行Python代码爬取王者荣耀全英雄皮肤改进版
0 写在前面 看了大神的这篇CSDN:20行Python代码爬取王者荣耀全英雄皮肤访问量那么高,忍不住想要蹭一下热点,但是蹭归蹭,总得有点货才行,于是我品我细品,发现其代码总体有三点我觉得值得改进的地 ...
- [转载]20行Python代码爬取王者荣耀全英雄皮肤
20行Python代码爬取王者荣耀全英雄皮肤,这是高手.原文链接: https://blog.csdn.net/qq_42453117/article/details/103190981 除了语言学习 ...
- 20行 Python 代码爬取王者荣耀全英雄皮肤 | 原力计划
作者 | wangweijun 责编 | Elle 出品 | CSDN 博客 引言 王者荣耀大家都玩过吧,没玩过的也应该听说过,作为时下最火的手机MOBA游戏,咳咳,好像跑题了.我们今天的重点是爬取王 ...
- 如何运用python爬游戏皮肤_Python爬虫练习:20行Python代码爬取王者荣耀全英雄皮肤...
引言王者荣耀大家都玩过吧,没玩过的也应该听说过,作为时下最火的手机MOBA游戏,咳咳,好像跑题了.我们今天的重点是爬取王者荣耀所有英雄的所有皮肤,而且仅仅使用20行Python代码即可完成. 准备工作 ...
- python爬虫脚本 初级入门爬虫英雄联盟所有皮肤_Python爬虫练习:20行Python代码爬取王者荣耀全英雄皮肤...
引言王者荣耀大家都玩过吧,没玩过的也应该听说过,作为时下最火的手机MOBA游戏,咳咳,好像跑题了.我们今天的重点是爬取王者荣耀所有英雄的所有皮肤,而且仅仅使用20行Python代码即可完成. 准备工作 ...
- 20行Python代码爬取网站美女图,哇太多了,我U盘装满了
淘女郎爬虫,可动态抓取淘女郎的信息和照片. 需要额外安装的第三方库 requests pip install requests pymongo pip install pymongo 模块功能 Tao ...
- 100行python代码爬取5万条网易新闻评论
前几天学习了一下如何爬取网易新闻动态评论,以demo为基础扩展成了100行的小程序,一次可以获取5万多条评论(当然,这取决于当时的评论总数),代码贴上: from bs4 import Beautif ...
- 20行Python代码爬取下载应用宝所有APP软件!太强了啊
前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 基本环境配置 python 3.6 pycharm requests parsel 打开开发 ...
- python爬虫代码1000行-几行Python代码爬取3000+上市公司的信息
几行Python代码爬取3000+上市公司的信息 来源:中文源码网 浏览: 次 日期:2019年11月5日 [下载文档: 几行Python代码爬取3000+上市公司的信息.txt ] (友情提示:右键 ...
最新文章
- 添加css的方式:link与@import区别
- 不管你的x86能不能升级Win 11,反正树莓派能!|安装教程
- pytorch默认初始化_“最全PyTorch分布式教程”来了!
- python pip全称_Python pip 安装与使用
- asp.net core 编译mvc,routing,security源代码进行本地调试
- 【渝粤题库】广东开放大学 传播学理论与实务 形成性考核
- java.sql.SQLException: 关闭的连接 解决办法
- java写一个外网访问的接口_不是吧不是吧!随便写的一个API竟获得 2.5 亿的访问量...
- SoapUI安装教程,亲测可用
- 工业机器人(6)川崎机器人仿真软件K-ROSET
- TPAMI2021语义分割/领域自适应-Domain Adaptation Network with Image Alignment for Unsupervised Semantic Segment
- JVM-深入理解JVM内存模型、类加载机制、内存分配机制
- 移动 APP 的测试方法,以及移动专项测试的思路与方法
- 【路径规划】基于遗传算法求解多式联运运输问题matlab源码
- DOS的建文件夹,移动图片,多级文件夹建立
- 文字阴影 - text-shadow
- 垃圾佬口中的ECC,REG内存是啥意思
- 移动端电影院电影垂直社交随心所愿看电影
- 开放式多媒体应用平台OMAP5910双核通讯技术
- mysql查询课程1比课程2低的,小菜菜mysql练习解读分析2——查询存在quot; 01 quot;课程但可能不存在quot; 02 quot;课程的情况(不存在时显示为 null ),m...