这篇文章主要介绍了基于Python爬取素材网站音频文件,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下,另外我建立了一个Python学习圈子群:1156465813,在这里可以一起交流Python。

基本环境配置

  • python 3.6

  • pycharm

  • requests

  • parsel

相关模块pip安装即可

目标网页

请求网页 

import requestsurl = 'https://www.tukuppt.com/peiyue/zonghe_0_0_0_0_0_0_1.html'headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36',}
response = requests.get(url=url, headers=headers)

解析网页,提取数据

import parselselector = parsel.Selector(response.text)urls = selector.css('#audio850995 source::attr(src)').getall()titles = selector.css('.b-box .info .title::text').getall()data = zip(urls, titles)for i in data:mp3_url = 'https:' + i[0]title = i[1]

保存数据

def download(url, title):response = requests.get(url=url, headers=headers)path = 'D:\\python\\demo\\熊猫办公素材\\背景音乐\\' + title + '.mp3'with open(path, mode='wb') as f:f.write(response.content)

以上就是全部内容,希望对大家的学习有所帮助

另外我建立了一个Python学习圈子:1156465813。在彼此的沟通可以我们可以得到很多学习经验,积累知识,群内有2020最新的python学习资料,大家可以一起讨论问题,共同进步。

Python爬取素材网站的音频文件相关推荐

  1. Python爬取网站用户手机号_设计师的福利,python爬取素材网站

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 基本环境配置 python 3.6 pycharm requests parsel 相关模块 ...

  2. python爬取素材图片代码_基于Python爬取素材网站音频文件

    基本环境配置 python 3.6 pycharm requests parsel 相关模块pip安装即可 目标网页 请求网页 import requests url = 'https://www.t ...

  3. python爬取收费素材_基于Python爬取素材网站音频文件

    基本环境配置SUW免费资源网 python 3.6 pycharm requests parsel 相关模块pip安装即可SUW免费资源网 SUW免费资源网 目标网页SUW免费资源网 SUW免费资源网 ...

  4. Python | 使用Python爬取Wallhaven网站壁纸并上传百度网盘

    更多详情请查看Honker Python | 使用Python爬取Wallhaven网站壁纸并上传百度网盘 给大家推荐一款超好用的壁纸下载网站-- wallhaven 第一次知道这个网站的时候,惊为天 ...

  5. 使用Python爬取马蜂窝网站的游记和照片

    使用Python爬取马蜂窝网站的游记和照片 特殊原因需要在马蜂窝上爬取一些游记和照片作为后续分析处理的数据,参考网上一些类似的爬虫文章,自己尝试了一下,这次爬取的是马蜂窝上所有有关苏州的游记(包括游记 ...

  6. 20行Python代码爬取2W多条音频文件素材【内附源码+详细解析】新媒体创作必备

    大家好,我是辣条. 今天的内容稍显简单,不过对于新媒体创作的朋友们还是很有帮助的,你能用上的话记得给辣条三连! 爬取目标 网站:站长素材 工具使用 开发工具:pycharm 开发环境:python3. ...

  7. Python爬取小说网站下载小说

    1前言 这个小程序是用来爬取小说网站的小说的,一般的盗版小说网站都是很好爬取的 因为这种网站基本没有反爬虫机制的,所以可以直接爬取 该小程序以该网站http://www.126shu.com/15/下 ...

  8. python爬取阿里巴巴网站实现

    文章目录 1.杂谈 2.python爬虫的过程 3.代码分享 1.杂谈   好久没有更新我的博客了,那么问题来了,我干嘛去了,难道不爱分享了吗?不,我不是.真实情况是,我刚毕业,入职某互联网公司.因为 ...

  9. Python——爬取小说网站的整本小说

    编译环境:pycharm 需要的库:requests,lxml,bs4,BeautifulSoup,os 思路如下: 首先可以先建立一个文件,使用os库中的os.makedirs("文件名: ...

最新文章

  1. Java8 中有趣酷炫的小技巧,你用到了那些?
  2. 直播预告 | 斯坦福助理教授马腾宇:深度学习中的隐式和显式正则化
  3. hdu2482 字典树+spfa
  4. Linux内核: 分析coredump文件
  5. redis集群方式介绍
  6. linux 两个驱动 竞争,Linux设备驱动第五章(并发和竞争)读书笔记(国外英文资料).doc...
  7. Cortex-M3-MPU(存储器保护单元)
  8. 微服务feignclient_微服务-(声明式调用feign)
  9. preparedStatement问号的深入理解
  10. 如何在网页标题栏title加入logo(icon)图标?
  11. iar环境下c语言编程,c语言_源代码-iar环境配置.pdf
  12. Python使用模糊哈希值比较文件相似度
  13. mysql 分页_MySQL 如何优化大分页查询?
  14. 载入Haskell的函数
  15. gif透明背景动画_软件|电脑GIF录制软件,强烈推荐!
  16. 读胡适先生《赠与今年的大学毕业生》和《赠与大学毕业生的话》后感
  17. 鸿蒙系统是不是无法注册gmail邮箱也无法正常使用youtube?
  18. wdcp服务器权限修改,Linux下wdcp控制面板安装tipask3.0教程
  19. 平安银行广州分行:以金融赋能慈善 释放更大社会效能
  20. 以太网供电(POE)的关键技术解析

热门文章

  1. 汇川技术小型PLC梯形图编程系列教程(二):AutoShop软件使用技巧介绍
  2. 使用 object 和 embed 标签播放SWF文件
  3. Windows 下的 OpenGL 开发环境配置(GLFW+GLAD)
  4. html文件容易中毒,中毒.html
  5. C++中位运算的使用方法
  6. 安徽省2016“京胜杯”程序设计大赛_K_纸上谈兵
  7. 图书馆管理系统(简易版)
  8. 模仿现实生活中的通讯录(2)
  9. 如何同时上内网和外网
  10. Python使用get_text()方法从大段html中提取文本