搜索老郭的单口相声,打开检查模式,刷新

没有什么有价值的东东, 不过…清掉内容, 点击一个相声,再看看有些什么

是不是发现了些什么

我们来点击这个看看, 首先看一下headers, 这个url是不是看起来很顺眼

再来preview, 或者打开那个Request URL

怎么样,这个就是网站提供的数据接口了,有了这个接口,我们获取文件就相当方便了

'''
遇到问题没人解答?小编创建了一个Python学习交流QQ群:857662006
寻找有志同道合的小伙伴,互帮互助,群里还有不错的视频学习教程和PDF电子书!
'''
# -*- coding:utf-8 -*-import requests,os# 数据来源
URL = 'https://www.ximalaya.com/revision/play/album?albumId=9742745&pageNum=1&sort=-1&pageSize=30'
# 伪造请求头
XMLY_HEADER = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3724.8 Safari/537.36'}res = requests.get(URL,headers=XMLY_HEADER)
res_json = res.json()play_list = res_json['data']['tracksAudioPlay']
ALL_PATH = play_list[0]['albumName']# 创建本地专辑文件夹
os.system(f'mkdir -p {ALL_PATH}/MUSIC')
os.system(f'mkdir -p {ALL_PATH}/COVER')MUSIC_PATH = ALL_PATH + '/MUSIC'
COVER_PATH = ALL_PATH + '/COVER'for i in play_list:# print(i['trackName'])# print(i['trackCoverPath'])# print(i['src'])# 获取文件信息 (标题 音乐路径 图片路径)url_title = i['trackName']url_music_path = i['src']url_cover_path = 'https:' + i['trackCoverPath']# 下载保存音乐文件music_file = requests.get(url_music_path)  # 下载文件local_music_path = os.path.join(MUSIC_PATH,f'{url_title}.mp3')  # 保存路径+文件名+后缀# 写入音乐文件with open(local_music_path,'wb') as f:f.write(music_file.content)# 下载保存图片信息cover_file = requests.get(url_cover_path)  # 下载文件local_cover_path = os.path.join(COVER_PATH,f'{url_title}.jpg')  # 保存路径+文件名+后缀# 写入图片文件with open(local_cover_path, 'wb') as f:f.write(cover_file.content)

python爬虫简单代码爬取郭德纲单口相声相关推荐

  1. python爬虫简单实例-爬取17K小说网小说

    什么是网络爬虫? 网络爬虫(Web Spider),又被称为网页蜘蛛,是一种按照一定的规则,自动地抓取网站信息的程序或者脚本. 爬虫流程 先由urllib的request打开Url得到网页html文档 ...

  2. Python爬虫简单运用爬取代理IP

    功能1: 爬取西拉ip代理官网上的代理ip 环境:python3.8+pycharm 库:requests,lxml 浏览器:谷歌 IP地址:http://www.xiladaili.com/gaon ...

  3. Python爬虫:Xpath爬取网页信息(附代码)

    Python爬虫:Xpath爬取网页信息(附代码) 上一次分享了使用Python简单爬取网页信息的方法.但是仅仅对于单一网页的信息爬取一般无法满足我们的数据需求.对于一般的数据需求,我们通常需要从一个 ...

  4. python爬虫,记录爬取全球所有国家-首都的简单爬虫

    python爬虫,记录爬取全球所有国家-首都的简单爬虫 本来以为简单至极,没想到获取数据还是花费了大把功夫.先上图 <table> <tr> <td> <st ...

  5. python 爬虫实例 电影-Python爬虫教程-17-ajax爬取实例(豆瓣电影)

    Python爬虫教程-17-ajax爬取实例(豆瓣电影) ajax: 简单的说,就是一段js代码,通过这段代码,可以让页面发送异步的请求,或者向服务器发送一个东西,即和服务器进行交互 对于ajax: ...

  6. Python爬虫 scrapy框架爬取某招聘网存入mongodb解析

    这篇文章主要介绍了Python爬虫 scrapy框架爬取某招聘网存入mongodb解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 创建项目 sc ...

  7. Python爬虫入门(爬取豆瓣电影信息小结)

    Python爬虫入门(爬取豆瓣电影信息小结) 1.爬虫概念 网络爬虫,是一种按照一定规则,自动抓取互联网信息的程序或脚本.爬虫的本质是模拟浏览器打开网页,获取网页中我们想要的那部分数据. 2.基本流程 ...

  8. Python爬虫---影评的爬取

    Python爬虫-影评的爬取 介绍:爬虫练手,使用Requests库进行豆瓣影评的爬虫,做成词云图,写文章主要做一些问题解决的记录. 运行环境:python 3.8, Pycharm 关于在豆瓣爬取影 ...

  9. 【Python爬虫】从零开始爬取Sci-Hub上的论文(串行爬取)

    [Python爬虫]从零开始爬取Sci-Hub上的论文(串行爬取) 维护日志 项目简介 步骤与实践 STEP1 获取目标内容的列表 STEP2 利用开发者工具进行网页调研 2.1 提取文章链接和分页链 ...

最新文章

  1. 判别式or生成式:哪一个才能代表视觉理解的未来?
  2. 河北单招计算机英语,2019年河北高职单招英语联考试题
  3. 软件需求工程与UML建模——第九组原型系统总结
  4. linux GUI程序开发
  5. 11月17日学习内容整理:jquery文档处理,事件细讲,动画
  6. python手机号码正确编程_python 小练习之生成手机号码
  7. 第二课 android项目结构
  8. nginx 直接在配置文章中设置日志分割
  9. javascript 图表_我如何使用JavaScript数据透视表和图表库分析开发人员趋势
  10. u-boot移植随笔:u-boot shell与ASCII码
  11. Protobuf报错Protocol message tag had invalid wire type
  12. 死锁避免算法--银行家算法
  13. powershell excel 导入 sqlserver
  14. Texar安装、Textgenrnn安装
  15. 程序员级别,你到哪一级?
  16. VS2005下配置OGRE
  17. golang的https服务器
  18. Java反射--实战篇
  19. 王者荣耀scratch版
  20. CVPR 2020 最佳论文提名 | 神经网络能否识别镜像翻转

热门文章

  1. 利用批处理命令执行.jar文件
  2. 投掷硬币与大数定律推导
  3. gmcurl,支持国密SSL的的curl
  4. WordPress添加个性化的博客宠物的方法
  5. 昵称脱敏只显示第一个字剩下的显示星号
  6. 杭电acm1004java答案_杭电acm1004源码
  7. Ory Kratos 用户认证
  8. 美通企业日报 | 爱彼迎招募5名南极科考志愿者;中金拟与腾讯成立合资技术公司...
  9. Docker核心技术学习笔记
  10. 小白如何在CSDN写博客(干货)