Python——爬取喜马拉雅音频(抖音最火翻唱)
目标网站:https://www.ximalaya.com/yinyue/20248318/
分析每一页网页url有什么不同:
第一页url:‘https://www.ximalaya.com/revision/play/albumalbumId=20248318&pageNum=1&sort=1&pageSize=30’
第二页url’https://www.ximalaya.com/revision/play/albumalbumId=20248318&pageNum=2&sort=1&pageSize=30’
第三页url:‘https://www.ximalaya.com/revision/play/albumalbumId=20248318&pageNum=3&sort=1&pageSize=30’
一共有十六页,可以使用Python当中的.format方法来占位(方法不唯一)
代码如下:
for i in range(1, 17): # 通过循环及.format函数来获取到每页网页url的链接url = 'https://www.ximalaya.com/revision/play/album?albumId=20248318&pageNum={}&sort=1&pageSize=30'.format(i)# 该网站有反爬手段,我们可以通过伪装来和时间戳进行伪装headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.142 Safari/537.36','xm-sign': '140acf6ece604f0c2034f1cf0f34a191(35)1571115325926(15)1571115327596'# 时间戳(时间戳不唯一,会根据时间变化而改变)}response = requests.get(url, headers=headers) #get请求的时候要加入伪装html = response.textresult = json.loads(html) #由于网站的数据是一个json类型的字符串,使用要调用该方法count_list = result['data']['tracksAudioPlay']for count in count_list:src = count['src']name = count['trackName']with open('MP3/%s.m4a' % name, 'wb') as f:music = requests.get(src)print('正在下载{}...'.format(name), end='')f.write(music.content)f.close()print('\t下载完成')
运行结果:
Python——爬取喜马拉雅音频(抖音最火翻唱)相关推荐
- python爬取喜马拉雅音频
python爬取喜马拉雅音频 爬虫框架的三个基本组成:获取网页,寻找信息,收集信息. ## 分析网页获取音频资源的url打开网页https://www.ximalaya.com/youshengshu ...
- 使用python爬取喜马拉雅音频数据并保存
** 使用python爬取喜马拉雅音频数据并保存 ** 1.进入喜马拉雅官网,打开要爬取的项目网页,按F12=>F5后进行清空,点击项目网页中播放按钮,出现如下图点击,查找网页的url,获取到网 ...
- python爬取无水印抖音小姐姐视频(2018最新,含Pyqt客户端)
各位小伙伴,之前一段时间迷上了抖音小姐姐视频,但是下载的视频都有水印,于是自己用Python 写了个爬取小姐姐视频的工具,大家可以直接拷贝到自己编译器上运行.此外,我还利用pyqt5写了个操作界面,这 ...
- python爬取喜马拉雅音频数据
''' 思路: 请求和响应的过程 多层数据解析 海量音频数据保存 https://aod.cos.tx.xmcdn.com/storages/1c5f-audiofreehighqps/DB/A3/C ...
- python爬取app中的音频_Python爬取喜马拉雅音频数据详解
码农公社 210.net.cn 210是何含义?10月24日是程序员节,1024 =210.210既 210 之意. Python爬取喜马拉雅音频数据详解 一.项目目标 爬取喜马拉雅音频数据 受害 ...
- python爬取喜马拉雅_Python爬虫实战案例之爬取喜马拉雅音频数据详解
这篇文章我们来讲一下在网站建设中,Python爬虫实战案例之爬取喜马拉雅音频数据详解.本文对大家进行网站开发设计工作或者学习都有一定帮助,下面让我们进入正文. 前言 喜马拉雅是专业的音频分享平台,汇集 ...
- Python爬虫:爬取喜马拉雅音频数据详解
前言 喜马拉雅是专业的音频分享平台,汇集了有声小说,有声读物,有声书,FM电台,儿童睡前故事,相声小品,鬼故事等数亿条音频,我最喜欢听民间故事和德云社相声集,你呢? 今天带大家爬取喜马拉雅音频数据,一 ...
- Python爬虫|爬取喜马拉雅音频
"GOOD Python爬虫|爬取喜马拉雅音频 喜马拉雅是知名的专业的音频分享平台,用户规模突破4.8亿,汇集了有声小说,有声读物,儿童睡前故事,相声小品等数亿条音频,成为国内发展最快.规模 ...
- 每日一个爬虫练习:爬取喜马拉雅音频
前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 本次目标 爬取喜马拉雅音频 https://www.ximalaya.co ...
最新文章
- java编程石头剪刀布图片_石头、剪刀、布!10分钟带你打开深度学习大门,代码已开源...
- Java开发中业务层入参校验详细解析
- bash给脚本加进度条_进度条——shell脚本实现
- SpringBoot的注解:@SpringBootApplication注解 vs @EnableAutoConfiguration+@ComponentScan+@Configuration...
- java基础学习总结——对象转型
- hdu 3416(最短路+最大流)
- AAAI 2021 | 关键词指导的神经对话模型
- KNN识别手写体数字
- 打造含有 Mali Graphics Debugger 支持的虚幻引擎应用程序
- C++用new来创建对象和非new来创建对象的区别
- NLP学习—20.WMD paper及代码
- powerdesigner 16.5 Could not Initialize JavaVM!
- java 枚举类使用反射
- hyperedger +fabric 区块链实践
- 微波射频工程师必读经典参考书
- Transformer综述(A Survey on Vision Transformer) 阅读学习笔记(三)--Transformer应用的图像处理与视频处理的研究
- 数据库DDL与DML指的什么?
- python上方菜单栏不见了_python tkinter-菜单栏
- dsf5.0 有确认按钮的弹框
- 《把时间当作朋友》之读后感