目标网站:https://www.ximalaya.com/yinyue/20248318/
分析每一页网页url有什么不同:
第一页url:‘https://www.ximalaya.com/revision/play/albumalbumId=20248318&pageNum=1&sort=1&pageSize=30’
第二页url’https://www.ximalaya.com/revision/play/albumalbumId=20248318&pageNum=2&sort=1&pageSize=30’
第三页url:‘https://www.ximalaya.com/revision/play/albumalbumId=20248318&pageNum=3&sort=1&pageSize=30’
一共有十六页,可以使用Python当中的.format方法来占位(方法不唯一)
代码如下:

for i in range(1, 17):  # 通过循环及.format函数来获取到每页网页url的链接url = 'https://www.ximalaya.com/revision/play/album?albumId=20248318&pageNum={}&sort=1&pageSize=30'.format(i)# 该网站有反爬手段,我们可以通过伪装来和时间戳进行伪装headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.142 Safari/537.36','xm-sign': '140acf6ece604f0c2034f1cf0f34a191(35)1571115325926(15)1571115327596'# 时间戳(时间戳不唯一,会根据时间变化而改变)}response = requests.get(url, headers=headers)  #get请求的时候要加入伪装html = response.textresult = json.loads(html)   #由于网站的数据是一个json类型的字符串,使用要调用该方法count_list = result['data']['tracksAudioPlay']for count in count_list:src = count['src']name = count['trackName']with open('MP3/%s.m4a' % name, 'wb') as f:music = requests.get(src)print('正在下载{}...'.format(name), end='')f.write(music.content)f.close()print('\t下载完成')

运行结果:

Python——爬取喜马拉雅音频(抖音最火翻唱)相关推荐

  1. python爬取喜马拉雅音频

    python爬取喜马拉雅音频 爬虫框架的三个基本组成:获取网页,寻找信息,收集信息. ## 分析网页获取音频资源的url打开网页https://www.ximalaya.com/youshengshu ...

  2. 使用python爬取喜马拉雅音频数据并保存

    ** 使用python爬取喜马拉雅音频数据并保存 ** 1.进入喜马拉雅官网,打开要爬取的项目网页,按F12=>F5后进行清空,点击项目网页中播放按钮,出现如下图点击,查找网页的url,获取到网 ...

  3. python爬取无水印抖音小姐姐视频(2018最新,含Pyqt客户端)

    各位小伙伴,之前一段时间迷上了抖音小姐姐视频,但是下载的视频都有水印,于是自己用Python 写了个爬取小姐姐视频的工具,大家可以直接拷贝到自己编译器上运行.此外,我还利用pyqt5写了个操作界面,这 ...

  4. python爬取喜马拉雅音频数据

    ''' 思路: 请求和响应的过程 多层数据解析 海量音频数据保存 https://aod.cos.tx.xmcdn.com/storages/1c5f-audiofreehighqps/DB/A3/C ...

  5. python爬取app中的音频_Python爬取喜马拉雅音频数据详解

    码农公社  210.net.cn  210是何含义?10月24日是程序员节,1024 =210.210既 210 之意. Python爬取喜马拉雅音频数据详解 一.项目目标 爬取喜马拉雅音频数据 受害 ...

  6. python爬取喜马拉雅_Python爬虫实战案例之爬取喜马拉雅音频数据详解

    这篇文章我们来讲一下在网站建设中,Python爬虫实战案例之爬取喜马拉雅音频数据详解.本文对大家进行网站开发设计工作或者学习都有一定帮助,下面让我们进入正文. 前言 喜马拉雅是专业的音频分享平台,汇集 ...

  7. Python爬虫:爬取喜马拉雅音频数据详解

    前言 喜马拉雅是专业的音频分享平台,汇集了有声小说,有声读物,有声书,FM电台,儿童睡前故事,相声小品,鬼故事等数亿条音频,我最喜欢听民间故事和德云社相声集,你呢? 今天带大家爬取喜马拉雅音频数据,一 ...

  8. Python爬虫|爬取喜马拉雅音频

    "GOOD Python爬虫|爬取喜马拉雅音频 喜马拉雅是知名的专业的音频分享平台,用户规模突破4.8亿,汇集了有声小说,有声读物,儿童睡前故事,相声小品等数亿条音频,成为国内发展最快.规模 ...

  9. 每日一个爬虫练习:爬取喜马拉雅音频

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 本次目标 爬取喜马拉雅音频 https://www.ximalaya.co ...

最新文章

  1. java编程石头剪刀布图片_石头、剪刀、布!10分钟带你打开深度学习大门,代码已开源...
  2. Java开发中业务层入参校验详细解析
  3. bash给脚本加进度条_进度条——shell脚本实现
  4. SpringBoot的注解:@SpringBootApplication注解 vs @EnableAutoConfiguration+@ComponentScan+@Configuration...
  5. java基础学习总结——对象转型
  6. hdu 3416(最短路+最大流)
  7. AAAI 2021 | 关键词指导的神经对话模型
  8. KNN识别手写体数字
  9. 打造含有 Mali Graphics Debugger 支持的虚幻引擎应用程序
  10. C++用new来创建对象和非new来创建对象的区别
  11. NLP学习—20.WMD paper及代码
  12. powerdesigner 16.5 Could not Initialize JavaVM!
  13. java 枚举类使用反射
  14. hyperedger +fabric 区块链实践
  15. 微波射频工程师必读经典参考书
  16. Transformer综述(A Survey on Vision Transformer) 阅读学习笔记(三)--Transformer应用的图像处理与视频处理的研究
  17. 数据库DDL与DML指的什么?
  18. python上方菜单栏不见了_python tkinter-菜单栏
  19. dsf5.0 有确认按钮的弹框
  20. 《把时间当作朋友》之读后感

热门文章

  1. [15元]人体行为检测和识别毕业论文讲述
  2. 如何用Python画出玫瑰曲线和蝴蝶曲线
  3. 论文排版之参考文献的自动生成、设置格式及引用
  4. Composer下载以及安装
  5. uniapp预览pdf安卓打不开,可以直接新建commonwebview来跳转外部链接浏览pdf
  6. Soft Cosine Measure
  7. C14:Unity3D制作智能家居设计软件——双屏互动室内漫游
  8. 美媒称俄黑客造成卡塔尔断交潮 俄:啥事都栽给我
  9. source and destination ports as seperate columns in wireshark
  10. 什么是Saas架构?