Python爬取喜马拉雅有声小说【转载】
话不多说 直接上源码
爬取喜马拉雅有声小说—夜惊魂
import re
import os
import json
import requests
def Night_fright():
start_url=‘https://www.ximalaya.com/revision/play/album?albumId=2683677&pageNum={}&sort=0&pageSize=30’
headers={
“User-Agent”: “Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.169 Safari/537.36”
}
for n in range(10):url = start_url.format(n + 1)r=requests.get(url,headers=headers)ret=r.content.decode()result=json.loads(ret)list=result['data']['tracksAudioPlay']for i in list:src=i['src']name=i['trackName']name=re.sub('\?|"|\|','',name)with open('./mp4/{}.m4a'.format(name),'ab') as f:mus=requests.get(src,headers=headers)f.write(mus.content)print(name)
if name==‘main’:
Night_fright()
Python爬取喜马拉雅有声小说【转载】相关推荐
- python爬取喜马拉雅有声小说
以绝世高手为例,爬取前三页的所有音频 采集地址:https://www.ximalaya.com/youshengshu/16411402/ 思路只有两个:获取一级页面.获取二级页面 先一步二步看一下 ...
- python爬取有声小说_听说还有付费听书的朋友,用python带你爬取喜马拉雅有声小说...
思路只有两个:获取一级页面.获取二级页面 先一步二步看一下代码: def get_mes(self): id_list = [] # 获取前三页的地址,range顾头不顾尾 for i in rang ...
- python爬取喜马拉雅_Python爬虫实战案例之爬取喜马拉雅音频数据详解
这篇文章我们来讲一下在网站建设中,Python爬虫实战案例之爬取喜马拉雅音频数据详解.本文对大家进行网站开发设计工作或者学习都有一定帮助,下面让我们进入正文. 前言 喜马拉雅是专业的音频分享平台,汇集 ...
- python爬取喜马拉雅音频
python爬取喜马拉雅音频 爬虫框架的三个基本组成:获取网页,寻找信息,收集信息. ## 分析网页获取音频资源的url打开网页https://www.ximalaya.com/youshengshu ...
- Python 爬取起点的小说(非vip)
Python 爬取起点的小说(非vip) 起点小说网是一个小说种类比较全面的网站,当然,作为收费类网站,VIP类的小说也很多,章节是VIP的话,有一个动态加载,也就 ...
- python爬取金庸小说人物
python 爬虫 python爬取金庸小说人物 ''' 通过http://www.jinyongwang.com/data/renwu/来获取金庸小说中的人物 输出结果为 小说1 人物1 人物2 人 ...
- 使用python爬取喜马拉雅音频数据并保存
** 使用python爬取喜马拉雅音频数据并保存 ** 1.进入喜马拉雅官网,打开要爬取的项目网页,按F12=>F5后进行清空,点击项目网页中播放按钮,出现如下图点击,查找网页的url,获取到网 ...
- Python爬取网页所有小说
Python爬取网页所有小说 python 2.7.15 练习beautifulsoup的使用 不了解bs的可以先看一下这个bs文档 一.看URL的规律 因为是要爬取网页上所有的小说,所以不仅要获取网 ...
- python爬取喜马拉雅FM音频
前前言 喜马拉雅已经更换标签,我重新更新了下代码,思路还是如此,需要的可以扫一下文末公众号二维码(本人会在上面发表爬虫以及java的文章还有送书等资源福利哦),也可以直接搜索公众号" 猿狮的 ...
最新文章
- 监测SQLServer数据库中表的数据变化 方案
- linux 性能测试 antutu,除了安兔兔跑分,还有这6种办法能证明手机强弱
- Coursera自动驾驶课程第6讲:Vehicle Longitudinal Control
- java中国象棋网络对弈,java课程设计---中国象棋对弈系统
- python3 selenium ie 拒绝连接报错_selenium+python自动化测试--解决无法启动IE浏览器及报错问题...
- xp 远程桌面无法找到该计算机,XP系统中远程无法连接指定计算机的处理方法
- 财务自由之路读书笔记二
- 10 Love Quotes Touch Your Soul at First Sight
- Java中abstract关键字详解
- 最近在写一个IE9的插件
- 关于jenkins自动化打包探索
- 鲁大师2021年度PC硬件报告:AMD跑分超神,华米OV入局笔记本
- 【vue笔记】页面跳转顺便传个值
- Git详解之一 Git起步
- PMP项目管理是什么?
- 【Python】京东自动下单抢购脚本——双十一购物小技巧
- 招银网络java面经
- jqfactor_analyzer源代码解读02
- LabVIEW入门第六天(布尔控件及布尔量)
- 扫地机器人黑色耐脏吗_不黑不粉、实测问答:石头扫地机器人T7好用吗?
热门文章
- thymeleaf双重循环_thymeleaf实现th:each双重多重嵌套功能
- python爬虫(案例)——豆瓣读书爬虫
- python爬取百度云资源分享吧_python爬取百度云盘资源
- 【数据分析与可视化】使用pyecharts对App下载量数据进行可视化分析(附源码)
- Linux移动机器人硬件部分,基于ORB-SLAM的移动机器人嵌入式实现与优化
- 思科6509 引擎720-3BXL 更换风扇造成设备重启
- 1094 谷歌的招聘
- 又当爹又当妈的产品经理
- Android开发之漫漫长途 XII——Fragment详解
- Arduino基础入门篇16—数码管库的使用