Java爬取喜马拉雅非付费音频
Java爬取喜马拉雅非付费音频
目录
Java爬取喜马拉雅非付费音频
前言
1 打开喜马拉雅网站并搜索一个节目
2 研究其数据来源,获取分页数据
3 获取列表信息
4 获取音频下载地址
5 核心代码
6 基本使用
前言
因为很喜欢喜马拉雅FM上的音频节目,之前也找过一些喜马拉雅音频下载器。可能是因为网站调整,有些下载器慢慢出现了问题,估计是有些地址解析不了了,于是就想着研究一下喜马拉雅FM的请求方法,利用java去模拟请求,做一个自己的小工具玩玩。
下面就开始研究喜马拉雅FM的请求方式吧!
1 打开喜马拉雅网站并搜索一个节目
喜马拉雅FM
这里的节目例子以我很喜欢的《首席医官》为例
2 研究其数据来源,获取分页数据
打开浏览器控制台,清空Network下的日志
点击任何一页,查看Network下的日志
从上面两幅图可以看出,分页的数据来自于请求:
https://www.ximalaya.com/revision/album?albumId=3071659
解析其返回的json数据便可以拿到分页信息
3 获取列表信息
在上面那个控制台中,还有一个请求可以看到列表信息
从上面的请求中可以拿到每一则音频的基本信息
4 获取音频下载地址
清空浏览器控制台,点击任何一个音频,查看Network的地址
从这个请求中,我们也可以拿到列表信息,并且可以拿到音频的下载地址
5 核心代码
Java实现爬取喜马拉雅音频文件(非付费)
代码都是最基本的,之后有时间会对其进行优化,比如加入多线程下载、图形化界面、断点续传等,欢迎感兴趣的童鞋来博客或GitHub提意见^_^
有时间大家可以尝试做个前端版本,利用ajax请求,自己设计页面,这样相当于做了一个喜马拉雅FM免费音频的搜索引擎,从浏览器上直接搜索并下载^_^,到时候一起分享嘛~
6 基本使用
主函数如下
public static void main(String[] args){//初始化音频列表,修改专辑ID便可下载该专辑的音频内容(非付费)AudioBean audioBean = AudioDealUtil.initBean("https://www.ximalaya.com/revision/album","albumId=3071659");//修改下载路径AudioDealUtil.initDownloadAudio("https://www.ximalaya.com/revision/play/album",audioBean,"D://download//");}
只要改变专辑ID和本地路径便可以下载音频啦~
Java爬取喜马拉雅非付费音频相关推荐
- JS下载喜马拉雅非付费音频
JS下载喜马拉雅非付费音频 目录 JS下载喜马拉雅非付费音频 1 Demo"成品"及GitHub地址 2 数据分析 3 JS下载文件流 4 搜索列表,下载音频 5 总结 昨天分析了 ...
- python爬取喜马拉雅FM音频
前前言 喜马拉雅已经更换标签,我重新更新了下代码,思路还是如此,需要的可以扫一下文末公众号二维码(本人会在上面发表爬虫以及java的文章还有送书等资源福利哦),也可以直接搜索公众号" 猿狮的 ...
- Python中使用requests和parsel爬取喜马拉雅电台音频
场景 喜马拉雅电台: https://www.ximalaya.com/ 找到一步小说音频,这里以下面为例 https://www.ximalaya.com/youshengshu/16411402/ ...
- python爬取喜马拉雅音频
python爬取喜马拉雅音频 爬虫框架的三个基本组成:获取网页,寻找信息,收集信息. ## 分析网页获取音频资源的url打开网页https://www.ximalaya.com/youshengshu ...
- Python爬虫:爬取喜马拉雅音频数据详解
前言 喜马拉雅是专业的音频分享平台,汇集了有声小说,有声读物,有声书,FM电台,儿童睡前故事,相声小品,鬼故事等数亿条音频,我最喜欢听民间故事和德云社相声集,你呢? 今天带大家爬取喜马拉雅音频数据,一 ...
- python爬取app中的音频_Python爬取喜马拉雅音频数据详解
码农公社 210.net.cn 210是何含义?10月24日是程序员节,1024 =210.210既 210 之意. Python爬取喜马拉雅音频数据详解 一.项目目标 爬取喜马拉雅音频数据 受害 ...
- Python爬虫|爬取喜马拉雅音频
"GOOD Python爬虫|爬取喜马拉雅音频 喜马拉雅是知名的专业的音频分享平台,用户规模突破4.8亿,汇集了有声小说,有声读物,儿童睡前故事,相声小品等数亿条音频,成为国内发展最快.规模 ...
- 【爬虫修炼和实战】二、从requests开始——爬取喜马拉雅全站音频数据(基础篇)
第二篇为利用爬虫基本的requests库和正则表达式爬取喜马拉雅全站数据. 申明:本文仅做学习用. 多图警告. 目录 一.常用函数和库 二.网站结构分析 首页 https://www.ximalaya ...
- python爬取app中的音频_喜马拉雅app 爬取音频文件
============== 2019-10-28更新 ================= 因为喜马拉雅的源码格式改了,所以爬虫代码也更新了一波 # -*- coding: utf-8 -*- # w ...
最新文章
- 【RocketMQ工作原理】
- 操作系统【三】内存管理基础+连续内存分配
- DataDirectory是什么?
- 解决 springboot 项目:找不到或无法加载主类
- 2020中国移动阅读行业报告
- 如果想用Python下载付费歌曲,应该怎么做?
- 光伏逆变器MPPT基本算法介绍-李星硕
- python_open函数中newline参数详解
- PHP审计-RIPS
- Vue3+Ant-design项目启用ts/typescript
- keil错误和解决办法(1):FCARM - Output Name not specified, please check ‘Options for Target - Utilities’
- 二级python多少分过关_计算机等级考试的合格分数是多少_高职招生网
- 【数学】手写开根号(牛顿迭代法 | 二分)
- 产业分析:2021中国股权投资动态
- MySQL系列---架构与SQL执行流程详解
- 暗示的力量如此可怕!父母请永远不要对孩子说的“三个字”
- mega盘要_[MEGA DEAL]支付您想要的:2018机器学习套件(99%折扣)
- 通过朋友圈网易云链接获取网易云账号及微博的方法
- 数学分析告诉偶们什么(vamei)
- 网红张大奕订婚:未婚夫不是蒋凡 传是地产富二代