Java爬取喜马拉雅非付费音频

目录

Java爬取喜马拉雅非付费音频

前言

1 打开喜马拉雅网站并搜索一个节目

2 研究其数据来源,获取分页数据

3 获取列表信息

4 获取音频下载地址

5 核心代码

6 基本使用


前言

因为很喜欢喜马拉雅FM上的音频节目,之前也找过一些喜马拉雅音频下载器。可能是因为网站调整,有些下载器慢慢出现了问题,估计是有些地址解析不了了,于是就想着研究一下喜马拉雅FM的请求方法,利用java去模拟请求,做一个自己的小工具玩玩。

下面就开始研究喜马拉雅FM的请求方式吧!

1 打开喜马拉雅网站并搜索一个节目

喜马拉雅FM

这里的节目例子以我很喜欢的《首席医官》为例

2 研究其数据来源,获取分页数据

打开浏览器控制台,清空Network下的日志

点击任何一页,查看Network下的日志

从上面两幅图可以看出,分页的数据来自于请求:

https://www.ximalaya.com/revision/album?albumId=3071659

解析其返回的json数据便可以拿到分页信息

3 获取列表信息

在上面那个控制台中,还有一个请求可以看到列表信息

从上面的请求中可以拿到每一则音频的基本信息

4 获取音频下载地址

清空浏览器控制台,点击任何一个音频,查看Network的地址

从这个请求中,我们也可以拿到列表信息,并且可以拿到音频的下载地址

5 核心代码

Java实现爬取喜马拉雅音频文件(非付费)

代码都是最基本的,之后有时间会对其进行优化,比如加入多线程下载、图形化界面、断点续传等,欢迎感兴趣的童鞋来博客或GitHub提意见^_^

有时间大家可以尝试做个前端版本,利用ajax请求,自己设计页面,这样相当于做了一个喜马拉雅FM免费音频的搜索引擎,从浏览器上直接搜索并下载^_^,到时候一起分享嘛~

6 基本使用

主函数如下

    public static void main(String[] args){//初始化音频列表,修改专辑ID便可下载该专辑的音频内容(非付费)AudioBean audioBean = AudioDealUtil.initBean("https://www.ximalaya.com/revision/album","albumId=3071659");//修改下载路径AudioDealUtil.initDownloadAudio("https://www.ximalaya.com/revision/play/album",audioBean,"D://download//");}

只要改变专辑ID和本地路径便可以下载音频啦~

Java爬取喜马拉雅非付费音频相关推荐

  1. JS下载喜马拉雅非付费音频

    JS下载喜马拉雅非付费音频 目录 JS下载喜马拉雅非付费音频 1 Demo"成品"及GitHub地址 2 数据分析 3 JS下载文件流 4 搜索列表,下载音频 5 总结 昨天分析了 ...

  2. python爬取喜马拉雅FM音频

    前前言 喜马拉雅已经更换标签,我重新更新了下代码,思路还是如此,需要的可以扫一下文末公众号二维码(本人会在上面发表爬虫以及java的文章还有送书等资源福利哦),也可以直接搜索公众号" 猿狮的 ...

  3. Python中使用requests和parsel爬取喜马拉雅电台音频

    场景 喜马拉雅电台: https://www.ximalaya.com/ 找到一步小说音频,这里以下面为例 https://www.ximalaya.com/youshengshu/16411402/ ...

  4. python爬取喜马拉雅音频

    python爬取喜马拉雅音频 爬虫框架的三个基本组成:获取网页,寻找信息,收集信息. ## 分析网页获取音频资源的url打开网页https://www.ximalaya.com/youshengshu ...

  5. Python爬虫:爬取喜马拉雅音频数据详解

    前言 喜马拉雅是专业的音频分享平台,汇集了有声小说,有声读物,有声书,FM电台,儿童睡前故事,相声小品,鬼故事等数亿条音频,我最喜欢听民间故事和德云社相声集,你呢? 今天带大家爬取喜马拉雅音频数据,一 ...

  6. python爬取app中的音频_Python爬取喜马拉雅音频数据详解

    码农公社  210.net.cn  210是何含义?10月24日是程序员节,1024 =210.210既 210 之意. Python爬取喜马拉雅音频数据详解 一.项目目标 爬取喜马拉雅音频数据 受害 ...

  7. Python爬虫|爬取喜马拉雅音频

    "GOOD Python爬虫|爬取喜马拉雅音频 喜马拉雅是知名的专业的音频分享平台,用户规模突破4.8亿,汇集了有声小说,有声读物,儿童睡前故事,相声小品等数亿条音频,成为国内发展最快.规模 ...

  8. 【爬虫修炼和实战】二、从requests开始——爬取喜马拉雅全站音频数据(基础篇)

    第二篇为利用爬虫基本的requests库和正则表达式爬取喜马拉雅全站数据. 申明:本文仅做学习用. 多图警告. 目录 一.常用函数和库 二.网站结构分析 首页 https://www.ximalaya ...

  9. python爬取app中的音频_喜马拉雅app 爬取音频文件

    ============== 2019-10-28更新 ================= 因为喜马拉雅的源码格式改了,所以爬虫代码也更新了一波 # -*- coding: utf-8 -*- # w ...

最新文章

  1. 【RocketMQ工作原理】
  2. 操作系统【三】内存管理基础+连续内存分配
  3. DataDirectory是什么?
  4. 解决 springboot 项目:找不到或无法加载主类
  5. 2020中国移动阅读行业报告
  6. 如果想用Python下载付费歌曲,应该怎么做?
  7. 光伏逆变器MPPT基本算法介绍-李星硕
  8. python_open函数中newline参数详解
  9. PHP审计-RIPS
  10. Vue3+Ant-design项目启用ts/typescript
  11. keil错误和解决办法(1):FCARM - Output Name not specified, please check ‘Options for Target - Utilities’
  12. 二级python多少分过关_计算机等级考试的合格分数是多少_高职招生网
  13. 【数学】手写开根号(牛顿迭代法 | 二分)
  14. 产业分析:2021中国股权投资动态
  15. MySQL系列---架构与SQL执行流程详解
  16. 暗示的力量如此可怕!父母请永远不要对孩子说的“三个字”
  17. mega盘要_[MEGA DEAL]支付您想要的:2018机器学习套件(99%折扣)
  18. 通过朋友圈网易云链接获取网易云账号及微博的方法
  19. 数学分析告诉偶们什么(vamei)
  20. 网红张大奕订婚:未婚夫不是蒋凡 传是地产富二代

热门文章

  1. 手把手教你进行APP数据埋点
  2. 人羊狼菜过河问题c++
  3. 工厂AR定位导航系统,实现人员、车辆精准导航
  4. 如何使用缓存提高程序性能
  5. jupyter 写入csv pandas_整理一套 pandas 详细教程,希望对你有帮助!
  6. oracle学习笔记 oracle软件安装准备工作 第一部分 环境准备
  7. 弘辽科技:淘宝店铺被管控还能开吗?原因是什么?
  8. 自己动手搭网站(四):用bootstrap写几个简单的页面
  9. ffmpeg mp4 mp3 pcm flac转换
  10. 我从负债十几万到财富自由