上一篇文章讲了如何分析,寻找视频的下载链接。其实获取喜马拉雅电台音频的链接方式也是如此,通过chrome的Network调试工具去寻找页面链接与下载链接之间的关系。

第一步:分析页面源码

直接pass了,源码中没有音频的下载链接,当然有的网站是有的,比如荔枝FM,有的话直接解析就好了,没有话,就看下一步了

第二步:chrome调试

打开chrome调试工具,逐一分析打开音频之后的网络请求和结果,以http://www.ximalaya.com/24137038/sound/10484545为例:

一点一点的分析,发现第一行和最后一行,一个是.json一个是.m4a,好了,发现了,点开.json的链接,是一个json字符串,而且我们想要的音频下载链接就在里面

第三步:总结

通过http://www.ximalaya.com/24137038/sound/10484545 获取http://www.ximalaya.com/tracks/10484545.json中的json字符串,解析字符串就可以获取音频的下载链接了,这个两个链接之间的关系,一眼就应该能看出来吧

源码

#coding=utf-8
import os
import urllib
import sys
import json
sys.path.append("..")
import common
class Xmly():URL_PRIFIX = "http://www.ximalaya.com/tracks/"def getJsonUrl(self,url):result = url.split('/')return result[len(result)-1]+".json"def getVoiceUrl(self,html):# print htmljsonStr = json.loads(html)return jsonStr["title"].encode('utf-8'),jsonStr["play_path"]def download(self,url,filepath):jsonUrl = self.URL_PRIFIX + self.getJsonUrl(url)html = common.getHtml(jsonUrl)voiceTitle,voiceUrl = self.getVoiceUrl(html)common.download(voiceUrl,filepath,voiceTitle+'.m4a')if __name__ == '__main__':url = "http://www.ximalaya.com/13163945/sound/10499951"xmly = Xmly()xmly.download(url,"/Users/cheng/Documents/PyScript/res/")

(python)下载喜马拉雅电台的音频相关推荐

  1. JS下载喜马拉雅非付费音频

    JS下载喜马拉雅非付费音频 目录 JS下载喜马拉雅非付费音频 1 Demo"成品"及GitHub地址 2 数据分析 3 JS下载文件流 4 搜索列表,下载音频 5 总结 昨天分析了 ...

  2. 下载喜马拉雅FM的音频

    PS:因为经济情况,目前在喜马拉雅FM听的都是不需要付费的音频,在此感谢这些作者们,所以下列方法也是针对不需要付费的音频操作的. 方法很简单,打开相应的播放页面,鼠标在页面上右键检查,打开Networ ...

  3. JS + shell 批量下载 喜马拉雅FM 的音频

    一直在线收听喜马拉雅的音频节目, 收听广播节目节约了大量时间,不管是地铁上还是走路都可以收听,不用低头看书,也脱离了颈椎病的苦恼. 过年回家我想在车上收听,发现只能通过手机播放,效果不好,我就在网上找 ...

  4. 如何下载喜马拉雅里面的音频文件

    http://jingyan.baidu.com/article/1876c8529ebee0890b13769c.html 下载360 , 扩展工具 -> fvd download 然后打开相 ...

  5. Python中使用requests和parsel爬取喜马拉雅电台音频

    场景 喜马拉雅电台: https://www.ximalaya.com/ 找到一步小说音频,这里以下面为例 https://www.ximalaya.com/youshengshu/16411402/ ...

  6. python爬取喜马拉雅收费_Python中使用requests和parsel爬取喜马拉雅电台音频

    场景 喜马拉雅电台: 找到一步小说音频,这里以下面为例 实现 找到下载地址 使用谷歌浏览器打开上面网址,按F12打开调试,点击播放按钮后,然后找到Network下的Media下的Headers下的Re ...

  7. Python 爬虫下载喜马拉雅音频文件

    阅读文本大概需要 5 分钟 学习,是一个长期的过程.学习的方式也是有很多种的,在家里时间有空闲时间的话可以选择读书,如今在手机上看电子书也方便.pk哥最近看电子书比较多,感觉自己的视力明显下降了.停下 ...

  8. 新一配:perl循环调用python爬虫批量下载喜马拉雅音频

    新一配:perl循环调用python爬虫批量下载喜马拉雅音频 手机下载喜马拉雅音频后,获得的音频文件虽然可以转成mp3格式,但其文件名却是一长串字符串,无法辨别是哪一集,网上找了各种工具,都有局限性, ...

  9. 大数据信息资料采集:喜马拉雅电台音频节目FM有声小说听书采集

    大数据信息资料采集:恋听网喜马拉雅电台音频节目FM有声小说听书数据信息内容采集 数据采集满足多种业务场景:适合产品.运营.销售.数据分析.政府机关.电商从业者.学术研究等多种身份职业. 舆情监控:全方 ...

最新文章

  1. R语言基于glmnet构建分类模型并可视化特征系数(coefficient)以及L1正则化系数(lambda)实战
  2. SAP MM MIGO界面‘Where’标签页里的storage bin
  3. cannot resolve symbol r_64位ret2_dl_runtime_resolve模版题以及踩坑记录
  4. SSH框架搭建的时候遇到的问题
  5. AJPFX关于代码块的总结
  6. WIN2003下×××服务器架设攻略
  7. 【Sharepoint】 备份与清理Audit log
  8. JRuby 1.6.5发布 Ruby语言的Java实现
  9. 博弈-巴什博弈-P/N图
  10. 基于单片机的“彩灯控制器”的程序设计与调试
  11. 企业生产现场中5S管理的应用
  12. 文献阅读笔记之 - - 48V锂电池管理系统的设计与实现(贾小龙)
  13. Nginx反向代理有什么用?
  14. 使用Bugly 作为APP异常上报工具
  15. 网件路由器设置电子邮件发送日志到QQ邮箱
  16. 清除磁盘中的恢复分区-dos命令
  17. 少儿搜索软件测试,有道少儿词典app评测:学习字词好帮手
  18. 利用PopButton实现类似Path的点聚式导航
  19. idea设置关键字颜色_IntelliJ IDEA配置颜色与字体
  20. 2022年山东省职业院校技能大赛高职组“网络系统管理”赛项规程

热门文章

  1. Python爬取古诗词
  2. 港科夜闻|国务院港澳办主任夏宝龙在香港科大考察期间,表示对学校开展创科工作的鼓励及希望...
  3. 5.6版本GTID复制异常处理一例(转)
  4. CDN: trunk URL couldn‘t be downloaded的解决办法
  5. 复数 实数 有理数 无理数
  6. python 根据x的值和函数y=20+x2,计算y_new,算出y_new和y的差,记为delta_y。¶绘制x和delt_y的点图,并计算y的方差。有关方差的计算参阅数学资料。
  7. 微信小程序使用image组件显示图片的方法
  8. 恢复和去除时间(Recovery and Removal Time)
  9. 用料扎实的全模组电源,还有十年换新支持,安钛克HCG 850体验
  10. c语言综合合计实验报告,C语言设计实验报告(第一次)