网页分析

分析音乐的真实地址

url拼接 获取所有数据

批量获取singid

代码编写

获取所有的songid

根据songid获取音乐的真实地址

保存音乐文件

无版权音乐稻香的爬取

网页分析

目标站点:网页链接陈粒

一个人可以跑得很快,一群人可以走得更远!

分析音乐的真实地址

选择一首歌 以陈粒的走马为例

打开开发者工具,选择network -> media -> 刷新网页就能获取到音乐的真实地址

但是得到的地址在查看源码中是读取不到的,肯定是百度音乐对其进行了隐藏。这种时候一般会有两种情况。第一种是使用了 JavaScript 对请求连接进行了拼接或加密,第二种是数据被隐藏了。由于我们不清楚是出现了那种情况。所以我们只能慢慢的去分析请求的数据。

经过分析我们可以看到真实的音乐地址是存在于这个API里面网页链接

并且我们请求这个 API 返回的是一个 json 数据(也就是python的字典数据类型)。只要我们使用字典的规则就能将我们的所有数据给提取到。

url拼接 获取所有数据

前面我们得到了音乐的真实地址,接下来我们就是分析真实地址的 url ,以期待得到下载所有音乐的诀窍。

仔细分析一下 url 就可以发现,?后面的from参数与_即使不存在也不影响数据的请求。

并且后面的参数中的songid其实就是歌曲的唯一id,from参数其实就是表明从哪个平台过来的

所以等一下我们下载音乐时,只要批量获取到歌曲的songid就能将所有的歌曲给全部下载下来了。不管音乐是否是VIP的,又或者时无版权的均可爬取。

批量获取singid

使用开发者工具,查看网页源码就能查看到songid的位置,如果我们分析一个歌手页面的url你会发现同样可以构造。

到此,整个网页分析就结束了。

代码编写

获取所有的songid

根据目标地址,获取目标地址的所有songid

def get_songid():

url = '网页链接

response = requests.get(url=url)

html = response.text

sids = re.findall(r'sid":(d+),',html)

return sids

根据songid获取音乐的真实地址

def get_music_url(songid):

api_url = '网页链接{songid}&from=web'

response = requests.get(api_url.format(songid=songid))

str_json = re.findall(r'{.*}', response.text)[0]

data = json.loads(str_json)

music_name = data['songinfo']['title']

music_url = data['bitrate']['file_link']

print(music_url, music_name)

保存音乐文件

def save_file(filename, content):

with open(file=filename, mode="wb") as f:

f.write(content)

无版权音乐稻香的爬取

进群:960410445 即可获取数十套PDF!

python爬虫下载付费音乐包有什么用_听歌音乐还要我付费?看我用Python批量下载!...相关推荐

  1. Python爬虫实战:爬取小姐姐最近的听歌曲目

    前言 作为网易云村的深度用户,网易云音乐应该是我除了微信外打开时间最长的 App 了.并不是应为网易云上面的歌曲多,而是因为那些走心的评论.边听歌边刷评论,感觉就像是走进了他人的人生之中,从另外一种意 ...

  2. atitit 音频 项目 系列功能表 音乐 v3 t67.docx Atitit 音频 项目 系列功能表 1.音频 音乐 语言领域的功能表 听歌识曲功能 酷我功能。 铃声 功能。。 音频切割(按

    atitit 音频 项目 系列功能表 音乐 v3 t67.docx Atitit 音频 项目 系列功能表 音频 音乐 语言领域的功能表 听歌识曲功能 酷我功能. 铃声 功能.. 音频切割(按照副歌部分 ...

  3. atitit 音频 项目 系列功能表 音乐 v3 t67.docx Atitit 音频 项目 系列功能表 音频 音乐 语言领域的功能表 听歌识曲功能 酷我功能。 铃声 功能。。 音频切割(按照副歌部

    atitit 音频 项目 系列功能表 音乐 v3 t67.docx Atitit 音频 项目 系列功能表 音频 音乐 语言领域的功能表 听歌识曲功能 酷我功能. 铃声 功能.. 音频切割(按照副歌部分 ...

  4. java基于Springboot+vue的在线听歌音乐网站与分享平台 elementui

    音乐网站与分享平台的主要使用者分为管理员和用户,实现功能包括管理员:首页.个人中心.用户管理.音乐资讯管理.音乐翻唱管理.在线听歌管理.留言板管理.系统管理,用户:首页.个人中心.音乐翻唱管理.我的收 ...

  5. python爬取付费音乐包有什么用_用Python制作音乐聚合下载器!付费的好像也能下载哦!...

    现在的音乐APP有很多,为了不下载很多的APP,所以咱用python做了一个聚合的音乐下载器,现在聚合了咪咕音乐.QQ音乐,下面是效果图 安装 需要安装一个辅助模块 prettytable,用于美化控 ...

  6. python网易云听歌时长_Python爬虫实战:爬取小姐姐最近的听歌曲目

    前言 作为网易云村的深度用户,网易云音乐应该是我除了微信外打开时间最长的 App 了.并不是应为网易云上面的歌曲多,而是因为那些走心的评论.边听歌边刷评论,感觉就像是走进了他人的人生之中,从另外一种意 ...

  7. 基于python爬虫的岗位数据分析以拉勾网为例_爬虫小实例-拉勾网数据分析岗位...

    原标题:爬虫小实例-拉勾网数据分析岗位 欢迎关注天善智能 hellobi.com,我们是专注于商业智能BI,大数据,数据分析领域的垂直社区,学习.问答.求职,一站式搞定! 对商业智能BI.大数据分析挖 ...

  8. Python爬虫+夜神模拟器+Fiddler抓取手机APP数据接口 -- 图文教程(霸霸看了都说好)

    Fiddler的抓包原理 Fiddler是强大的抓包工具,它的原理是以web代理服务器的形式进行工作的,使用的代理地址是:127.0.0.1,端口默认为8888,我们也可以通过设置进行修改. 代理就是 ...

  9. 5 行 Python 爬虫代码,就能采集每日资讯@_@

    文章目录 ⛳️ 实战场景 ⛳️ 编码时间 ⛳️ 实战场景 他,78 技术人社群的一个新人 他,每天都给大家分享今日新闻 他,正在学习 Python 他,昨天忽然觉得 Python 爬虫可以替代他手动操 ...

  10. python声音识别歌曲_听歌识曲--用python实现一个音乐检索器

    听歌识曲,顾名思义,用设备"听"歌曲,然后它要告诉你这是首什么歌.而且十之八九它还得把这首歌给你播放出来.这样的功能在QQ音乐等应用上早就出现了.我们今天来自己动手做一个自己的听歌 ...

最新文章

  1. Struts2中通配符的使用
  2. flutter 真机无法调试 sdk报错_Flutter - 不一样的跨平台解决方案
  3. Linux安装python3.7(Centos、Ubuntu)
  4. php 生命变量,深入理解PHP原理之变量生命期(一)
  5. VS2010配置清单
  6. html清除div浮动,HTML_清除浮动的最优方法:CSS,在CSS森林群里讨论一个margin的 - phpStudy...
  7. Vmware 安装 Fedora 18 注意事项
  8. webstorm破解版
  9. 地球轨道计算方法,开普勒三大定律的证明,补充-解析几何之椭圆
  10. BOS基础资料视图封装示例(合同种类封装成基础资料)
  11. csp202112-1:序列查询 题解
  12. win10计算机系统优化设置,这些简单优化能让你的Win10流畅很多
  13. twitter验证_如何在Twitter上进行验证(或至少尝试一下)
  14. 使用putty进行UART串口调试
  15. c5 LR is at 对于空指针的定位
  16. 琴生不等式及其加权形式的证明
  17. 告别户外弱网困扰,4G多卡聚合设备增强弱网环境下应急救援信号
  18. 树莓派-10-安装jupyter并控制SG90舵机
  19. OSG-简单模型控制
  20. 关于@Transactional的使用

热门文章

  1. 关于Nod的离线升级方案
  2. web前端简易制作之HTML
  3. 奇门遁甲时家转盘奇门排盘,带八字排盘
  4. 软件测试简历上的职业技能怎么写,软件测试岗位个人简历个人技能范文
  5. Kubernetes 【网络组件】CNI网络概念
  6. 如何实现EDIUS中的素材的替换
  7. CNVD 与 CNNVD 的区别
  8. 小米wifi驱动 linux,树莓派2B 安装小米wifi驱动
  9. idea报错快捷键_idea快捷键总结
  10. sitemesh2.4