原标题:我用Python爬取了网易云音乐 来源:别动我的猫尾巴

headers需要进行修改,headers设置不对会被屏蔽导致爬取不成功。一个headers用久了也会爬取不成功

代码如下:

import os

from lxml import etreeimport requests

# 设置头部信息,防止被检测出是爬虫headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.132 Safari/537.36'}url = "https://music.163.com/discover/toplist?id=3778678"base_url = 'http://music.163.com/song/media/outer/url?id='# 新建一个字典用于存储最终所需要的数据d = dict()re = requests.get(url=url, headers=headers).text# 构造了一个XPath解析对象并对HTML文本进行自动修正html = etree.HTML(re)# XPath使用路径表达式来选取x = html.xpath('//a[contains(@href,"/song?")]')

# 对取到的数据进行筛选for data in x: # 获取到音乐url href = data.xpath('./@href')[0] id = href.split("=")[1] href = base_url + "%s.mp3" % id # 添加到字典 if "$" not in id: # 获得到标签内的文本(即音乐的名称) name = data.xpath('./text()')[0] d[href] = namefor i in d: # 文件夹不存在,则创建文件夹 save_path = './music' folder = os.path.exists(save_path) if not folder: os.makedirs(save_path) # 下载音乐到当前目录的music文件夹下 get = requests.get(base_url + '%s.mp3' % i, headers=headers).content with open('./music/%s.mp3' % d[i], "wb") as f: print("正在下载歌曲 《%s》 ..." % d[i]) f.write(get)

效果如下:

求关注求赞求转发,你的支持是我最大的动力!我们下期见

海量资讯、精准解读,尽在新浪财经APP

python爬取网易云音乐_我用Python爬取了网易云音乐相关推荐

  1. python 爬取贝壳网小区名称_如何使用 python 爬取全国小区名称

    前言 笔者在做一个 NLPNLPNLP 项目时,需要识别小区名,因此想要查询网上是否有相关的数据集.经过一番搜索后一无所获-从而决定自己来爬取这份数据. 由于爬取网站的内容信息之后可能会发生变更,因此 ...

  2. python爬取京东手机数据_实例解析Python如何实现爬取京东手机图片

    本文主要为大家分享一篇Python如何实现爬取京东手机图片的方法,具有很好的参考价值,希望对大家有所帮助.一起跟随小编过来看看吧,希望能帮助到大家. 运行环境Python3.6.4#爬取京东手机图片i ...

  3. python第三方插件登录网易音乐_项目实战 | Python开发网易云音乐插件

    介绍 深度音乐播放器的网易云音乐插件,可在Linux下播放用户创建.收藏的歌单,以及私人FM. 1.基于sumary的dmusic-plugin-baidumusic修改而成 2.使用了NetEase ...

  4. python 微信公众号发文章_如何使用 Python 爬取微信公众号文章

    我比较喜欢看公众号,有时遇到一个感兴趣的公众号时,都会感觉相逢恨晚,想一口气看完所有历史文章.但是微信的阅读体验挺不好的,看历史文章得一页页的往后翻,下一次再看时还得重复操作,很是麻烦. 于是便想着能 ...

  5. python可以爬取wind数据库吗_如何利用Python来爬取近百万条数据?数据库会炸吧?...

    2.页面分析 发现一共有88万多个问题,再看一下页面的列表规律,我们按照每页最大显示50个问题,一共有17776页,数据非常大 1).页面列表的构建 整个的stackoverflow上关于Python ...

  6. python爬取知乎评论_从零开始写Python爬虫 --- 爬虫应用:IT之家热门段子(评论)爬取...

    不知道这里有没有喜欢刷it之家的小伙伴,我反正每天早上醒来第一件事就是打开it之家,看看有没有新鲜的段子 逃~ 其实这次是要来抓取it之家的热门评论,因为数量较多(上万),所以我们这次采用MongoD ...

  7. 如何用python爬取公众号文章_如何使用 Python 爬取微信公众号文章

    我比较喜欢看公众号,有时遇到一个感兴趣的公众号时,都会感觉相逢恨晚,想一口气看完所有历史文章.但是微信的阅读体验挺不好的,看历史文章得一页页的往后翻,下一次再看时还得重复操作,很是麻烦. 于是便想着能 ...

  8. python 爬取直播弹幕视频_调用斗鱼API爬取直播间弹幕信息(用户昵称及弹幕内容)...

    调用斗鱼API爬取直播间弹幕信息(用户昵称及弹幕内容) 查看<斗鱼弹幕服务器第三方接入协议v1.4.1>,了解斗鱼API的使用方法,即如何连接斗鱼弹幕服务器.维持连接及获取弹幕信息 Pyt ...

  9. python抓取京东联盟优惠券_[爬虫]使用python抓取京东全站数据(商品,店铺,分类,评论)...

    网上抓取京东数据的文章,现在要么无法抓取数据,要么只能抓取部分数据,本文将介绍如何抓取京东全站数据,包括商品信息.店铺信息,评论信息,分类信息等. -------------------------- ...

  10. python有什么好玩的库_你知道Python很火!那你知道它有哪些好玩的库吗?

    原标题:你知道Python很火!那你知道它有哪些好玩的库吗? 本文来源:sun菜菜(今日头条作者) 原文链接:https://www.toutiao.com/a6498615748884169230/ ...

最新文章

  1. 从 Gzip 压缩 SVG 说起 — 论如何减小资源文件的大小
  2. VS2019使用说明
  3. 打造生物智能和人工智能“双螺旋”,智源研究院发布“人工智能的认知神经基础”重大研究方向...
  4. vb串口 任意波特率_C#与单片机串口通讯,实现简单的计数功能
  5. Travelling (三进制+状压dp)
  6. python爬虫——web前端基础(1)
  7. 测试抽象类和模板方法模式
  8. async中series的实现 javascript构件
  9. dax 筛选 包含某个字_筛选状态(ALL与REMOVEFILTERS)
  10. (转)RabbitMQ学习之主题topic(java)
  11. mac iterm2 安装 lrzsz rz sz命令
  12. C语言如何打开shx文件,shx文件怎么打开 .shx格式打开方式解答
  13. java进行微信公众号开发
  14. 股票经典书籍推荐(豪华版)
  15. android 定时器 误差,运动会计时器(PC+安卓)版本
  16. ios14测试版兼容软件,ios14描述文件
  17. ObjectARX:C# ObjectARX--起步
  18. android新浪微博开发Sso登录(转)
  19. echarts 漏斗图
  20. B 最强DE 战斗力(大数+数论)

热门文章

  1. 视觉slam14讲之相机与框架
  2. 时间复杂度 T(n)
  3. ICDM 2019最佳论文:从图片、文本到网络结构数据翻译,一种新型的多属性图翻译模型...
  4. Vue+ElementUi 项目中 将页面内容转为 Word文档下载
  5. 一个简单的BP神经网络例子
  6. html怎么设置禁止缩放,css怎么实现禁止缩放
  7. 华为进军笔记本,恐难在PC市场引吭高歌
  8. 什么东西可以改善睡眠质量?最好的助眠神器推荐
  9. appium + python 常用的xpath定位
  10. 【Qt编程】3D迷宫游戏