python爬虫爬取网易云热歌榜top200
爬取网易热歌榜
爬虫小练习
import requests
from lxml import etree# 热歌榜首页网址
url = 'https://music.163.com/discover/toplist?id=3778678'
# 歌曲下载链接前半部分
url_base = 'http://music.163.com/song/media/outer/url?id='
# U-A伪装,模拟浏览器
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 ''(KHTML, like Gecko) Chrome/85.0.4183.121 Safari/537.36'}
# 抓取网站信息并使用etree预处理数据
response = requests.get(url=url, headers=headers)
html = etree.HTML(response.text)
# 原始id、name列表(包含无关信息)
raw_id_list = html.xpath('//a[contains(@href, "song?")]/@href')
raw_name_list = html.xpath('//a[contains(@href, "song?")]/text()')
id_list = []
name_list = []
# 过滤无关信息,得到纯净列表
for id in raw_id_list:music_id = id.split('=')[1]if '$' not in music_id:id_list.append(music_id)
for music_name in raw_name_list:if '{' not in music_name:name_list.append(music_name)# 遍历所有歌曲
for i in range(len(id_list)):# 完整下载链接 music_url = url_base + id_list[i]# 对应歌曲名称music_name = name_list[i]# 获取每首歌取得具体信息music = requests.get(url=music_url, headers=headers)# 以二进制形式写入到本文件夹的(具体保存路径可自己修改)with open('./%s.mp3' % music_name, 'wb') as file:file.write(music.content)print('<%s>下载成功...' % music_name)
python爬虫爬取网易云热歌榜top200相关推荐
- python爬取网易云热歌榜
Python爬取网易云音乐热歌榜歌曲,并下载到本地 找到要下载歌曲排行榜的链接,这里用的是: https://music.163.com/discover/toplist?id=3778678 #网易 ...
- python爬虫爬取qq音乐热歌榜的歌曲到本地
文章目录 项目目标 具体实现步骤 完整代码 运行结果 项目目标 爬取qq音乐热歌榜https://y.qq.com/n/yqq/toplist/26.html到本地文件夹 具体实现步骤 程序思路:用s ...
- Python爬取网易云热歌榜所有音乐及其热评
获取特定歌曲热评: 首先,我们打开网易云网页版,击排行榜,然后点击左侧云音乐热歌榜,如图: 关于如何抓取指定的歌曲的热评,参考这篇文章,很详细,对小白很友好: 手把手教你用Python爬取网易云40万 ...
- 批量爬取网易云热歌榜音乐
import requests import re**#一.发送网络请求,访问网站** url = "https://music.163.com/discover/toplist?id=37 ...
- python网易云_用python爬虫爬取网易云音乐
标签: 使用python爬虫爬取网易云音乐 需要使用的模块 只需要requests模块和os模块即可 开始工作 先去网易云音乐网页版找一下你想要听的歌曲点击进去.按键盘F12打开网页调试工具,点击Ne ...
- python爬取网易云歌单_详解python selenium 爬取网易云音乐歌单名
目标网站: 首先获取第一页的数据,这里关键要切换到iframe里 打印一下 获取剩下的页数,这里在点击下一页之前需要设置一个延迟,不然会报错. 结果: 一共37页,爬取完毕后关闭浏览器 完整代码: u ...
- python爬虫爬取网易云音乐歌曲_Python网易云音乐爬虫进阶篇
image.png 年前写过一篇爬网易云音乐评论的文章,爬不了多久又回被封,所以爬下来那么点根本做不了什么分析,后面就再改了下,加入了多线程,一次性爬一个歌手最热门50首歌曲的评论,算是进阶版了- 思 ...
- python爬虫----爬取网易云音乐
使用python爬虫爬取网易云音乐 目录 使用python爬虫爬取网易云音乐 需要使用的模块 开始工作 运行结果 需要使用的模块 只需要requests模块和os模块即可 开始工作 先去网易云音乐网页 ...
- Python爬虫—爬取网易云音乐【热歌榜】歌曲的精彩评论(写入txt文本文件或者MySQL数据库)
最近在学Python爬虫,看了Blibili爬取网易云音乐评论的视频,视频中是将一首歌的评论存入json文件,我在此代码的基础上扩展了三点: 1.爬取热歌榜200首歌曲的精彩评论: ...
最新文章
- 2006鄂土整项目精神
- Webpack —— tree-starking 解析
- GPU代码修改成TPU代码
- [心得]Ubuntu無法ssh登入
- 8大原则带你秒懂Happens-Before原则
- centos6安装python_如何在CentOS6上安装Python2.7和Python3.3
- android nanohttp,在Android中使用NanoHTTPD
- 一道有趣的OSPF配置实例——OSPF P2P接口妙用
- 英文信的开头和结尾的客套话有哪些?
- WIN10/WIN11 优启动 GHOST
- amoeba实现mysql主从读写分离_MySQL+Amoeba实现数据库主从复制和读写分离
- Druid配置——Ingestion Spec(摄取规范)
- 基于Springboot+mybatis+mysql+html实现CRM智能办公系统
- C/C++编程必备网址
- 半导体可饱和吸收体(SA)
- 安捷伦示波器连接电脑
- sql语句case when常用查询总结
- 罗技驱动Logitech G HUB一直卡在初始加载界面无法进入的问题
- 【STM32H7教程】第92章 STM32H7的FDCAN总线应用之双FDCAN实现(支持经典CAN)
- Beautiful Soup属性和方法及文档