python网络爬虫网易云音乐下载_python网络爬虫爬取网易云音乐
#爬取网易云音乐
url="https://music.163.com/discover/toplist" #歌单连接地址
url2 = 'http://music.163.com/song/media/outer/url?id='#歌曲地址
headers={#请求报头
'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) chrome/72.0.3626.109 Safari/537.36'}
req=Request(url,headers=headers) #使用户可以访问该网站,认为你是浏览器,而不是爬虫
with urlopen(req) as html:#
text=html.read().decode('utf-8') #读取文件并且解码
doc=etree.HTML(text) #解析HTML文档
links=doc.xpath("//ul[@class='f-hide']/li/a/@href")#获取歌曲id
songs=doc.xpath("//ul[@class='f-hide']/li/a/text()")#获取歌曲名
ids = [ link[9::] for link in links] #切片工具只取id名部分
for sid,title in zip(ids,songs): #遍历 zip包一一对应
time.sleep(1) #间隔一秒
req2 = Request(url2 + str(sid),headers=headers) #歌曲地址加上id名
with urlopen(req2) as html: #在html中打开加载好的歌曲href
urlretrieve(html.geturl(),"songs/%s.mp3"%title)#获取geturl到歌曲信息,将歌曲下载到文件songs中
print("songs/%s.mp3 下载完成"%title)。
以上就是python网络爬虫&&爬取网易云音乐的全部内容。
python网络爬虫网易云音乐下载_python网络爬虫爬取网易云音乐相关推荐
- python爬虫网易云音乐评论再分析_爬取网易云音乐的评论后,竟有这种发现!
原标题:爬取网易云音乐的评论后,竟有这种发现! 作者 | 志颖 责编 | 胡巍巍 用过网易云音乐听歌的朋友都知道,网易云音乐每首歌曲后面都有很多评论,热门歌曲的评论更是接近百万或者是超过百万条. 现在 ...
- python爬取音乐并保存_python3 实现爬取TOP500的音乐信息并存储到mongoDB数据库中
爬取TOP500的音乐信息,包括排名情况.歌曲名.歌曲时间. 网页版酷狗不能手动翻页进行下一步的浏览,仔细观察第一页的URL: 这里尝试将1改为2,再进行浏览,恰好是第二页的信息,再改为3,恰好是第三 ...
- python爬虫网易云音乐评论再分析_Scrapy爬取网易云音乐和评论(一、思路分析)...
目录: 前提: scrapy这个框架很多人用过,网上教程也很多,但大多就是爬爬小说这种比较简单且有规律的.尤其大多网站它是可以通过点击下一页的方式爬取下一页,我看到的教程也都是这样的.而网易云的按钮光 ...
- python爬虫高级知识分子的风骨_Python程序员爬取《万物理论》10万影评,带你解读霍金的有趣故事...
相信昨天的Breaking news(爆搜)是本世纪伟大的物理学家霍金辞世,享年76岁.小伙伴肯定知道霍金的故事肯定很励志,他是智商肯定不是常人能及的,因为他的引领,不断的拓宽了人类对宇宙的认识. 作 ...
- html5网易云歌词滚动,30行代码爬取网易云歌词(示例代码)
需求分析: 利用爬虫获取网易云音乐歌曲的歌词,效果如下: 分析:通过官方的歌词API获取歌词,例如:访问https://music.163.com/#/song?id=1417093533 则会跳转到 ...
- python爬取酷狗音乐的mv地址_爬取酷狗音乐.py
import requests from selenium import webdriver from pyquery import PyQuery as pq #获取歌名 def Access_to ...
- Python网络爬虫实践(1):爬取网易云音乐播放量大于1000万的歌单
Python网络爬虫实践(1) 一.需求分析 爬取网易云音乐播放量大于1000万的歌单. 二.实施步骤 1.安装selenium selenium是一个用于Web应用自动化程序测试的工具,测试直接运行 ...
- 【python爬虫自学笔记】-----爬取网易云歌单中歌曲歌词
工具:python3.6 ,pycharm 个人歌单的链接地址为https://music.163.com/#/playlist?id=2251736705 开始对网页的内容进行爬取的时候,使用req ...
- python爬音乐评论生成词云图_python爬虫+词云图,爬取网易云音乐评论
又到了清明时节,用python爬取了网易云音乐<清明雨上>的评论,统计词频和绘制词云图,记录过程中遇到一些问题 爬取网易云音乐的评论 一开始是按照常规思路,分析网页ajax的传参情况.看到 ...
最新文章
- Python 学习笔记(3)对txt文件的读与写操作(上)
- 在ubuntu上安装samba实现与windows的文件共享
- 使用VHDL编程的直接扩频发生器
- HDU 1159 Common Subsequence 动态规划
- 计算机专业 职业素养论文,计算机专业本科毕业论文-20210707222739.docx-原创力文档...
- Window/linux(Ubuntu)使用反编译工具jad
- python统计词频_Python中文分词及词频统计
- opencv图像分析与处理(11)- 频率域滤波消除周期噪声
- 游戏建模软件的ZBrush和Mudbox哪个好
- 计算机职业规划备选方案,职业规划中的备选方案.doc
- 期货反跟单软件介绍与反跟单交易中的骗局
- 机房动力环境监测系统
- 计算机死机重装xp,XP系统电脑死机如何急救
- doom3 源代码基本情况
- Kubeadm创建集群
- CANopen 7.过程数据对象 PDO Process data object)
- 必应(bing)搜索跳转到百度解决方法
- 论文:DKN:Deep Knowledge-Aware Network for News Recommendatio
- 再批国标数学教材的微分定义
- HTML入门---慕课网
热门文章
- 微软windows7正版化(算你狠)授权过期解决方案
- python组合无重复三位数
- 风格的要素 C语言 pdf,英语写作手册:风格的要素(新译本) [Elements of Style]
- 无畏先锋服务器没响应,LOL:为啥不删除“郊区”?无畏先锋人气惨淡,21分钟匹配不到人...
- 电影推荐之《指环王:双塔奇兵》 隐私策略(Privacy policy)
- 使用python计算贝尔宾团队角色测评结果
- 自然语言生成技术现状调查:核心任务、应用和评估(3)
- 前端做一个简单的随机气泡(随机大小,随机颜色,随机方向,随机速度,透明度改变)的静态网页
- OGRE渲染引擎之地形、天空和雾
- 支付宝(蚂蚁)开放平台压力测试经验