Python爬虫案例:爬取酷狗音乐全排行榜歌曲
前言
本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理
本次目标
爬取酷狗音乐全站排行榜歌曲
目标地址
https://www.kugou.com/yy/html/rank.html?from=homepage
环境
Python3.6.5
pycharm
爬虫代码
调入工具
import requests
import re
import parsel
请求网站
headers = {'authority': 'wwwapi.kugou.com','cookie': 'kg_mid=ac3836df72c523f46a85d8a5fd90fe59; kg_dfid=3ve7aQ2XyGmN0yE3uv3WcaHs; Hm_lvt_aedee6983d4cfc62f509129360d6bb3d=1600260110,1602312707; kg_dfid_collect=d41d8cd98f00b204e9800998ecf8427e; kg_mid_temp=ac3836df72c523f46a85d8a5fd90fe59; Hm_lpvt_aedee6983d4cfc62f509129360d6bb3d=1602312738','referer': 'https://www.kugou.com/song/','user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36',
}
url = 'https://www.kugou.com/yy/html/rank.html'
response = requests.get(url=url, headers=headers)
解析网站数据
def func(url):response = requests.get(url=url, headers=headers)response.encode = response.apparent_encodinghashs = re.findall('"Hash":"(.*?)"', response.text, re.S)album_ids = re.findall('"album_id":(.*?),"', response.text, re.S)FileNames = re.findall('"FileName":"(.*?)"', response.text, re.S)data = zip(hashs, album_ids, FileNames)for i in data:hash = i[0]album_ids = i[1]FileName = i[2].encode('utf-8').decode('unicode_escape')# print(hash, album_ids, FileName)download_url = 'https://wwwapi.kugou.com/yy/index.php'params = {'r': 'play/getdata','callback': 'jQuery19107150201841602037_1602314563329','hash': '{}'.format(hash),'album_id': '{}'.format(album_ids),'dfid': '3ve7aQ2XyGmN0yE3uv3WcaHs','mid': 'ac3836df72c523f46a85d8a5fd90fe59','platid': '4','_': '1602312793005',}for i in html_data:page_url = i[0]name = i[1]print(page_url)func(page_url)print('==========================正在爬取{}歌曲========================'.format(name))
保存数据
def download(url, title):filename = '保存地址' + title + '.mp3'response = requests.get(url=url, headers=headers)with open(filename, mode='wb') as f:f.write(response.content)print(title)
运行代码,效果如下图
Python爬虫案例:爬取酷狗音乐全排行榜歌曲相关推荐
- Python爬虫之爬取酷狗音乐歌曲
Python爬虫之爬取酷狗音乐歌曲 1.安装第三方库 在Python的语言库中, 分为Python标准库和Python的第三方库. Python标准库是在你安装Python的时候已经包含在了安装目录下 ...
- python爬虫:爬取酷狗音乐榜单中的音乐信息并存储到MySQL(附源码)
目录 具体思路 代码部分 获取歌曲名称和歌手 获取歌曲播放页的url 获取音乐下载地址 将获取到的音乐信息添加到MySQL中 完整代码 获取酷狗音乐榜单中的音乐信息,这里我以"网络红歌榜&q ...
- 【Python爬虫】爬取酷狗TOP500的数据
该文利用Requests和BeautifulSoup第三方库,爬去酷狗网榜单中酷狗TOP500的信息. 首先分析页面:https://www.kugou.com/yy/rank/home/1-8888 ...
- 爬取酷狗音乐Top100_排行榜
酷狗音乐: https://www.kugou.com/ (1)我们爬取的是这里, url : https://www.kugou.com/yy/rank/home/2-8888.html 通过观察 ...
- python爬虫(爬取酷狗排行榜并保存到本地)
目录 了解什么是爬虫 安装相关的库 分析爬取的网页 写出代码 一:了解什么是爬虫 爬虫专业来讲就是一个探测机器,又被称为网络蜘蛛或网络机器人,是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本, ...
- 使用scrapy 爬取酷狗音乐歌手及歌曲名并存入mongodb中
备注还没来得及写,共爬取八千多的歌手,每名歌手平均三十首歌曲算,大概二十多万首歌曲 run.py 1 #!/usr/bin/env python 2 # -*- coding: utf-8 -*- 3 ...
- Python爬虫入门——2. 2爬取酷狗音乐top1-500歌曲信息
有了第一个程序的基础,我们现在来爬取酷狗音乐top500的歌曲信息.连接http://www.kugou.com/yy/rank/home/1-8888.html 我们第一个程序只爬取了一个页面的数据 ...
- Python爬虫爬取酷狗音乐TOP500
Python大作业 内容简介: 用Python来爬取酷狗音乐TOP500的歌曲信息,统计这500首歌曲中出现的所有歌手,并做可视化处理生成词云 实验代码: import time import req ...
- Java爬虫系列之实战:爬取酷狗音乐网 TOP500 的歌曲(附源码)
在前面分享的两篇随笔中分别介绍了HttpClient和Jsoup以及简单的代码案例: Java爬虫系列二:使用HttpClient抓取页面HTML Java爬虫系列三:使用Jsoup解析HTML 今天 ...
最新文章
- 随机森林为何要有放回抽样
- 用UltraISO制作支持windows 7的U盘启动盘
- 每日一皮:完美的配合...虽然有点怪...
- RHCE笔记1-安裝
- c语言6大设计原则 控制反转,fun6868备用网址-fun6868备用网址
- 2018-2019年度 AI方向Top10 综述
- windows启动minio bat脚本编写示例
- 柴树杉:面向数据科学领域的新语言,Go+蓄势待发
- x86异常处理与中断机制(1)概述中断的来源和处理方式
- Mac 下nginx 环境的配置
- 第二季4:HI_S32 SAMPLE_VENC_1080P_CLASSIC(HI_VOID)函数的分析
- html form urlencode,form-data和x-www-form-urlencode的区别
- java-io-FileReader和FileWriter类
- Git 提交错了不用慌,这三招帮你修改记录
- 2022医疗AI行业研究白皮书 附下载
- 软件工程——数据字典
- Unity3D - 关于ASTC压缩格式的一些资料搜集
- C#进程间通信的几种方式:管道通信
- 购买重疾险是不是都要先去体检?千万不要!
- 2021-2027全球与中国保温冰盒市场现状及未来发展趋势
热门文章
- win10系统上传服务器失败,win10添加到服务器失败
- python gif 透明_python3 + Pillow 批量处理简单gif 转成 png 并透明化 去掉背景色
- 入职字节外包一个月,我还是选择了离职!
- Android定制日历,支持周月切换,日期标记,农历显示,节假日
- java开发优秀编程习惯,大佬的必经之路
- 职业选择测试发型软件,几款职业范发型,总有你喜欢的
- 手机看图app android小众,日常看图 + 收集灵感,这6个APP太好用!
- LINQ读书笔记(一)
- 华为5gcpe虚拟服务器,你能用5G网络干什么? 华为5G CPE Pro告诉你
- 2022年5月大学英语B统考题库复习考试题(网络统考最新题库)