前言

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理

本次目标

爬取酷狗音乐全站排行榜歌曲

目标地址

https://www.kugou.com/yy/html/rank.html?from=homepage

环境

Python3.6.5

pycharm

爬虫代码

调入工具

import requests
import re
import parsel

请求网站

headers = {'authority': 'wwwapi.kugou.com','cookie': 'kg_mid=ac3836df72c523f46a85d8a5fd90fe59; kg_dfid=3ve7aQ2XyGmN0yE3uv3WcaHs; Hm_lvt_aedee6983d4cfc62f509129360d6bb3d=1600260110,1602312707; kg_dfid_collect=d41d8cd98f00b204e9800998ecf8427e; kg_mid_temp=ac3836df72c523f46a85d8a5fd90fe59; Hm_lpvt_aedee6983d4cfc62f509129360d6bb3d=1602312738','referer': 'https://www.kugou.com/song/','user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36',
}
url = 'https://www.kugou.com/yy/html/rank.html'
response = requests.get(url=url, headers=headers)

解析网站数据

def func(url):response = requests.get(url=url, headers=headers)response.encode = response.apparent_encodinghashs = re.findall('"Hash":"(.*?)"', response.text, re.S)album_ids = re.findall('"album_id":(.*?),"', response.text, re.S)FileNames = re.findall('"FileName":"(.*?)"', response.text, re.S)data = zip(hashs, album_ids, FileNames)for i in data:hash = i[0]album_ids = i[1]FileName = i[2].encode('utf-8').decode('unicode_escape')# print(hash, album_ids, FileName)download_url = 'https://wwwapi.kugou.com/yy/index.php'params = {'r': 'play/getdata','callback': 'jQuery19107150201841602037_1602314563329','hash': '{}'.format(hash),'album_id': '{}'.format(album_ids),'dfid': '3ve7aQ2XyGmN0yE3uv3WcaHs','mid': 'ac3836df72c523f46a85d8a5fd90fe59','platid': '4','_': '1602312793005',}for i in html_data:page_url = i[0]name = i[1]print(page_url)func(page_url)print('==========================正在爬取{}歌曲========================'.format(name))

保存数据

def download(url, title):filename = '保存地址' + title + '.mp3'response = requests.get(url=url, headers=headers)with open(filename, mode='wb') as f:f.write(response.content)print(title)

运行代码,效果如下图

Python爬虫案例:爬取酷狗音乐全排行榜歌曲相关推荐

  1. Python爬虫之爬取酷狗音乐歌曲

    Python爬虫之爬取酷狗音乐歌曲 1.安装第三方库 在Python的语言库中, 分为Python标准库和Python的第三方库. Python标准库是在你安装Python的时候已经包含在了安装目录下 ...

  2. python爬虫:爬取酷狗音乐榜单中的音乐信息并存储到MySQL(附源码)

    目录 具体思路 代码部分 获取歌曲名称和歌手 获取歌曲播放页的url 获取音乐下载地址 将获取到的音乐信息添加到MySQL中 完整代码 获取酷狗音乐榜单中的音乐信息,这里我以"网络红歌榜&q ...

  3. 【Python爬虫】爬取酷狗TOP500的数据

    该文利用Requests和BeautifulSoup第三方库,爬去酷狗网榜单中酷狗TOP500的信息. 首先分析页面:https://www.kugou.com/yy/rank/home/1-8888 ...

  4. 爬取酷狗音乐Top100_排行榜

    酷狗音乐: https://www.kugou.com/ (1)我们爬取的是这里,  url : https://www.kugou.com/yy/rank/home/2-8888.html 通过观察 ...

  5. python爬虫(爬取酷狗排行榜并保存到本地)

    目录 了解什么是爬虫 安装相关的库 分析爬取的网页 写出代码 一:了解什么是爬虫 爬虫专业来讲就是一个探测机器,又被称为网络蜘蛛或网络机器人,是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本, ...

  6. 使用scrapy 爬取酷狗音乐歌手及歌曲名并存入mongodb中

    备注还没来得及写,共爬取八千多的歌手,每名歌手平均三十首歌曲算,大概二十多万首歌曲 run.py 1 #!/usr/bin/env python 2 # -*- coding: utf-8 -*- 3 ...

  7. Python爬虫入门——2. 2爬取酷狗音乐top1-500歌曲信息

    有了第一个程序的基础,我们现在来爬取酷狗音乐top500的歌曲信息.连接http://www.kugou.com/yy/rank/home/1-8888.html 我们第一个程序只爬取了一个页面的数据 ...

  8. Python爬虫爬取酷狗音乐TOP500

    Python大作业 内容简介: 用Python来爬取酷狗音乐TOP500的歌曲信息,统计这500首歌曲中出现的所有歌手,并做可视化处理生成词云 实验代码: import time import req ...

  9. Java爬虫系列之实战:爬取酷狗音乐网 TOP500 的歌曲(附源码)

    在前面分享的两篇随笔中分别介绍了HttpClient和Jsoup以及简单的代码案例: Java爬虫系列二:使用HttpClient抓取页面HTML Java爬虫系列三:使用Jsoup解析HTML 今天 ...

最新文章

  1. 随机森林为何要有放回抽样
  2. 用UltraISO制作支持windows 7的U盘启动盘
  3. 每日一皮:完美的配合...虽然有点怪...
  4. RHCE笔记1-安裝
  5. c语言6大设计原则 控制反转,fun6868备用网址-fun6868备用网址
  6. 2018-2019年度 AI方向Top10 综述
  7. windows启动minio bat脚本编写示例
  8. 柴树杉:面向数据科学领域的新语言,Go+蓄势待发
  9. x86异常处理与中断机制(1)概述中断的来源和处理方式
  10. Mac 下nginx 环境的配置
  11. 第二季4:HI_S32 SAMPLE_VENC_1080P_CLASSIC(HI_VOID)函数的分析
  12. html form urlencode,form-data和x-www-form-urlencode的区别
  13. java-io-FileReader和FileWriter类
  14. Git 提交错了不用慌,这三招帮你修改记录
  15. 2022医疗AI行业研究白皮书 附下载
  16. 软件工程——数据字典
  17. Unity3D - 关于ASTC压缩格式的一些资料搜集
  18. C#进程间通信的几种方式:管道通信
  19. 购买重疾险是不是都要先去体检?千万不要!
  20. 2021-2027全球与中国保温冰盒市场现状及未来发展趋势

热门文章

  1. win10系统上传服务器失败,win10添加到服务器失败
  2. python gif 透明_python3 + Pillow 批量处理简单gif 转成 png 并透明化 去掉背景色
  3. 入职字节外包一个月,我还是选择了离职!
  4. Android定制日历,支持周月切换,日期标记,农历显示,节假日
  5. java开发优秀编程习惯,大佬的必经之路
  6. 职业选择测试发型软件,几款职业范发型,总有你喜欢的
  7. 手机看图app android小众,日常看图 + 收集灵感,这6个APP太好用!
  8. LINQ读书笔记(一)
  9. 华为5gcpe虚拟服务器,你能用5G网络干什么? 华为5G CPE Pro告诉你
  10. 2022年5月大学英语B统考题库复习考试题(网络统考最新题库)