网易云音乐歌单首页

歌单第二页链接

歌单第三页链接

可以看出只有最后的数字在变化,所以进行url的构造,然后开始爬取

import csv

from lxml import etree

import requests

from multiprocessing.dummy import Pool

import time

headers = {

'Referer':'http://music.163.com/',

'Host':'music.163.com',

# 'User-Agent':'Mozilla/5.0 (X11: Linux *86_64; rv:38.0) Gecko/20100101 Firefox/38.0 Iceweasel/38.3.0',

'User-Agent': 'Mozilla/5.0 (X11: Linux *86_64; rv:38.0) Gecko/20100101 Firefox/38.0 Iceweasel/38.3.0',

'Accept':'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',

}

wangyi='http://music.163.com'

base_url='http://music.163.com/discover/playlist/?order=hot&cat=%E5%85%A8%E9%83%A8&limit=35&offset={}'

urlList=[] #保存构造出的链接

def totalPage():

for i in range(0,1300,35):

url=base_url.format(i)

urlList.append(url)

def getData(url):

r=requests.get(url,headers=headers)

html=etree.HTML(r.text)

MFlist=html.xpath("//p[@class='dec']/a/text()")

MFurl=html.xpath("//p[@class='dec']/a/@href")

LisNum=html.xpath("//span[@class='nb']/text()")

for i in range(len(MFlist)):

write.writerow([MFlist[i],wangyi+MFurl[i],LisNum[i]])

time.sleep(3) #延时,防止IP被封

f=open('Allmusicform.csv','a+',newline='',encoding='utf-8')

write=csv.writer(f)

p=Pool(4)

totalPage()

p.map(getData,urlList)

p.close()

分别爬取了歌单名称、url、播放次数

java爬取网易云歌单_爬取网易云音乐所有歌单相关推荐

  1. python爬取网页表格数据匹配_爬取表格类网站数据并保存为excel文件

    本文转载自以下网站:50 行代码爬取东方财富网上市公司 10 年近百万行财务报表数据 https://www.makcyun.top/web_scraping_withpython6.html 主要学 ...

  2. 计算机的30首流行音乐,2019歌曲排行榜单_快手最火歌曲2019流行歌单排行榜单一览表快手最火歌...

    快手最火歌曲2019流行歌单排行榜单一览表 快手最火歌曲都有哪几首? 快手最火歌曲都有哪几首?下面,小编带你了解快手最火歌曲2019流行歌单排行榜单. 快手最火歌曲2019流行歌单排行榜单一览表 一. ...

  3. 齐家网php源码_上海齐家网装修多少钱-装修公司

    上海齐家网团购怎么样 我们家里当时是参加的城团网的团购会团购的~有贴心的水和午餐~就连小手掌和装订单用的拉链包都已经准备好了~可以说细节是无微不至~话说城团网活动真的是场场爆满~我好几次去晚了都没有椅 ...

  4. python爬取裁判文书并分析_裁判文书网爬虫攻克

    最近因为公司需要爬取裁判文书网的某一类别文章数据,于是简单研究了一下,发现网站数据全是js加载的,于是想都没想直接用selenium尝试爬取,没想到竟然有selenium都抓取不到的js(刚毕业的py ...

  5. python爬取饿了么评论_爬取饿了么官网数据 scrapy

    展开全部 Scrapy框架的初步运用 上午刚配置好scrapy框架,32313133353236313431303231363533e58685e5aeb931333363393734下午我就迫不及待 ...

  6. 用python爬虫爬取东方财富网信息网页信息_爬取东方财富网数据的网页分析

    自学Python已有3个月之多,浏览无数大神的佳作,收获颇丰.当初自学python就是为了学习爬虫,爬取网站上好看妹子的图片--[流口水][流口水] 言归正传,近期学习量化交易知识,发现东方财富网(e ...

  7. 美国网红python图片_爬取网红小姐姐图片(简单入门)

    简单爬虫 安装第三方库 请求页面 解析网页 保存图片 安装第三方库 安装第三方请求库(requests) pip install requests 请求页面 请求成功了 存在特殊情况:请求失败 原因八 ...

  8. python爬取歌词生成词云图_爬取毛不易歌词作词云展示

    爬取毛不易歌词作词云展示 今天我们做一个数据可视化的项目,爬取毛不易的歌词做词云展示. 1.爬取数据 我们主要使用 Python 爬虫获取 HTML,用 XPath 对歌曲的 ID.名称进行解析,然后 ...

  9. python爬取热门新闻每日排行_爬取网易新闻排行榜

    #网络爬虫之最基本的爬虫:爬取[网易新闻排行榜](http://news.163.com/rank/) **一些说明:** * 使用urllib2或requests包来爬取页面. * 使用正则表达式分 ...

  10. unity图片变成马赛克如何取像素并改变颜色_爬取微信好友头像完成马赛克拼图!千张头像拼成海贼王!...

    马赛克拼图 何谓马赛克拼图(千图成像),简单来说就是将若干小图片平凑成为一张大图,如下图路飞一样,如果放大看你会发现里面都是一些海贼王里面的图片. Our Tragets 爬取所有微信好友的头像 将所 ...

最新文章

  1. CTO 两年吃回扣上百万元,将面临数十年监禁
  2. 试读angular源码第三章:初始化zone
  3. IDEA以UML图表方式查看maven项目pom文件中全局及部分jar之间依赖关系
  4. 北大青鸟广州天河中心S1T62班HTML项目答辩实录
  5. 当maven引用的jar在maven库中下载不到源代码
  6. virtualbox 使用
  7. java中number类型能否相除_Java中 如果复数类成员是int型,怎么实现两个复数相除...
  8. c语言10个数求立方合并输出,C语言 求出100~999之间的所有“水仙花数”并输出...
  9. “白领复工10大热销商品”榜单:口罩及相关商品位居第一
  10. 解决RD2作业在IE和Fire Fox中CSS效果不同的问题~
  11. webstrom 调试 html,【译】使用 WebStorm 调试 Nuxt.js
  12. pc用c语言控制三菱plc,上位PC机控制三菱PLC
  13. plpgsql 编译执行
  14. CodeLens 显示引用
  15. 智能车过滤阳光_阳光为这辆车加油
  16. ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.
  17. 用Python写一个走迷宫的小程序(图形化:matplotlib,dfs,prim)
  18. 实现景区门票计费系统(Java抽象类练习含GUI窗体组件)
  19. jvm 调优实战经验(结合jstat、jstack、procexp)
  20. 论文笔记:DLWL: Improving Detection for Lowshot classes with Weakly Labelled data

热门文章

  1. CSS opacity - 实现图片半透明效果
  2. 狗汪汪玩转嵌入式——I2C 协议分析
  3. 计算机二级公共基础知识易错点汇总
  4. 雷达的L、S、C、X波段是什么
  5. windbg拦截驱动加载
  6. mysql修改表只读属性_VF设置的疑问
  7. 斯蒂夫乔布斯传札记:第九波
  8. 第一课----色彩构成与色彩模式
  9. ping 查看IP——MAC——计算机名
  10. 《概率论与数理统计》(浙大第四版)第六章总结笔记(纯手写)