python网易云收费_python网易云音乐抓取

importthreadingfrom selenium importwebdriverfrom collections importdeque

songList=set([]);

playList=set([]);#歌单

defchrome_browser_songList(url,browser):

browser.get(url)

play_count= browser.find_element_by_id('play-count').textif(int(play_count)>10000):

data='\n'+browser.find_element_by_class_name('f-ff2').text+'评论数：'+str(play_count)+'地址：'+url

save_file(data,'D:\\songList.txt')

songQueue=deque()try:#a[href^=\/song]

for each in browser.find_elements_by_css_selector('a[href^=\/song]'):try:print("歌曲名字： %s 地址 %s" % (each.text, each.get_property('href')))

songQueue.append(each.get_property('href'))except:continue

except:print('someerror')

song_queue(songQueue,browser)#寻找歌单

playListQueue =deque()try:for each in browser.find_elements_by_css_selector('a[href^=\/playlist]'):try:print("歌单： %s 地址 %s" % (each.text, each.get_property('href')))

playListQueue.append(each.get_property('href'))except:continue

except:print('someerror')

browser.close()

browser= webdriver.Chrome('C:\Program Files\Google\Chrome\Application\chromedriver.exe')

play_list_queue(playListQueue,browser)#browser.close()#歌曲

defchrome_browser_song(url):

browser= webdriver.Chrome('C:\Program Files\Google\Chrome\Application\chromedriver.exe')

browser.get(url)

browser.switch_to_frame('g_iframe')

comment_count= browser.find_element_by_id('cnt_comment_count').textif(int(comment_count)>10000):

data= '\n歌曲名字:'+browser.find_element_by_class_name('f-ff2').text+'歌手：'+browser.find_element_by_css_selector('a[href^=\/artist]').text+'评论数:'+comment_count+'歌曲地址:' +url;

save_file(data,'D:\\song.txt')

browser.close()#保存文件

defsave_file(data,file):

save_path=file

f_obj= open(save_path, 'a')

f_obj.write(data)

f_obj.close()#歌队列

defsong_queue(songQueue,browser):whilesongQueue:

current_url=songQueue.popleft()if current_url not insongList:

songList.add(current_url)try:

chrome_browser_song(current_url)except:continue

#歌单队列

defplay_list_queue(listQueue,browser):whilelistQueue:

current_url=listQueue.popleft()if current_url not inplayList:

playList.add(current_url)try:

chrome_browser_songList(current_url,browser)except:continueurl_list=['http://music.163.com/playlist?id=598057191','http://music.163.com/#/playlist?id=144236857',

]defthread_1():

url=url_list[0]

browser= webdriver.Chrome('C:\Program Files\Google\Chrome\Application\chromedriver.exe')

chrome_browser_songList(url, browser)defthread_2():

url= url_list[1]

browser= webdriver.Chrome('C:\Program Files\Google\Chrome\Application\chromedriver.exe')

chrome_browser_songList(url, browser)#多线程

defthread_song():

threads=[]

t1= threading.Thread(target=thread_1)

threads.append(t1)

t2= threading.Thread(target=thread_2)

threads.append(t2)returnthreadsif __name__ == '__main__':#url = url_list[1]

#browser = webdriver.Chrome('C:\Program Files\Google\Chrome\Application\chromedriver.exe')

#chrome_browser_songList(url, browser)

threads =thread_song()for t inthreads:

t.setDaemon(True)

t.start()

t.join()

python网易云收费_python网易云音乐抓取相关推荐

python和人工智能爬虫_Python 演示人工智能爬虫抓取新浪微博数据
时间:2019-04-10 概述:搜索爬虫人工智能一个Python 人工智能爬虫演示,本代码演示抓取新浪微博数据,若正在采集新浪微博数据,如需取消请按CTRL+C 退出程序. #!/usr/bin ...
尹成python爬虫百度云_Python爬虫实战：抓取并保存百度云资源
寻找并分析百度云的转存api 首先你得有一个百度云盘的账号,然后登录,用浏览器(这里用火狐浏览器做示范)打开一个分享链接.F12打开控制台进行抓包.手动进行转存操作:全选文件->保存到网盘-&g ...
python爬虫提取教学_python爬虫的基本抓取
1.创建一个爬虫项目在项目中新建middlewares.py文件(./项目名/middlewares.py) 2.使用代理服务器采集大量数据时,最好使用代理.防止IP被封,下载次数受限等. # 代 ...
小猪的Python学习之旅 —— 14.项目实战：抓取豆瓣音乐Top 250数据存到Excel中
小猪的Python学习之旅 -- 14.项目实战:抓取豆瓣音乐Top 250数据存到Excel中标签:Python 一句话概括本文: 利用Excel存储爬到的抓取豆瓣音乐Top 250数据信息,还有 ...
python的web抓取_python实现从web抓取文档的方法
本文实例讲述了Python实现从Web的一个URL中抓取文档的方法,分享给大家供大家参考.具体方法分析如下: 实例代码如下: import urllib doc = urllib.urlopen(&q ...
python爬虫怎么爬同一个网站的多页数据-如何用Python爬数据？（一）网页抓取
如何用Python爬数据?(一)网页抓取你期待已久的Python网络数据爬虫教程来了.本文为你演示如何从网页里找到感兴趣的链接和说明文字,抓取并存储到Excel. 需求我在公众号后台,经常可以收到 ...
Python 3.X 要使用urllib.request 来抓取网络资源。转
Python 3.X 要使用urllib.request 来抓取网络资源. 最简单的方式: #coding=utf-8 import urllib.request response = urllib. ...
python爬网站数据实例-如何用Python爬数据？（一）网页抓取
如何用Python爬数据?(一)网页抓取你期待已久的Python网络数据爬虫教程来了.本文为你演示如何从网页里找到感兴趣的链接和说明文字,抓取并存储到Excel. 需求我在公众号后台,经常可以收到 ...
python 爬虫网易云音乐抓取
网络中音乐的爬取对于爬虫来说不是vip大部分是url拼接就能得到,抓取中不同的一个首页中url中详情页中网页结构不同提取方式也有所不同-直接上代码 import requests from bs4 ...
python3爬取网易云歌单数据清洗_网页抓取网易云音乐及评论数据分析
网页抓取网易云音乐及评论数据分析游贤成都理工大学信息科学与技术学院 [摘要] 摘要:为了分析网易云音乐中哪些歌曲是热门歌曲,哪些歌曲的评论最多,从而了解到人们对于不同音乐类型的喜爱程度,采用成 ...

python网易云收费_python网易云音乐抓取

python网易云收费_python网易云音乐抓取相关推荐

最新文章

热门文章