python代码壁纸-一个爬取壁纸的python代码

importrequestsfrom lxml importetreeimportosclassBizi(object):def __init__(self):#如果爬到一半就停止了，想从某页开始爬取就改一些下index_后面的数字改为你想爬的页码就可以了

self.url = 'http://www.netbian.com/dongman/index_2.htm'self.headers={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.61 Safari/537.36'}#获取网页数据

defGet_data(self,url):#print(url)

req = requests.get(url=url, headers=self.headers)return req.content.decode('GBK')#获取图片名字、图片页面链接、文件夹页码、下一页链接

defLink_name(self,data):

html=etree.HTML(data)

list_name= html.xpath('//*[@id="main"]/div[2]/ul/li/a/b/text()')

list_link= html.xpath('//*[@id="main"]/div[2]/ul/li/a/@href')

wname= html.xpath('//*[@id="main"]/div[3]/b/text()')

net_url1= html.xpath('//*[@id="main"]/div[3]/a[10]/@href')returnlist_name,list_link,wname,net_url1#拿取图片的链接

defTu_link(self,t_link):

req2= requests.get(url=t_link)

html2=etree.HTML(req2.text)

jpg_link= html2.xpath('//*[@id="main"]/div[2]/div/p/a/img/@src')returnjpg_link#获取图片

defTu_data(self,tu_bin):

req3= requests.get(url=tu_bin)returnreq3.contentdefrun(self):

net_url=self.url

ab= '2'

whileTrue:try:

index_data=self.Get_data(net_url)

name,link,fname,net_url=self.Link_name(index_data)#print(net_url)

net_url = 'http://www.netbian.com' +str(net_url[0])print(f"正在爬取第{ab}页")

ab= int(fname[0]) + 1

#print(name,link)

#字典化

dis =dict(zip(name,link))#循环拿到key，然后就是可以利用key拿到value

for i indis:

lb_link= self.Tu_link('http://www.netbian.com'+str(dis[i]))## print(str(lb_link[0]))

tu_bindata =self.Tu_data(str(lb_link[0]))try:

os.mkdir('第'+str(fname[0])+'页')

f= open('./第' + str(fname[0]) + '页/' + str(i) + '.jpg', 'wb')

f.write(tu_bindata)

f.close()exceptException as e:#print(e)

f = open('./第'+str(fname[0])+'页/'+str(i)+'.jpg', 'wb')

f.write(tu_bindata)

f.close()exceptException as l:#print(l)

print('这页没了哦')#break

if __name__ == '__main__':

bz=Bizi()

bz.run()

python代码壁纸-一个爬取壁纸的python代码相关推荐

python做壁纸_Python爬取壁纸
不想一张张看壁纸怎么办,不想一张张下载怎么办,来让我们用python解决一切,爬取一网站所有壁纸. 1.准备前期运行环境 ·python运行环境,安装request模块 (这个问题需要自己去解决) 2 ...
广州python平均薪资_爬取广州的python和Java薪资，为什么Python 高于Java（有代码）...
标签: 小编不知道这个是不是属于那个啥,要看的赶紧看,说不定小编的号要被封了. 用python爬取了某某某直聘网站,直聘Python和Java的招聘信息,比较了两个方向的发展前(钱)途 ,主要是本科生 ...
python爬取豆瓣电影top250的代码_Python爬虫——爬取豆瓣电影Top250代码实例
利用python爬取豆瓣电影Top250的相关信息,包括电影详情链接,图片链接,影片中文名,影片外国名,评分,评价数,概况,导演,主演,年份,地区,类别这12项内容,然后将爬取的信息写入Excel表中 ...
Python爬虫学习笔记 -- 爬取糗事百科
Python爬虫学习笔记 -- 爬取糗事百科代码存放地址: https://github.com/xyls2011/python/tree/master/qiushibaike 爬取网址:https ...
Python爬虫---影评的爬取
Python爬虫-影评的爬取介绍:爬虫练手,使用Requests库进行豆瓣影评的爬虫,做成词云图,写文章主要做一些问题解决的记录. 运行环境:python 3.8, Pycharm 关于在豆瓣爬取影 ...
Python零基础之爬取王者荣耀官方网站高清壁纸(普通版)
Python零基础之爬取王者荣耀官方网站高清壁纸目标: 分析过程: 1. 确定目标url 2. 解决url解析问题 3. 图片下载解析 4. 多页面的处理代码示例需要注意的问题: 目标: 1.下 ...
python壁纸数据抓取_python 多线程爬取壁纸网站的示例
基本开发环境・ Python 3.6 ・ Pycharm 需要导入的库目标网页分析网站是静态网站,没有加密,可以直接爬取整体思路: 1.先在列表页面获取每张壁纸的详情页地址 2.在壁纸详情页面 ...
【python日常学习】爬取4K桌面壁纸
[python日常学习]爬取4K桌面壁纸这个网站都是4K的桌面壁纸. 不多说,直接上代码 import re import requests import osdef get_page():page ...
scrapy 爬取壁纸
1.创建项目 scrapy startproject bizhi 2.创建爬虫 scrapy genspider bizhispider www.netbian.com 要爬取的壁纸网站网址域名ww ...

python代码壁纸-一个爬取壁纸的python代码

python代码壁纸-一个爬取壁纸的python代码相关推荐

最新文章

热门文章