importrequestsfrom lxml importetreeimportosclassBizi(object):def __init__(self):#如果爬到一半就停止了,想从某页开始爬取就改一些下index_后面的数字改为你想爬的页码就可以了

self.url = 'http://www.netbian.com/dongman/index_2.htm'self.headers={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.61 Safari/537.36'}#获取网页数据

defGet_data(self,url):#print(url)

req = requests.get(url=url, headers=self.headers)return req.content.decode('GBK')#获取图片名字、图片页面链接、文件夹页码、下一页链接

defLink_name(self,data):

html=etree.HTML(data)

list_name= html.xpath('//*[@id="main"]/div[2]/ul/li/a/b/text()')

list_link= html.xpath('//*[@id="main"]/div[2]/ul/li/a/@href')

wname= html.xpath('//*[@id="main"]/div[3]/b/text()')

net_url1= html.xpath('//*[@id="main"]/div[3]/a[10]/@href')returnlist_name,list_link,wname,net_url1#拿取图片的链接

defTu_link(self,t_link):

req2= requests.get(url=t_link)

html2=etree.HTML(req2.text)

jpg_link= html2.xpath('//*[@id="main"]/div[2]/div/p/a/img/@src')returnjpg_link#获取图片

defTu_data(self,tu_bin):

req3= requests.get(url=tu_bin)returnreq3.contentdefrun(self):

net_url=self.url

ab= '2'

whileTrue:try:

index_data=self.Get_data(net_url)

name,link,fname,net_url=self.Link_name(index_data)#print(net_url)

net_url = 'http://www.netbian.com' +str(net_url[0])print(f"正在爬取第{ab}页")

ab= int(fname[0]) + 1

#print(name,link)

#字典化

dis =dict(zip(name,link))#循环拿到key,然后就是可以利用key拿到value

for i indis:

lb_link= self.Tu_link('http://www.netbian.com'+str(dis[i]))## print(str(lb_link[0]))

tu_bindata =self.Tu_data(str(lb_link[0]))try:

os.mkdir('第'+str(fname[0])+'页')

f= open('./第' + str(fname[0]) + '页/' + str(i) + '.jpg', 'wb')

f.write(tu_bindata)

f.close()exceptException as e:#print(e)

f = open('./第'+str(fname[0])+'页/'+str(i)+'.jpg', 'wb')

f.write(tu_bindata)

f.close()exceptException as l:#print(l)

print('这页没了哦')#break

if __name__ == '__main__':

bz=Bizi()

bz.run()

python代码壁纸-一个爬取壁纸的python代码相关推荐

  1. python做壁纸_Python爬取壁纸

    不想一张张看壁纸怎么办,不想一张张下载怎么办,来让我们用python解决一切,爬取一网站所有壁纸. 1.准备前期运行环境 ·python运行环境,安装request模块 (这个问题需要自己去解决) 2 ...

  2. 广州python平均薪资_爬取广州的python和Java薪资,为什么Python 高于Java(有代码)...

    标签: 小编不知道这个是不是属于那个啥,要看的赶紧看,说不定小编的号要被封了. 用python爬取了某某某直聘网站,直聘Python和Java的招聘信息,比较了两个方向的发展前(钱)途 ,主要是本科生 ...

  3. python爬取豆瓣电影top250的代码_Python爬虫——爬取豆瓣电影Top250代码实例

    利用python爬取豆瓣电影Top250的相关信息,包括电影详情链接,图片链接,影片中文名,影片外国名,评分,评价数,概况,导演,主演,年份,地区,类别这12项内容,然后将爬取的信息写入Excel表中 ...

  4. Python爬虫学习笔记 -- 爬取糗事百科

    Python爬虫学习笔记 -- 爬取糗事百科 代码存放地址: https://github.com/xyls2011/python/tree/master/qiushibaike 爬取网址:https ...

  5. Python爬虫---影评的爬取

    Python爬虫-影评的爬取 介绍:爬虫练手,使用Requests库进行豆瓣影评的爬虫,做成词云图,写文章主要做一些问题解决的记录. 运行环境:python 3.8, Pycharm 关于在豆瓣爬取影 ...

  6. Python零基础之爬取王者荣耀官方网站高清壁纸(普通版)

    Python零基础之爬取王者荣耀官方网站高清壁纸 目标: 分析过程: 1. 确定目标url 2. 解决url解析问题 3. 图片下载解析 4. 多页面的处理 代码示例 需要注意的问题: 目标: 1.下 ...

  7. python壁纸数据抓取_python 多线程爬取壁纸网站的示例

    基本开发环境 ・ Python 3.6 ・ Pycharm 需要导入的库 目标网页分析 网站是静态网站,没有加密,可以直接爬取 整体思路: 1.先在列表页面获取每张壁纸的详情页地址 2.在壁纸详情页面 ...

  8. 【python日常学习】爬取4K桌面壁纸

    [python日常学习]爬取4K桌面壁纸 这个网站都是4K的桌面壁纸. 不多说,直接上代码 import re import requests import osdef get_page():page ...

  9. scrapy 爬取壁纸

    1.创建项目 scrapy startproject bizhi 2.创建爬虫 scrapy genspider bizhispider www.netbian.com 要爬取的壁纸网站 网址域名ww ...

最新文章

  1. Python中的iteritems()和items()
  2. 李名洋(1983-),男,中国电信股份有限公司云计算分公司数据分析师。
  3. java代码god类_java – 如何编写Controller而不将其作为God对象?
  4. c++代码表白_微信表情翻译成文字代码,微信表情翻译我喜欢你[多图]-软件资讯...
  5. python中pandas计数_python – Pandas:根据条件计数进行分组
  6. FFmpeg源代码简单分析:avformat_write_header()
  7. stm32f4 自旋锁_STM32L0系列控制器低功耗模式详解
  8. 用matlab画x 的定积分图像,matlab图像定积分
  9. cad填充图案乱理石_cad采矿制图时遇到问题的完美解决方法
  10. 2025年单车平均搭载7-8颗!车载摄像头进入「前装」红利期
  11. 移动硬盘格式化了,要怎么恢复数据
  12. Epicor10自定义更新
  13. 《Java解惑》系列——01表达式之谜——谜题09:半斤
  14. 【JS】跨域问题读写cookie的解决办法
  15. 初识html及工具的使用
  16. LaTeX插入大尺寸JPG图片出现纵横比异常水平被压缩的解决方法
  17. 不借助 matlab 内置函数,生撸均值方差模型
  18. QQ邮箱模拟登陆(2022.9.12)
  19. 什么是计算机网络(世俗理解)
  20. 12.24魔术VS凯尔特人在线直播视频

热门文章

  1. python写文件无法换行的问题
  2. 用vc++如何得到汉字的Unicode编码?
  3. [SHOI2015]自动刷题机
  4. C++编程基础一 01-我的第一个项目
  5. Educational Codeforces Round 2 B. Queries about less or equal elements
  6. SQL语句在数据库中是如何执行的
  7. 计算机中数据的编码方式
  8. Qt+MinGW+OpenCV开发环境在win7系统下的搭建(最新20140423)
  9. 计算机操作系统基础知识-2
  10. zabbix-server启动报错解决