python代码壁纸-一个爬取壁纸的python代码
importrequestsfrom lxml importetreeimportosclassBizi(object):def __init__(self):#如果爬到一半就停止了,想从某页开始爬取就改一些下index_后面的数字改为你想爬的页码就可以了
self.url = 'http://www.netbian.com/dongman/index_2.htm'self.headers={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.61 Safari/537.36'}#获取网页数据
defGet_data(self,url):#print(url)
req = requests.get(url=url, headers=self.headers)return req.content.decode('GBK')#获取图片名字、图片页面链接、文件夹页码、下一页链接
defLink_name(self,data):
html=etree.HTML(data)
list_name= html.xpath('//*[@id="main"]/div[2]/ul/li/a/b/text()')
list_link= html.xpath('//*[@id="main"]/div[2]/ul/li/a/@href')
wname= html.xpath('//*[@id="main"]/div[3]/b/text()')
net_url1= html.xpath('//*[@id="main"]/div[3]/a[10]/@href')returnlist_name,list_link,wname,net_url1#拿取图片的链接
defTu_link(self,t_link):
req2= requests.get(url=t_link)
html2=etree.HTML(req2.text)
jpg_link= html2.xpath('//*[@id="main"]/div[2]/div/p/a/img/@src')returnjpg_link#获取图片
defTu_data(self,tu_bin):
req3= requests.get(url=tu_bin)returnreq3.contentdefrun(self):
net_url=self.url
ab= '2'
whileTrue:try:
index_data=self.Get_data(net_url)
name,link,fname,net_url=self.Link_name(index_data)#print(net_url)
net_url = 'http://www.netbian.com' +str(net_url[0])print(f"正在爬取第{ab}页")
ab= int(fname[0]) + 1
#print(name,link)
#字典化
dis =dict(zip(name,link))#循环拿到key,然后就是可以利用key拿到value
for i indis:
lb_link= self.Tu_link('http://www.netbian.com'+str(dis[i]))## print(str(lb_link[0]))
tu_bindata =self.Tu_data(str(lb_link[0]))try:
os.mkdir('第'+str(fname[0])+'页')
f= open('./第' + str(fname[0]) + '页/' + str(i) + '.jpg', 'wb')
f.write(tu_bindata)
f.close()exceptException as e:#print(e)
f = open('./第'+str(fname[0])+'页/'+str(i)+'.jpg', 'wb')
f.write(tu_bindata)
f.close()exceptException as l:#print(l)
print('这页没了哦')#break
if __name__ == '__main__':
bz=Bizi()
bz.run()
python代码壁纸-一个爬取壁纸的python代码相关推荐
- python做壁纸_Python爬取壁纸
不想一张张看壁纸怎么办,不想一张张下载怎么办,来让我们用python解决一切,爬取一网站所有壁纸. 1.准备前期运行环境 ·python运行环境,安装request模块 (这个问题需要自己去解决) 2 ...
- 广州python平均薪资_爬取广州的python和Java薪资,为什么Python 高于Java(有代码)...
标签: 小编不知道这个是不是属于那个啥,要看的赶紧看,说不定小编的号要被封了. 用python爬取了某某某直聘网站,直聘Python和Java的招聘信息,比较了两个方向的发展前(钱)途 ,主要是本科生 ...
- python爬取豆瓣电影top250的代码_Python爬虫——爬取豆瓣电影Top250代码实例
利用python爬取豆瓣电影Top250的相关信息,包括电影详情链接,图片链接,影片中文名,影片外国名,评分,评价数,概况,导演,主演,年份,地区,类别这12项内容,然后将爬取的信息写入Excel表中 ...
- Python爬虫学习笔记 -- 爬取糗事百科
Python爬虫学习笔记 -- 爬取糗事百科 代码存放地址: https://github.com/xyls2011/python/tree/master/qiushibaike 爬取网址:https ...
- Python爬虫---影评的爬取
Python爬虫-影评的爬取 介绍:爬虫练手,使用Requests库进行豆瓣影评的爬虫,做成词云图,写文章主要做一些问题解决的记录. 运行环境:python 3.8, Pycharm 关于在豆瓣爬取影 ...
- Python零基础之爬取王者荣耀官方网站高清壁纸(普通版)
Python零基础之爬取王者荣耀官方网站高清壁纸 目标: 分析过程: 1. 确定目标url 2. 解决url解析问题 3. 图片下载解析 4. 多页面的处理 代码示例 需要注意的问题: 目标: 1.下 ...
- python壁纸数据抓取_python 多线程爬取壁纸网站的示例
基本开发环境 ・ Python 3.6 ・ Pycharm 需要导入的库 目标网页分析 网站是静态网站,没有加密,可以直接爬取 整体思路: 1.先在列表页面获取每张壁纸的详情页地址 2.在壁纸详情页面 ...
- 【python日常学习】爬取4K桌面壁纸
[python日常学习]爬取4K桌面壁纸 这个网站都是4K的桌面壁纸. 不多说,直接上代码 import re import requests import osdef get_page():page ...
- scrapy 爬取壁纸
1.创建项目 scrapy startproject bizhi 2.创建爬虫 scrapy genspider bizhispider www.netbian.com 要爬取的壁纸网站 网址域名ww ...
最新文章
- Python中的iteritems()和items()
- 李名洋(1983-),男,中国电信股份有限公司云计算分公司数据分析师。
- java代码god类_java – 如何编写Controller而不将其作为God对象?
- c++代码表白_微信表情翻译成文字代码,微信表情翻译我喜欢你[多图]-软件资讯...
- python中pandas计数_python – Pandas:根据条件计数进行分组
- FFmpeg源代码简单分析:avformat_write_header()
- stm32f4 自旋锁_STM32L0系列控制器低功耗模式详解
- 用matlab画x 的定积分图像,matlab图像定积分
- cad填充图案乱理石_cad采矿制图时遇到问题的完美解决方法
- 2025年单车平均搭载7-8颗!车载摄像头进入「前装」红利期
- 移动硬盘格式化了,要怎么恢复数据
- Epicor10自定义更新
- 《Java解惑》系列——01表达式之谜——谜题09:半斤
- 【JS】跨域问题读写cookie的解决办法
- 初识html及工具的使用
- LaTeX插入大尺寸JPG图片出现纵横比异常水平被压缩的解决方法
- 不借助 matlab 内置函数,生撸均值方差模型
- QQ邮箱模拟登陆(2022.9.12)
- 什么是计算机网络(世俗理解)
- 12.24魔术VS凯尔特人在线直播视频
热门文章
- python写文件无法换行的问题
- 用vc++如何得到汉字的Unicode编码?
- [SHOI2015]自动刷题机
- C++编程基础一 01-我的第一个项目
- Educational Codeforces Round 2 B. Queries about less or equal elements
- SQL语句在数据库中是如何执行的
- 计算机中数据的编码方式
- Qt+MinGW+OpenCV开发环境在win7系统下的搭建(最新20140423)
- 计算机操作系统基础知识-2
- zabbix-server启动报错解决