用Python爬取彼岸图网图片
用Python爬取彼岸图网图片
*使用了 四个模块
import time
import requests
from lxml import etree
import os
没有的话自行百度安装。
#encoding = utf-8
import time
import requests
from lxml import etree
import os# http://www.netbian.com/ 爬虫
if __name__ == '__main__':filePath = './保存图片'if not os.path.exists(filePath):os.mkdir(filePath)page_next = 'http://www.netbian.com/dongman/index.htm' #第一页header = { #UA伪装"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.128 Safari/537.36 Edg/89.0.774.77"}for _ in range(1,133):page_text = requests.get(url=page_next, headers=header)page_text.encoding = 'gbk'tree = etree.HTML(page_text.text)li_list = tree.xpath('//div[@class="list"]//li')_next = tree.xpath('//div[@class="page"]/a[@class="prev"]/@href')if len(_next) == 1:page_next = 'http://www.netbian.com/' + _next[0]else:page_next = 'http://www.netbian.com/' + _next[1]for _ in li_list:time.sleep(0.3)href = _.xpath('./a/@href')if href != []:href = href[0]else :continueif href == 'https://pic.netbian.com/': #广告continuepage_url = 'http://www.netbian.com/' + hreftitle = _.xpath('./a/img/@alt')[0]spanIndex = title.find(' ',0,len(title)) #空格位置title = filePath + '/' + title[0:spanIndex] + '.jpg'img_page = requests.get(url=page_url, headers=header)_tree = etree.HTML(img_page.text)img_url = _tree.xpath('//div[@class="pic"]//a/img/@src')[0]try:img_file = requests.get(img_url, headers=header, stream=True)if img_file != None:with open(title, 'wb') as f:f.write(img_file.content)print(title + '下载成功')except:print('异常咯,不用管')print('Over 全部下载完成')
用Python爬取彼岸图网图片相关推荐
- python爬虫爬取彼岸图网图片
python爬虫爬取彼岸图网图片 话不多说,直接上代码! import requests from PIL import Image from io import BytesIO import re ...
- python爬取千图网图片并保存_Python数据分析与挖掘实战-课程作业5爬取千图网某个频道的高清图片...
作业要求:爬取千图网(http://www.58pic.com)某个频道的高清图片 作业难点:正确找到图片链接并用正则表达式写出 代码如下: """ Created on ...
- Python爬取彼岸图网10万张高清图片(入门级爬虫)_一蓑烟雨任平生
来张爬取的美女镇楼 先上代码,再给你讲解 import re import requests import os import easygui(min, max) = easygui.multente ...
- python爬取千图网图片(出现HTTP Error 403怎么解决)
刚开始: 问题: 后来: 到底是要怎么改呢????? 转载于:https://www.cnblogs.com/gongzixi/p/10345119.html
- Python爬取彼岸图4k壁纸,想要什么类型的壁纸就输入什么壁纸,太方便了。
你桌面的壁纸还是用的默认壁纸么?太low了,今天教你用python爬取彼岸图网的4k壁纸,想要什么类型的壁纸就爬什么壁纸,快点来跟我一起试试吧! 这个壁纸怎么样?喜欢吗?你值得拥有... 代码操作一下 ...
- [ Python ] 爬虫类库学习之 xpath,爬取彼岸图网的 小姐姐 图片
安装:pip install lxml 实例化一个etree对象 from lxml import etree 1.将本地的html文档中的源码数据加载到etree对象中 etree.parse(fi ...
- Python新手爬虫训练小项目《爬取彼岸图网》(超详细讲解版)
Python新手爬虫训练小项目<爬取彼岸图网>(超详细讲解版) 这是我的第一篇文章,作为一名新手爬虫,这个算是我这几天来的努力成果,虽然代码寥寥几行但花费了大半天,新手上路还是不能只看视频 ...
- Python网络爬虫8 - 爬取彼岸图网美图
彼岸图网收集了大量美图,是个不错的爬取对象.话不多说,直接上图. 分析站点 分类列表 爬取之前,自然要分析一波,这个站点的框架比较简单,从分类着手,共包含12个分类项. 4K人物 4K动漫 4K动物 ...
- 使用python爬取斗图网的图片
使用python爬取斗图网的图片 以下是代码部分: # -*- coding: utf-8 -*- """ Created on Wed Apr 14 14:41:42 ...
最新文章
- Delphi - 我的代码之窗体移动
- java中字符流 字节流_理解Java中字符流与字节流的区别
- PHP设计模式(6)迭代器模式
- 我们为什么这样选择损失函数
- r语言 悲观剪枝_《R语言编程—基于tidyverse》新书信息汇总
- Javascript基础--对象
- c# define 类似_c#跟c++的相似之处
- linux用户管理命令(添加,删除,修改)
- 简单迅速解决windows电脑下载windows应用商店(Microsoft Store)
- Python str方法
- 路由器当做交换机使用
- ch9200 usb网卡驱动_21包邮的PCMCIA无线网卡开箱+对比测评
- C语言实现二叉平衡树
- [BZOJ4430][Nwerc2015]Guessing Camels赌骆驼
- 2012最新网络电台mms地址
- GitHub 值得收藏的前端项目
- 实用主义 | 如何定制化群发你的微信消息
- 量化资源--awesome quant中文版发布
- 初中信息技术计算机的发展,中小学信息技术教材的现状与发展趋势
- VLDB 2023 | 北大河图发布分布式训练神器Galvatron,一键实现大模型高效自动并行...
热门文章
- 3dMax 基础概念和基本操作
- g30u盘启动 中科曙光1620_曙光I620-G20服务器安装windowsserver2008r2方法
- 华为1+X网络系统建设与运维(中级)——VRRP
- 6 种 MySQL 数据库平滑扩容方案剖析
- windows通过双网卡双网络(本地网卡和无线网卡双网络同时工作)
- UL1017是什么标准?吸尘器UL1017报告
- 值得一生去看的21个演讲,8部经典励志电影,12部大师纪实片,60部纪录片
- 博客园美化教程大集合----极致个性化你的专属博客(超详细,看这篇就够了)...
- MIPI D-PHYv2.5笔记(1) -- DPHY概览
- 小米电视3分体主机改独立供电教程