python爬虫爬取彼岸图网图片
python爬虫爬取彼岸图网图片
话不多说,直接上代码!
import requests
from PIL import Image
from io import BytesIO
import re
from requests.exceptions import HTTPErrorroot = "http://pic.netbian.com/index_%d.html"uni = "http://pic.netbian.com"AllPage = []AllImgHTML = []AllImgURL = []def GetPageURL(root, Start, counts):if Start == 1:AllPage.append("http://pic.netbian.com/index.html")for i in range(Start + 1, Start + counts):newURL = root.replace("%d", str(i))AllPage.append(newURL)else:for i in range(Start, Start + counts):newURL = root.replace("%d", str(i))AllPage.append(newURL)def GetImgHTML(AllPage):for PageURL in AllPage:try:res = requests.get(PageURL)res.raise_for_status()except HTTPError:print("HTTP Error!")except ConnectionError:print("Failed to connect!")with open("C:/Users/86135/Desktop/PageFile.txt", "w", encoding="ISO-8859-1") as PageFile:PageFile.write(res.text)PageFile.close()with open("C:/Users/86135/Desktop/PageFile.txt", "r", encoding="gbk") as ReadFile:str = ReadFile.read()mid = re.split("\"", str)for i in mid:ImgHTML = re.findall("^/tupian/.*.html$", i)if len(ImgHTML) != 0:AllImgHTML.append(ImgHTML[0])def GetImgURL():UsefulImgHTML = [None for i in range(len(AllImgHTML))]for i in range(len(AllImgHTML)):UsefulImgHTML[i] = uni + AllImgHTML[i]for html in UsefulImgHTML:try:htmlres = requests.get(html)htmlres.raise_for_status()except HTTPError:print("HTTP Error!")except ConnectionError:print("Failed to connect!")with open("C:/Users/86135/Desktop/ImgHTML.txt", "w", encoding="ISO-8859-1") as ImgHTML:ImgHTML.write(htmlres.text)ImgHTML.close()with open("C:/Users/86135/Desktop/ImgHTML.txt", "r", encoding="gbk") as ReadHTML:str = ReadHTML.read()mid = re.split("\"", str)for i in mid:ImgURL = re.search("^/uploads/allimg/.*.jpg$", i)if ImgURL is not None:AllImgURL.append(ImgURL[0])breakUsefulImgURL = [None for i in range(len(AllImgURL))]for i in range(len(AllImgURL)):UsefulImgURL[i] = uni + AllImgURL[i]return UsefulImgURLdef DownloadWallpaper(url, path):try:res = requests.get(url)res.raise_for_status()MyImage = Image.open(BytesIO(res.content))MyImage.save(path)print("Done...")except HTTPError:print("HTTP Error!")except ConnectionError:print("Failed to connect!")if __name__ == "__main__":GetPageURL(root, 2, 2)GetImgHTML(AllPage)UsefulImgURL = GetImgURL()num = []for i in range(len(UsefulImgURL)):num.append(i)UsefulSavePath = [None for i in range(len(UsefulImgURL))]for i in range(len(UsefulSavePath)):UsefulSavePath[i] = "C:/Users/86135/Desktop/" + str(num[i]) + ".jpg"for i in range(len(UsefulImgURL)):print(i, end=" ")DownloadWallpaper(UsefulImgURL[i], UsefulSavePath[i])print("Task completed!")
运行结果如下:
python爬虫爬取彼岸图网图片相关推荐
- 用Python爬取彼岸图网图片
用Python爬取彼岸图网图片 *使用了 四个模块 import time import requests from lxml import etree import os 没有的话自行百度安装. ...
- 初始python爬虫-爬取彼岸图单张到全部图片
初始python爬虫-爬取彼岸图单张到全部图片 1.单张图片爬取 2.一页图片 3.多页图片 彼岸图链接: https://pic.netbian.com/new/ 用到的库: import requ ...
- python爬虫图片实例-Python爬虫爬取煎蛋网图片代码实例
这篇文章主要介绍了Python爬虫爬取煎蛋网图片代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 今天,试着爬取了煎蛋网的图片. 用到的包: ...
- Python爬虫爬取煎蛋网图片代码实例
这篇文章主要介绍了Python爬虫爬取煎蛋网图片代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 今天,试着爬取了煎蛋网的图片. 用到的包: ...
- python爬图代码实例_Python爬虫爬取煎蛋网图片代码实例
这篇文章主要介绍了Python爬虫爬取煎蛋网图片代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 今天,试着爬取了煎蛋网的图片. 用到的包: ...
- [ Python ] 爬虫类库学习之 xpath,爬取彼岸图网的 小姐姐 图片
安装:pip install lxml 实例化一个etree对象 from lxml import etree 1.将本地的html文档中的源码数据加载到etree对象中 etree.parse(fi ...
- Python新手爬虫训练小项目《爬取彼岸图网》(超详细讲解版)
Python新手爬虫训练小项目<爬取彼岸图网>(超详细讲解版) 这是我的第一篇文章,作为一名新手爬虫,这个算是我这几天来的努力成果,虽然代码寥寥几行但花费了大半天,新手上路还是不能只看视频 ...
- Python网络爬虫8 - 爬取彼岸图网美图
彼岸图网收集了大量美图,是个不错的爬取对象.话不多说,直接上图. 分析站点 分类列表 爬取之前,自然要分析一波,这个站点的框架比较简单,从分类着手,共包含12个分类项. 4K人物 4K动漫 4K动物 ...
- 爬取彼岸图网4k图片
爬取彼岸图网高清美女图片 代码如下
最新文章
- 苹果新的编程语言 Swift 语言进阶(十三)--类型检查与类型嵌套
- 【面试必备】Swiftamp;nbsp;面试题及其答案
- 04.Beetl常用内置函数以及安全输出---《Beetl视频课程》
- java ftp 判断目录存在_java判断ftp目录是否存在的方法
- Java EE 6 VS Spring 3:Java EE已经杀死了Spring? 没门!
- mysql8.0.19解压版_MySQL8.0解压版配置步骤及具体流程
- 解决Eclipse Pydev中import时报错:Unresolved import
- SSD固态硬盘4K对齐一键分区
- Windows Ready Boost,使用闪存设备提高性能
- 如何将flac音频格式转换mp3格式呢
- 微型计算机主机的组成不包括______,微型计算机主机的主要组成部分是什么
- PHP发送邮件类库PHPMailer的简单使用 摘自 现代魔法研究协会
- HIVE操作自查手册(全)
- springMVC+阿里云API = 实现发送手机验证码短信
- MSRN:Multi-scale Residual Network for Image Super-Resolution 论文理解
- Unity C# 批量处理 命名空间 修改
- AtCoder Beginner Contest 203(Sponsored by Panasonic)D.Pond
- 广州积分入户需要满足哪些条件
- java循环练习题及答案_循环练习题及答案
- 台球游戏问题C++语言
热门文章
- MATLAB学习笔记:非齐次线性方程组的求解
- RabbitMQ消费者与生产者示例
- 校园IP网络广播系统方案
- 透过2W条评论看动漫《博人传-火影忍者新时代》
- 11.28 zed yolo ros 练习
- MySQL : Incorrect string value: '\xE5\x9B\xBD\xE5\xBA\x86' for column 'stu_name' at row 1
- 初中计算机公开课教学设计,初中信息技术公开课《申请电子邮箱》教案
- SpringBoot 搭建微信小程序支付(JSAPI) 纯后端
- 初级商业数字营销师钻展题库
- serverStatus详解