python爬虫爬取彼岸图网图片

话不多说,直接上代码!

import requests
from PIL import Image
from io import BytesIO
import re
from requests.exceptions import HTTPErrorroot = "http://pic.netbian.com/index_%d.html"uni = "http://pic.netbian.com"AllPage = []AllImgHTML = []AllImgURL = []def GetPageURL(root, Start, counts):if Start == 1:AllPage.append("http://pic.netbian.com/index.html")for i in range(Start + 1, Start + counts):newURL = root.replace("%d", str(i))AllPage.append(newURL)else:for i in range(Start, Start + counts):newURL = root.replace("%d", str(i))AllPage.append(newURL)def GetImgHTML(AllPage):for PageURL in AllPage:try:res = requests.get(PageURL)res.raise_for_status()except HTTPError:print("HTTP Error!")except ConnectionError:print("Failed to connect!")with open("C:/Users/86135/Desktop/PageFile.txt", "w", encoding="ISO-8859-1") as PageFile:PageFile.write(res.text)PageFile.close()with open("C:/Users/86135/Desktop/PageFile.txt", "r", encoding="gbk") as ReadFile:str = ReadFile.read()mid = re.split("\"", str)for i in mid:ImgHTML = re.findall("^/tupian/.*.html$", i)if len(ImgHTML) != 0:AllImgHTML.append(ImgHTML[0])def GetImgURL():UsefulImgHTML = [None for i in range(len(AllImgHTML))]for i in range(len(AllImgHTML)):UsefulImgHTML[i] = uni + AllImgHTML[i]for html in UsefulImgHTML:try:htmlres = requests.get(html)htmlres.raise_for_status()except HTTPError:print("HTTP Error!")except ConnectionError:print("Failed to connect!")with open("C:/Users/86135/Desktop/ImgHTML.txt", "w", encoding="ISO-8859-1") as ImgHTML:ImgHTML.write(htmlres.text)ImgHTML.close()with open("C:/Users/86135/Desktop/ImgHTML.txt", "r", encoding="gbk") as ReadHTML:str = ReadHTML.read()mid = re.split("\"", str)for i in mid:ImgURL = re.search("^/uploads/allimg/.*.jpg$", i)if ImgURL is not None:AllImgURL.append(ImgURL[0])breakUsefulImgURL = [None for i in range(len(AllImgURL))]for i in range(len(AllImgURL)):UsefulImgURL[i] = uni + AllImgURL[i]return UsefulImgURLdef DownloadWallpaper(url, path):try:res = requests.get(url)res.raise_for_status()MyImage = Image.open(BytesIO(res.content))MyImage.save(path)print("Done...")except HTTPError:print("HTTP Error!")except ConnectionError:print("Failed to connect!")if __name__ == "__main__":GetPageURL(root, 2, 2)GetImgHTML(AllPage)UsefulImgURL = GetImgURL()num = []for i in range(len(UsefulImgURL)):num.append(i)UsefulSavePath = [None for i in range(len(UsefulImgURL))]for i in range(len(UsefulSavePath)):UsefulSavePath[i] = "C:/Users/86135/Desktop/" + str(num[i]) + ".jpg"for i in range(len(UsefulImgURL)):print(i, end=" ")DownloadWallpaper(UsefulImgURL[i], UsefulSavePath[i])print("Task completed!")

运行结果如下:

python爬虫爬取彼岸图网图片相关推荐

  1. 用Python爬取彼岸图网图片

     用Python爬取彼岸图网图片 *使用了  四个模块 import time import requests from lxml import etree import os 没有的话自行百度安装. ...

  2. 初始python爬虫-爬取彼岸图单张到全部图片

    初始python爬虫-爬取彼岸图单张到全部图片 1.单张图片爬取 2.一页图片 3.多页图片 彼岸图链接: https://pic.netbian.com/new/ 用到的库: import requ ...

  3. python爬虫图片实例-Python爬虫爬取煎蛋网图片代码实例

    这篇文章主要介绍了Python爬虫爬取煎蛋网图片代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 今天,试着爬取了煎蛋网的图片. 用到的包: ...

  4. Python爬虫爬取煎蛋网图片代码实例

    这篇文章主要介绍了Python爬虫爬取煎蛋网图片代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 今天,试着爬取了煎蛋网的图片. 用到的包: ...

  5. python爬图代码实例_Python爬虫爬取煎蛋网图片代码实例

    这篇文章主要介绍了Python爬虫爬取煎蛋网图片代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 今天,试着爬取了煎蛋网的图片. 用到的包: ...

  6. [ Python ] 爬虫类库学习之 xpath,爬取彼岸图网的 小姐姐 图片

    安装:pip install lxml 实例化一个etree对象 from lxml import etree 1.将本地的html文档中的源码数据加载到etree对象中 etree.parse(fi ...

  7. Python新手爬虫训练小项目《爬取彼岸图网》(超详细讲解版)

    Python新手爬虫训练小项目<爬取彼岸图网>(超详细讲解版) 这是我的第一篇文章,作为一名新手爬虫,这个算是我这几天来的努力成果,虽然代码寥寥几行但花费了大半天,新手上路还是不能只看视频 ...

  8. Python网络爬虫8 - 爬取彼岸图网美图

    彼岸图网收集了大量美图,是个不错的爬取对象.话不多说,直接上图. 分析站点 分类列表 爬取之前,自然要分析一波,这个站点的框架比较简单,从分类着手,共包含12个分类项. 4K人物 4K动漫 4K动物 ...

  9. 爬取彼岸图网4k图片

    爬取彼岸图网高清美女图片 代码如下

最新文章

  1. 苹果新的编程语言 Swift 语言进阶(十三)--类型检查与类型嵌套
  2. 【面试必备】Swiftamp;nbsp;面试题及其答案
  3. 04.Beetl常用内置函数以及安全输出---《Beetl视频课程》
  4. java ftp 判断目录存在_java判断ftp目录是否存在的方法
  5. Java EE 6 VS Spring 3:Java EE已经杀死了Spring? 没门!
  6. mysql8.0.19解压版_MySQL8.0解压版配置步骤及具体流程
  7. 解决Eclipse Pydev中import时报错:Unresolved import
  8. SSD固态硬盘4K对齐一键分区
  9. Windows Ready Boost,使用闪存设备提高性能
  10. 如何将flac音频格式转换mp3格式呢
  11. 微型计算机主机的组成不包括______,微型计算机主机的主要组成部分是什么
  12. PHP发送邮件类库PHPMailer的简单使用 摘自 现代魔法研究协会
  13. HIVE操作自查手册(全)
  14. springMVC+阿里云API = 实现发送手机验证码短信
  15. MSRN:Multi-scale Residual Network for Image Super-Resolution 论文理解
  16. Unity C# 批量处理 命名空间 修改
  17. AtCoder Beginner Contest 203(Sponsored by Panasonic)D.Pond
  18. 广州积分入户需要满足哪些条件
  19. java循环练习题及答案_循环练习题及答案
  20. 台球游戏问题C++语言

热门文章

  1. MATLAB学习笔记:非齐次线性方程组的求解
  2. RabbitMQ消费者与生产者示例
  3. 校园IP网络广播系统方案
  4. 透过2W条评论看动漫《博人传-火影忍者新时代》
  5. 11.28 zed yolo ros 练习
  6. MySQL : Incorrect string value: '\xE5\x9B\xBD\xE5\xBA\x86' for column 'stu_name' at row 1
  7. 初中计算机公开课教学设计,初中信息技术公开课《申请电子邮箱》教案
  8. SpringBoot 搭建微信小程序支付(JSAPI) 纯后端
  9. 初级商业数字营销师钻展题库
  10. serverStatus详解