用Python爬取彼岸图网图片

*使用了  四个模块
import time
import requests
from lxml import etree
import os

没有的话自行百度安装。

#encoding = utf-8
import time
import requests
from lxml import etree
import os# http://www.netbian.com/ 爬虫
if __name__ == '__main__':filePath = './保存图片'if not os.path.exists(filePath):os.mkdir(filePath)page_next = 'http://www.netbian.com/dongman/index.htm' #第一页header = { #UA伪装"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.128 Safari/537.36 Edg/89.0.774.77"}for _ in range(1,133):page_text = requests.get(url=page_next, headers=header)page_text.encoding = 'gbk'tree = etree.HTML(page_text.text)li_list = tree.xpath('//div[@class="list"]//li')_next = tree.xpath('//div[@class="page"]/a[@class="prev"]/@href')if len(_next) == 1:page_next = 'http://www.netbian.com/' + _next[0]else:page_next = 'http://www.netbian.com/' + _next[1]for _ in li_list:time.sleep(0.3)href = _.xpath('./a/@href')if href != []:href = href[0]else :continueif href == 'https://pic.netbian.com/': #广告continuepage_url = 'http://www.netbian.com/' + hreftitle = _.xpath('./a/img/@alt')[0]spanIndex = title.find(' ',0,len(title)) #空格位置title = filePath + '/' + title[0:spanIndex] + '.jpg'img_page = requests.get(url=page_url, headers=header)_tree = etree.HTML(img_page.text)img_url = _tree.xpath('//div[@class="pic"]//a/img/@src')[0]try:img_file = requests.get(img_url, headers=header, stream=True)if img_file != None:with open(title, 'wb') as f:f.write(img_file.content)print(title + '下载成功')except:print('异常咯,不用管')print('Over 全部下载完成')

用Python爬取彼岸图网图片相关推荐

  1. python爬虫爬取彼岸图网图片

    python爬虫爬取彼岸图网图片 话不多说,直接上代码! import requests from PIL import Image from io import BytesIO import re ...

  2. python爬取千图网图片并保存_Python数据分析与挖掘实战-课程作业5爬取千图网某个频道的高清图片...

    作业要求:爬取千图网(http://www.58pic.com)某个频道的高清图片 作业难点:正确找到图片链接并用正则表达式写出 代码如下: """ Created on ...

  3. Python爬取彼岸图网10万张高清图片(入门级爬虫)_一蓑烟雨任平生

    来张爬取的美女镇楼 先上代码,再给你讲解 import re import requests import os import easygui(min, max) = easygui.multente ...

  4. python爬取千图网图片(出现HTTP Error 403怎么解决)

    刚开始: 问题: 后来: 到底是要怎么改呢????? 转载于:https://www.cnblogs.com/gongzixi/p/10345119.html

  5. Python爬取彼岸图4k壁纸,想要什么类型的壁纸就输入什么壁纸,太方便了。

    你桌面的壁纸还是用的默认壁纸么?太low了,今天教你用python爬取彼岸图网的4k壁纸,想要什么类型的壁纸就爬什么壁纸,快点来跟我一起试试吧! 这个壁纸怎么样?喜欢吗?你值得拥有... 代码操作一下 ...

  6. [ Python ] 爬虫类库学习之 xpath,爬取彼岸图网的 小姐姐 图片

    安装:pip install lxml 实例化一个etree对象 from lxml import etree 1.将本地的html文档中的源码数据加载到etree对象中 etree.parse(fi ...

  7. Python新手爬虫训练小项目《爬取彼岸图网》(超详细讲解版)

    Python新手爬虫训练小项目<爬取彼岸图网>(超详细讲解版) 这是我的第一篇文章,作为一名新手爬虫,这个算是我这几天来的努力成果,虽然代码寥寥几行但花费了大半天,新手上路还是不能只看视频 ...

  8. Python网络爬虫8 - 爬取彼岸图网美图

    彼岸图网收集了大量美图,是个不错的爬取对象.话不多说,直接上图. 分析站点 分类列表 爬取之前,自然要分析一波,这个站点的框架比较简单,从分类着手,共包含12个分类项. 4K人物 4K动漫 4K动物 ...

  9. 使用python爬取斗图网的图片

    使用python爬取斗图网的图片 以下是代码部分: # -*- coding: utf-8 -*- """ Created on Wed Apr 14 14:41:42 ...

最新文章

  1. Delphi - 我的代码之窗体移动
  2. java中字符流 字节流_理解Java中字符流与字节流的区别
  3. PHP设计模式(6)迭代器模式
  4. 我们为什么这样选择损失函数
  5. r语言 悲观剪枝_《R语言编程—基于tidyverse》新书信息汇总
  6. Javascript基础--对象
  7. c# define 类似_c#跟c++的相似之处
  8. linux用户管理命令(添加,删除,修改)
  9. 简单迅速解决windows电脑下载windows应用商店(Microsoft Store)
  10. Python str方法
  11. 路由器当做交换机使用
  12. ch9200 usb网卡驱动_21包邮的PCMCIA无线网卡开箱+对比测评
  13. C语言实现二叉平衡树
  14. [BZOJ4430][Nwerc2015]Guessing Camels赌骆驼
  15. 2012最新网络电台mms地址
  16. GitHub 值得收藏的前端项目
  17. 实用主义 | 如何定制化群发你的微信消息
  18. 量化资源--awesome quant中文版发布
  19. 初中信息技术计算机的发展,中小学信息技术教材的现状与发展趋势
  20. VLDB 2023 | 北大河图发布分布式训练神器Galvatron,一键实现大模型高效自动并行...

热门文章

  1. 3dMax 基础概念和基本操作
  2. g30u盘启动 中科曙光1620_曙光I620-G20服务器安装windowsserver2008r2方法
  3. 华为1+X网络系统建设与运维(中级)——VRRP
  4. 6 种 MySQL 数据库平滑扩容方案剖析
  5. windows通过双网卡双网络(本地网卡和无线网卡双网络同时工作)
  6. UL1017是什么标准?吸尘器UL1017报告
  7. 值得一生去看的21个演讲,8部经典励志电影,12部大师纪实片,60部纪录片
  8. 博客园美化教程大集合----极致个性化你的专属博客(超详细,看这篇就够了)...
  9. MIPI D-PHYv2.5笔记(1) -- DPHY概览
  10. 小米电视3分体主机改独立供电教程