来张爬取的美女镇楼

先上代码,再给你讲解

import re
import requests
import os
import easygui(min, max) = easygui.multenterbox(fields=['起始数', '终止数'], values=['1', '100'])
min = int(min)
max = int(max)if os.path.exists('zhiwei'):os.chdir('zhiwei')
else:os.mkdir('zhiwei')os.chdir('zhiwei')
num = 1
for i in range(min, max):headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3760.400 QQBrowser/10.5.4083.400'}urls = "http://pic.netbian.com"url = "http://pic.netbian.com/tupian/{}.html".format(str(i))res = requests.get(url, headers=headers)res.encoding = 'gbk'html = res.textimage = re.findall('<img src="(.*?)" data-pic', html)name = re.findall('<h1>(.*?)</h1>', html)images = [urls + i for i in image]print(images)for names in name:for img in images:file_name = names + '.jpg'print("===========================开始下载第{0}张壁纸================================".format(num))print(file_name)print(img)response = requests.get(img)with open(file_name, 'wb') as file:file.write(response.content)print("下载完成")num += 1

代码很简单,会一点爬虫的老哥都能看懂,入门级的代码

基本思路

  1. 创建文件夹,判断是否存在,存在就不创建,不存在就新建
if os.path.exists('zhiwei'):os.chdir('zhiwei')
else:os.mkdir('zhiwei')os.chdir('zhiwei')
  1. 访问网址,找到图片位置,利用正则爬取到图片地址(不带前面)还要标题(为啥要爬标题?当然你想把图片命名成123456的话,那你可以不爬名字)
 image = re.findall('<img src="(.*?)" data-pic', html)name = re.findall('<h1>(.*?)</h1>', html)
  1. 拼接图片地址(就是加一下网站域名而已)
images = [urls + i for i in image]
  1. 有了文件名称,遍历循环图片名称,根据每次名称去访问图片地址进行下载
response = requests.get(img)
with open(file_name, 'wb') as file:file.write(response.content)
print("下载完成")
  1. 然后就完事了

使用方法

运行代码,输入起始页,坐等图片入包

代码中注解很少,如果看不懂,可以私信我

Python爬取彼岸图网10万张高清图片(入门级爬虫)_一蓑烟雨任平生相关推荐

  1. 用Python爬取彼岸图网图片

     用Python爬取彼岸图网图片 *使用了  四个模块 import time import requests from lxml import etree import os 没有的话自行百度安装. ...

  2. Python爬取彼岸图4k壁纸,想要什么类型的壁纸就输入什么壁纸,太方便了。

    你桌面的壁纸还是用的默认壁纸么?太low了,今天教你用python爬取彼岸图网的4k壁纸,想要什么类型的壁纸就爬什么壁纸,快点来跟我一起试试吧! 这个壁纸怎么样?喜欢吗?你值得拥有... 代码操作一下 ...

  3. Python新手爬虫训练小项目《爬取彼岸图网》(超详细讲解版)

    Python新手爬虫训练小项目<爬取彼岸图网>(超详细讲解版) 这是我的第一篇文章,作为一名新手爬虫,这个算是我这几天来的努力成果,虽然代码寥寥几行但花费了大半天,新手上路还是不能只看视频 ...

  4. Python网络爬虫8 - 爬取彼岸图网美图

    彼岸图网收集了大量美图,是个不错的爬取对象.话不多说,直接上图. 分析站点 分类列表 爬取之前,自然要分析一波,这个站点的框架比较简单,从分类着手,共包含12个分类项. 4K人物 4K动漫 4K动物 ...

  5. [ Python ] 爬虫类库学习之 xpath,爬取彼岸图网的 小姐姐 图片

    安装:pip install lxml 实例化一个etree对象 from lxml import etree 1.将本地的html文档中的源码数据加载到etree对象中 etree.parse(fi ...

  6. python爬虫爬取彼岸图网图片

    python爬虫爬取彼岸图网图片 话不多说,直接上代码! import requests from PIL import Image from io import BytesIO import re ...

  7. 使用python爬取斗图网的图片

    使用python爬取斗图网的图片 以下是代码部分: # -*- coding: utf-8 -*- """ Created on Wed Apr 14 14:41:42 ...

  8. 爬取彼岸图网4k图片

    爬取彼岸图网高清美女图片 代码如下

  9. python爬取千图网图片并保存_Python数据分析与挖掘实战-课程作业5爬取千图网某个频道的高清图片...

    作业要求:爬取千图网(http://www.58pic.com)某个频道的高清图片 作业难点:正确找到图片链接并用正则表达式写出 代码如下: """ Created on ...

最新文章

  1. setuid和setgid
  2. dataTable 表格组件刷新 问题记录
  3. 为什么不建议把数据库部署在Docker容器内
  4. Prefactoring——Guidelines
  5. “放到桌面”的Servlet实现
  6. ubuntu1604编译android5.1(android L)失败error: unsupportedreloc 43等问题
  7. MVC5+EF6 入门完整教程四
  8. CVPR 2020 论文大盘点-超分辨率篇
  9. 为什么有的电路中要有两单片机
  10. 认识Linux系统服务(鸟哥18章)
  11. 廖雪峰git教程中的git命令汇总
  12. 论述多媒体技术和计算机技术的发展,多媒体技术的发展现状和未来.doc
  13. QQ空间制作软件大全
  14. Spark整理:相关名词解释
  15. 鸽了亿下下的游记——2022 GDOI普及组游记
  16. Ubuntu下安装rsh实现无密码访问
  17. 软件的接口设计图_面向服务架构(SOA)的汽车软件分析和设计
  18. Windows 修改MAC地址
  19. rally功能分析与使用介绍
  20. var 、let 和 const 的区别

热门文章

  1. +中文词频统计及词云制作9-25
  2. 【用HTML+CSS实现简单的轮播图片效果】
  3. 【Java基础系列】基本数据类型及包装类
  4. 怎样将kux格式转换mp4?高效简单的技巧你要懂
  5. 软件工程 sdlcmodel
  6. veracrypt取消加密卷_VeraCrypt 加密个人隐私(便携式 )
  7. ACL访问控制列表(访问控制、抓取感兴趣流)详解及基本ACL和高级ACL的配置。
  8. SDUT-2178 链表的有序集合
  9. 最值得入手的五款骨传导耳机,几款高畅销的骨传导耳机
  10. 请教modelsim中vlog的用法