Python爬取彼岸图网10万张高清图片(入门级爬虫)_一蓑烟雨任平生
来张爬取的美女镇楼
先上代码,再给你讲解
import re
import requests
import os
import easygui(min, max) = easygui.multenterbox(fields=['起始数', '终止数'], values=['1', '100'])
min = int(min)
max = int(max)if os.path.exists('zhiwei'):os.chdir('zhiwei')
else:os.mkdir('zhiwei')os.chdir('zhiwei')
num = 1
for i in range(min, max):headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3760.400 QQBrowser/10.5.4083.400'}urls = "http://pic.netbian.com"url = "http://pic.netbian.com/tupian/{}.html".format(str(i))res = requests.get(url, headers=headers)res.encoding = 'gbk'html = res.textimage = re.findall('<img src="(.*?)" data-pic', html)name = re.findall('<h1>(.*?)</h1>', html)images = [urls + i for i in image]print(images)for names in name:for img in images:file_name = names + '.jpg'print("===========================开始下载第{0}张壁纸================================".format(num))print(file_name)print(img)response = requests.get(img)with open(file_name, 'wb') as file:file.write(response.content)print("下载完成")num += 1
代码很简单,会一点爬虫的老哥都能看懂,入门级的代码
基本思路
- 创建文件夹,判断是否存在,存在就不创建,不存在就新建
if os.path.exists('zhiwei'):os.chdir('zhiwei')
else:os.mkdir('zhiwei')os.chdir('zhiwei')
- 访问网址,找到图片位置,利用正则爬取到图片地址(不带前面)还要标题(为啥要爬标题?当然你想把图片命名成123456的话,那你可以不爬名字)
image = re.findall('<img src="(.*?)" data-pic', html)name = re.findall('<h1>(.*?)</h1>', html)
- 拼接图片地址(就是加一下网站域名而已)
images = [urls + i for i in image]
- 有了文件名称,遍历循环图片名称,根据每次名称去访问图片地址进行下载
response = requests.get(img)
with open(file_name, 'wb') as file:file.write(response.content)
print("下载完成")
- 然后就完事了
使用方法
运行代码,输入起始页,坐等图片入包
代码中注解很少,如果看不懂,可以私信我
Python爬取彼岸图网10万张高清图片(入门级爬虫)_一蓑烟雨任平生相关推荐
- 用Python爬取彼岸图网图片
用Python爬取彼岸图网图片 *使用了 四个模块 import time import requests from lxml import etree import os 没有的话自行百度安装. ...
- Python爬取彼岸图4k壁纸,想要什么类型的壁纸就输入什么壁纸,太方便了。
你桌面的壁纸还是用的默认壁纸么?太low了,今天教你用python爬取彼岸图网的4k壁纸,想要什么类型的壁纸就爬什么壁纸,快点来跟我一起试试吧! 这个壁纸怎么样?喜欢吗?你值得拥有... 代码操作一下 ...
- Python新手爬虫训练小项目《爬取彼岸图网》(超详细讲解版)
Python新手爬虫训练小项目<爬取彼岸图网>(超详细讲解版) 这是我的第一篇文章,作为一名新手爬虫,这个算是我这几天来的努力成果,虽然代码寥寥几行但花费了大半天,新手上路还是不能只看视频 ...
- Python网络爬虫8 - 爬取彼岸图网美图
彼岸图网收集了大量美图,是个不错的爬取对象.话不多说,直接上图. 分析站点 分类列表 爬取之前,自然要分析一波,这个站点的框架比较简单,从分类着手,共包含12个分类项. 4K人物 4K动漫 4K动物 ...
- [ Python ] 爬虫类库学习之 xpath,爬取彼岸图网的 小姐姐 图片
安装:pip install lxml 实例化一个etree对象 from lxml import etree 1.将本地的html文档中的源码数据加载到etree对象中 etree.parse(fi ...
- python爬虫爬取彼岸图网图片
python爬虫爬取彼岸图网图片 话不多说,直接上代码! import requests from PIL import Image from io import BytesIO import re ...
- 使用python爬取斗图网的图片
使用python爬取斗图网的图片 以下是代码部分: # -*- coding: utf-8 -*- """ Created on Wed Apr 14 14:41:42 ...
- 爬取彼岸图网4k图片
爬取彼岸图网高清美女图片 代码如下
- python爬取千图网图片并保存_Python数据分析与挖掘实战-课程作业5爬取千图网某个频道的高清图片...
作业要求:爬取千图网(http://www.58pic.com)某个频道的高清图片 作业难点:正确找到图片链接并用正则表达式写出 代码如下: """ Created on ...
最新文章
- setuid和setgid
- dataTable 表格组件刷新 问题记录
- 为什么不建议把数据库部署在Docker容器内
- Prefactoring——Guidelines
- “放到桌面”的Servlet实现
- ubuntu1604编译android5.1(android L)失败error: unsupportedreloc 43等问题
- MVC5+EF6 入门完整教程四
- CVPR 2020 论文大盘点-超分辨率篇
- 为什么有的电路中要有两单片机
- 认识Linux系统服务(鸟哥18章)
- 廖雪峰git教程中的git命令汇总
- 论述多媒体技术和计算机技术的发展,多媒体技术的发展现状和未来.doc
- QQ空间制作软件大全
- Spark整理:相关名词解释
- 鸽了亿下下的游记——2022 GDOI普及组游记
- Ubuntu下安装rsh实现无密码访问
- 软件的接口设计图_面向服务架构(SOA)的汽车软件分析和设计
- Windows 修改MAC地址
- rally功能分析与使用介绍
- var 、let 和 const 的区别