python爬取优美图库
学了一段时间python,最近学习了一些python爬虫,今天写了一个爬取优美图库的的一段代码,下面给大家分享一下。
先看一下爬取的结果:
这段代码使用了下面的一些包,我们需要提前进行安装,在终端使用pip就可安装。
import requests
from bs4 import BeautifulSoup
import time
我在代码的最外层加入了一个for循环,可以进行爬取多个页面
for page in range(2,5,1):url=f"https://www.umei.cc/bizhitupian/meinvbizhi/index_{page}.htm"
在代码的最后一定要记得关闭请求,并且在每个请求中间使用sleep休息一秒,防止多次访问未关闭或者访问速度过快,可能会导致网站禁止你的ip访问。
child_resp.close()time.sleep(1)resp.close()
下面把整个的代码放上
# 时间:2021/10/12 16:32import requests
from bs4 import BeautifulSoup
import time
for page in range(2,5,1): #这里可以更改需要图片的数量url=f"https://www.umei.cc/bizhitupian/meinvbizhi/index_{page}.htm"resp = requests.get(url)resp.encoding = 'utf=8' #处理乱码# print(resp.text)main_page = BeautifulSoup(resp.text, "html.parser")alist = main_page.find("div", class_="TypeList").find_all("a")# print(alist)for a in alist:href = "https://www.umei.cc" + a.get('href')# print(href)# 拿到子页面的源代码child_resp = requests.get(href)child_resp.encoding = "utf-8"child_text = child_resp.text# 从子页面中拿到图片的下载路径child_page = BeautifulSoup(child_text, 'html.parser')p = child_page.find("p", align="center")img = p.find("img")# print(img.get("src"))src = img.get("src")# 下载图片img_resp = requests.get(src)img_name = src.split("/")[-1]with open("img2/" + img_name, mode="wb") as f:f.write(img_resp.content) # 图片内容写入文件print(img_name, "下载完成")img_resp.close()child_resp.close()time.sleep(1)resp.close()
print("下载结束")
注意::在运行之前要新建一个文件夹,命名为img
python爬取优美图库相关推荐
- Python 爬取优美图库图片
# !/usr/bin/env python # -*-coding:utf-8-*- # date :2021/7/23 17:53 # author:Sabo"""爬 ...
- python爬取优美图库海量图片,附加代码,一键爬取
优美高清图片为大家提供高清美女套图赏析,非高清不录入,大家的网速要给力. 今天教大家爬取优美图库网站中高质量的图片!! 简单易上手哦~ 使用工具: Python 3.6 pycharm 相关环境: r ...
- python第一天----爬取优美图库的图片
python第一天----爬取优美图库的图片 首先我们需要爬取的步骤: 1.选择爬取的网页,这里我选取的是https://www.umei.net/bizhitupian/,直接爬取的首页第一页的图片 ...
- Python使用bs4爬取优美图库
'''爬取优美图库 ''' import requests from bs4 import BeautifulSoup import time from tqdm import tqdm# 爬取页面源 ...
- python 爬取5566图库图片
python 爬取5566图库图片 1 import requests 2 import random 3 import re 4 import time 5 import os 6 from bs4 ...
- Python爬取百度图库
Python爬取百度图库 页面分析 通过Chrome 的开发者模式,我们可以很发现 百度图库是通过ajax 加载图片的. 每一次都会发送一个请求:https://image.baidu.com/sea ...
- 案例(一)爬取优美图库风景壁纸
文章目录 一.分析页面 二.爬取的关键步骤 2.1 初步信息获取 2.2 查找抓取信息 2.3 抓取新页面 2.4 获取新页面的图片真正的下载地址 2.5 遍历所有新页面的抓取信息,获取图片的SRC属 ...
- python爬取唯一图库高清壁纸
文章目录 写在前面 标题非常可口 1:用到的包 2:定义主函数 3:获取图库的地址 4:创建图库路径并保存第一张 5:正则提取壁纸的URL特征 6:保存壁纸 完整代码 爬取结果 写在后面 写在前面 今 ...
- 不可错过的爬虫实例(一):教你爬取优美图库
一.前言 前几天有小伙伴私信我说能不能用爬虫爬取美女图片,那必须能啊,本次就用爬虫知识爬取你们想要的(懂得都懂),话不多说,正题开始! 二.准备工作 1.所用模块 requests Beautiful ...
最新文章
- ios获取新数据要不要关_iOS开发之数据读写
- 2.9 迁移学习-深度学习第四课《卷积神经网络》-Stanford吴恩达教授
- Android开发之高仿百度地图底部滑出菜单
- LVS + Keepalived 高可用群集
- 3个开源TTS(四)eSpeak1.06的源码调试环境vim+vimgdb
- 一名董事长给大学生的18条忠告(全)
- html的canvas代码,HTML
- Jersey入门教程
- 华为云学院-人人学loT学习笔记- 第四章 物联网关 汇聚回传
- Java基础Day05
- 得物(毒)APP,8位抽奖码需求,这不就是产品给我留的数学作业!
- LIS3DH 三轴加速度传感器使用流程及示例
- 【PyTorch】关于函数 datasets.IMDB.splits()
- 微信小程序:Framework inner error FLOW_CREATE_NODE
- excel批量文件改名批量加后缀
- Codeforces E. Game With String
- myeclipse安装pydev实现python开发
- python基础 // 与 / % 的区别
- 偶数乘2奇数乘3C语言,输入一个整数x,如果为偶数乘2,否则乘3,然后输出.C语言
- 历届NBA总决赛结果