批量爬取网站图片-“优美库”篇(爬虫实战)
本次爬取运用到了requests,bs4的beautifulsoup好,re以及time模块,用了常用的方法提取到源代码的关键信息,最后获取每个信息的请求链接,从而获得我们的图片。
import requests
from bs4 import BeautifulSoup
import re
import time
url='https://www.''此处为需要获取的网站.cc/bizhitupian/'
res=requests.get(url)
obj=re.compile(r'<li><a href="(?P<http>.*?)"><img',re.S)
res.encoding='uft-8'
res.close()
res=res.text
res=BeautifulSoup(res,'html.parser')
res=res.find_all('div',class_="pic-box")
res=str(res).strip('[]')
result=obj.finditer(res)
for it in result:
url1='https://www.umei.cc'+it.group('http')
response = requests.get(url1)
response.encoding='utf-8'
response=response.text
response=BeautifulSoup(response,'html.parser')
name=response.find('title')
name=str(name)
name=name.strip('</title>')
img=response.find('img')
img = img.get('src')
rs=requests.get(img).content
with open('img/'+name+'.jpg','wb')as f:
f.write(rs)
print('完成了',name)
time.sleep(2)#怕请求太过频繁造成不必要的影响,所以设置了一定的延迟
print("全部完成拉!")
今天分享的内容就这些啦,希望大家有不好的地方可以提出来,帮我指正指正!
(效果图片)
批量爬取网站图片-“优美库”篇(爬虫实战)相关推荐
- 爬取千库网ppt_初学Python-只需4步,爬取网站图片(附py文件)
很多人学习Python很重要的一个原因是,可以很简单的把一个网站的数据爬下来. 尤其是做我们这一行,产品经理,电商行业. 领导:弄一个买卖游戏周边商品的交易APP出来. 我:行,那我们卖什么呀? 领导 ...
- python 第一行 报错_初学Python-只需4步,爬取网站图片
很多人学习Python很重要的一个原因是,可以很简单的把一个网站的数据爬下来. 尤其是做我们这一行,产品经理,电商行业. 领导:弄一个买卖游戏周边商品的交易APP出来.我:行,那我们卖什么呀?领导:看 ...
- python爬虫爬取百度图片总结_python爬虫如何批量爬取百度图片
当我们想要获取百度图片的时候,面对一张张图片,一次次的点击右键下载十分麻烦.python爬虫可以实现批量下载,根据我们下载网站位置.图片位置.图片下载数量.图片下载位置等需求进行批量下载,本文演示py ...
- 四个步骤教你爬取网站图片,新手必学
很多人学习Python很重要的一个原因是,可以很简单的把一个网站的数据爬下来. 尤其是做我们这一行,产品经理,电商行业. 领导:弄一个买卖游戏周边商品的交易APP出来. 我:行,那我们卖什么呀? 领导 ...
- python 图片文件_初学Python-只需4步,爬取网站图片(附py文件)
很多人学习Python很重要的一个原因是,可以很简单的把一个网站的数据爬下来. 尤其是做我们这一行,产品经理,电商行业. 领导:弄一个买卖游戏周边商品的交易APP出来. 我:行,那我们卖什么呀? 领导 ...
- C++编写爬虫脚本爬取网站图片
C++编写爬虫脚本爬取网站图片 整体代码设计思路 具体功能实现 初始化网络库 url中爬取图片 获取网页源代码 连接主机 url中获取主机名和文件名 html中提取连接 html中提取图片链接 获取并 ...
- python爬虫实战1:批量爬取网址图片
1.爬虫基础知识 目前,爬虫的相关知识了解了以下这么多. 2.爬取图片的步骤 学习了很多视频教程,基本介绍爬虫都是主要分3步: 1.请求网页 2.解析网页 3.保存图片 3.爬虫实战 唯有实战,才能提 ...
- Python爬取网站图片数据
Python爬取网站图片数据 找到需要爬取的网站地址 模拟网站http请求 根据调试模式获取的了解读取到真实的地址url,读取请求头数据和参数信息,模拟http请求调用 import requests ...
- Python网络爬虫——爬取网站图片小工具
最近初学python爬虫,就写了一个爬取网站图片的小工具,界面如下: 用到的包主要是爬虫常用的urllib,urllib2和图形界面用的Tkinter,完整代码如下: # -*- coding:utf ...
最新文章
- 微信之父张小龙:产品经理的必备书单(转)
- 图像特征提取与描述_角点特征01:Harris算法+Shi-Tomas算法
- easyx鼠标放置前按钮颜色_七种正确使用鼠标的好习惯,让你摆脱鼠标手的痛苦...
- 传感器的特性及性能参数
- TF使用例子-情感分类
- 把算术表达式 表示为一个c语言表达式,正确的写法是____,C与C++程序设计-中国大学mooc-题库零氪...
- 《深入理解并行编程》中文版
- 区分Collection、Collector和collect Collectors类的静态工厂方法
- Caused by: java.lang.UnsatisfiedLinkError: libjawt.so: 无法打开共享对象文件: 没有那个文件或目录
- Atitit redis使用 attilax 艾提拉总结 1.1. Redis默认有16个库,默认连接的是 index=0 的那一个。解决与原来不方便查询查看的问题	1 1.2. redis不是现
- 重磅:国刊4区变1区!2021年中科院分区表正式公布!
- Centos7调整home和root大小
- Centos6-防火墙的基本配置
- 居者有其屋,耕者有其田
- /proc/sysrq-trigger文件的功能
- 什么叫能力不行,什么叫术业有专攻
- Git服务器搭建及仓库克隆
- python游戏制作rpg_用 Python 语言来写游戏
- 该内存不能为written
- Windows 安装微软 Edge 浏览器
热门文章
- 全球与中国网络连接视频门铃对讲机市场深度研究分析报告
- 由浅入深的分析HashMap原理
- Hyper-V虚拟机网络配置
- 1074 Reversing Linked List (25 分) java 题解
- 【学习笔记】stm32+openmv串口通信实现颜色识别
- Vue全家桶之vue-router
- 使用ivx滑动时间轴制作动画效果的经验总结
- win10系统文件拖拽卡顿_终于找到Win10卡顿病根了!看完秒懂
- div点击穿透,CSS属性pointer-events :none;实现护眼模式, 夜间模式遮罩
- C/C++宽字符与控制台程序