python爬虫爬取图片并存入本地
爬取百度图片,并存入本地文件中。
例:
爬取的是怪兽大学百度图片,并存入本地(嘿嘿安利大家,非常励志的一部电影,看了三次)
首先我们找到图片的链接,并将json格式解析,
代码如下:
import requests
import json
import os
url = ‘https://image.baidu.com/search/acjson?tn=resultjson_com&ipn=rj&ct=201326592&is=&fp=result&queryWord=怪兽大学图片&cl=2&lm=-1&ie=utf-8&oe=utf-8&adpicid=&st=&z=&ic=&hd=&latest=©right=&word=怪兽大学图片&s=&se=&tab=&width=&height=&face=&istype=&qc=&nc=&fr=&expermode=&force=&pn=30&rn=30&gsm=1e&1563718472383=’
req = requests.get(url=url)
req.encoding = ‘UTF-8’
souce = req.text
json_data = json.loads(souce)
data1 = json_data[‘data’]
将data1 依次遍历输出,并创建路径,将图片存取到本地文件中
代码如下:
for data in data1:
try: #因为有的链接中含空格等其他格式,要抛出异常。
image_url = data[‘thumbURL’]
except:
continue
root = “F://spider_image//” # 根目录
path = root + image_url.split(’/’)[-1] # 保存目录为根目录加上url链接以反斜杠分割的最后一个部****分,也即path为本地路径中与图片最后名称一致的文件名称
try:
if not os.path.exists(root): # 如果根目录不存在就创建目录
os.mkdir(root)
if not os.path.exists(path): # 如果文件不存在,就利用代码获取网上的文件
r = requests.get(image_url)
r = requests.get(image_url)
with open(path, ‘wb’) as f:
f.write(r.content)
f.close()
print(“file save successfully”)
else:
print(“such file existed”)
except:
print(“failed”)
结果如图:
python爬虫爬取图片并存入本地相关推荐
- python爬虫爬取图片保存到本地文件
今天搜索电脑壁纸突发奇想就把所有壁纸怕取下来了 百度 壁纸 随便挑了一个点进去是zol电脑壁纸ZOL桌面壁纸 现在开始爬取 import requests from lxml import etree ...
- 【大学生课程实践】实操:使用Python爬虫爬取图片
实操:使用Python爬虫爬取图片 参考链接: 源码部署 安装源码中的爬虫库 创建 images文件 参考链接: 本博客作为大佬博客学习笔记记录 参考链接:孩子说"你没看过奥特曼" ...
- python爬虫爬取图片无法打开_半小时入门python爬虫爬下网站图片,不能再简单了...
阅读本文大约需要2分钟 本文旨在为没有爬虫基础的,偶尔想爬虫爬一下某个网站上的图片的初学者使用,如果你已经是对爬虫很熟悉了,下面依然有你感兴趣的东西. 我最近也才正儿八经学习了下爬虫,出于某种需要爬一 ...
- Python爬虫爬取图片
** Python爬虫爬取网站指定图片(多个网站综合经验结论分享) ** 我想以这篇文章来记录自己学习过程以及经验感受,因为我也是个初学者.接下来我将分享几个我爬取过的图片网站,给大家们分享下自己的方 ...
- [python爬虫] 爬取图片无法打开或已损坏的简单探讨
本文主要针对python使用urlretrieve或urlopen下载百度.搜狗.googto(谷歌镜像)等图片时,出现"无法打开图片或已损坏"的问题,作者对它进行简单的探讨.同时 ...
- python爬虫爬取图片的简单步骤和实现代码
目录 1. 如何获取网页信息 1). 直接从网络读取 2). 先将网页源码保存到本地,再读取 2. 分析获取到的网页信息,提取需要的信息(图片地址) 3. 使用request将图片保存到本地以及会碰到 ...
- 利用python爬虫爬取图片并且制作马赛克拼图
想在妹子生日送妹子一张用零食(或者食物类好看的图片)拼成的马赛克拼图,因此探索了一番= =. 首先需要一个软件来制作马赛克拼图,这里使用Foto-Mosaik-Edda(网上也有在线制作的网站,但是我 ...
- python爬虫 爬取图片
图片 爬取单张图片 #网址:https://pic.netbian.com/ 我们爬取:https://pic.netbian.com/4kmeinv/ from lxml import etree ...
- python爬虫爬取图片代码_Python爬虫入门:批量爬取网上图片的两种简单实现方式——基于urllib与requests...
Python到底多强大,绝对超乎菜鸟们(当然也包括我了)的想象.近期我接触到了爬虫,被小小地震撼一下.总体的感觉就两个词--"强大"和"有趣".今天就跟大家分享 ...
最新文章
- CSS外框高度自动适应
- linux基础(1)-yum源配置
- 【ARM】数据操作指令(上)
- iOS SAX解析XML
- python重命名窗口_Python:即时重命名方法名称
- 如何在 ASP.Net Core 中使用 File Providers
- poj 2395 prime的递归实现
- lammps教程:原子平动和振动的设置方法
- 大学生创新创业大赛 项目申请书
- HandlerSocket的安装实例及性能测试
- Rhino(犀牛) 7.22安装教程附带安装包
- ResourceBundle读取properties文件
- 关于:将日文键盘设置为英文键盘
- 怎样解决迅雷下载时的版权限制-两招解决迅雷下载版权限制
- 经典括号匹配问题——你真的明白了吗?
- 辟谣!微信支付宝收款码将不能用于经营性收款?
- keil4 #pragma anon_unions
- 【中国剩余定理】互素与不互素的情况详解
- 115道Java面试题
- noseunittestpytest