Python3+Flickrapi爬取图片
在学习爬取图片的时候,师兄推荐了yahoo的flickr,发现真的是方便好用,就分享一下自己的使用过程。
参考的博客:https://www.cnblogs.com/kkyyhh96/p/5675087.html
https://blog.csdn.net/asukasmallriver/article/details/74779892
首先去https://www.flickr.com/注册登录。
然后在主界面左上菜单点击发掘,如下
这时右上出现更多,点击其下面的App Garden
建立应用程式
我选择了个人非商业
填写应用名及内容描述
此时邮箱会收到验证码,填写验证码,
这时就可以得到API Key和密钥
这里的API Key和密钥在我们之后爬虫使用flickrapi时使用哦。
python安装flickrapi
pip install flickrapi
之后就可以进行我们的图片爬取了,相当方便啊。
下面是我使用的一个简单代码供参考:
#coding:utf-8import flickrapi
import urllib.request
import os
import sysAPI_KEY = "你的API Key"
API_SECRET = "你的密钥"#输入API的key和secret
flickr=flickrapi.FlickrAPI(API_KEY, API_SECRET, cache=True)
tag = "你需要爬取图片的标签名"
path = "你文件保存地址"
try:#爬取tags为tag的照片,这里可以根据自己的需要设置其它的参数,还可以根据textphotos=flickr.walk(tags=tag, extras='url_c')
except Exception as e:print('Error')
count = 1
for photo in photos:#获得照片的url,设置大小为url_c(具体参数请参看FlickrAPI官方文档介绍)url=photo.get('url_c')if(str(url) == "None"):print("It's None!")else:#有效url进行爬取保存,文件名从1开始urllib.request.urlretrieve(url, path + str(count).zfill(7) + "." + os.path.basename(url).split(".")[1])count = count + 1print(url)
Python3+Flickrapi爬取图片相关推荐
- python3 爬取图片并分页保存在文件夹中
目标 https://www.veer.com/search-image/fengjing/中的图片 过程分析 网页分析 这次爬取的比较简单,要爬取的内容很容易就找到了. 换页 点击下一页,看到网址变 ...
- Python3爬虫批量爬取图片并保存到本地
看新闻的时候忽然发现了一个图片网站,那肯定得爬一下. 网址:https://www.0xu.cn/ 不难发现,qcmn这个路径对应青春美女 右键检查图片地址可见 访问该地址成功访问到了图片 正式开始 ...
- Scrapy爬取图片网站——最详细的入门爬虫教程,新手入门干货,不进来看一下?
开始前准备 这次爬虫使用scrapy,所以用到的工具必然是python3.7,scrapy,pycharm这些东西, 目标网站:http://pic.netbian.com 彼岸图网,个人非常喜欢的图 ...
- python 爬取图片_Python实现千图成像:从图片爬取到图片合成
千图成像:用N张图片拼凑成一张图片. 实现原理:先将所要成像的图片转化成马赛克图片,然后从图库中用对应颜色的图片替换相应色块. 图库中的图片处理:标记图库中每张图片的混合颜色,用于替换目标色块,并记录 ...
- python爬虫爬取图片无法打开_半小时入门python爬虫爬下网站图片,不能再简单了...
阅读本文大约需要2分钟 本文旨在为没有爬虫基础的,偶尔想爬虫爬一下某个网站上的图片的初学者使用,如果你已经是对爬虫很熟悉了,下面依然有你感兴趣的东西. 我最近也才正儿八经学习了下爬虫,出于某种需要爬一 ...
- 循环爬取图片_Java爬取简单的网页内容和图片
Java爬取简单的网页内容和图片 根据java网络编程相关的内容,使用jdk提供的相关类可以得到url对应网页的html页面代码. 针对得到的html代码,通过使用正则表达式即可得到我们想要的内容. ...
- python爬取图片的库_16-python爬虫之Requests库爬取海量图片
Requests 是一个 Python 的 HTTP 客户端库. Request支持HTTP连接保持和连接池,支持使用cookie保持会话,支持文件上传,支持自动响应内容的编码,支持国际化的URL和P ...
- 图片的批量下载 和 爬虫爬取图片数据集
图片的批量下载 和 爬虫爬取图片数据集 1.图片的批量下载 1.图片的批量下载 数据集是深度学习的一切,没有数据集它什么也不是,现在你知道数据集很重要了吧 代码: ''' 项目名称:爬取公章数据 创建 ...
- 孤荷凌寒自学python第八十一天学习爬取图片1
孤荷凌寒自学python第八十一天学习爬取图片1 (完整学习过程屏幕记录视频地址在文末) 通过前面十天的学习,我已经基本了解了通过requests模块来与网站服务器进行交互的方法,也知道了Beauti ...
最新文章
- java io读书笔记(6) Writing Arrays of Bytes
- oracle中lock的解释
- spark学习13(spark RDD)
- 如何在Python中声明一个数组?
- 如何编写一份SOP?
- 浅谈Hibernate批量操作
- spark-shell开发wordcount程序
- mysql证书有哪些_mysql数据库有哪些证书
- Quartus-II 三种方式进行D触发器仿真
- ddr4单颗粒最大_国产内存来了:长鑫发布DDR4/LPDDR4X内存
- 一个关于Booth算法的文章
- mysql导出的身份证格式错误
- Java Poi 根据文字内容 插入 word 图片
- phalcon mysql中文乱码_Phalcon查询语言
- 【吟风听云】在QQ快速打出Emjoy符号(流汗黄豆!)
- 实现极致节能,维谛技术(Vertiv)有哪些特殊技能?
- 计算机处理器ghz,电脑CPU的GHZ代表什么?比如1.7GHZ、2.2GHZ??
- 安卓的SoundPool(音效池)播放声音(及具体参数解析)
- 滴滴自动驾驶服务上线,程维:道阻且长,行则将至
- 二维中的OBB相交测试
热门文章
- 量化投资学习-10:追涨杀跌的本质是“高买低卖”,这是散户亏钱的背后的操作逻辑
- ElasticSearch部署架构和容量规划
- 木马伪装“刷单任务” 劫持QQ语音暗中盗号
- Ubuntu16.04笔记本 安装R RStudio
- git ssh远程登录
- java编程之数字魔方(N阶数字魔方和数字旋转魔方)
- 使用HorizontalListView仿车来了公交时刻表
- VS 和VC 的区别
- 各大android应用商店的展示权重 安卓应用商店关键词+下载量+评价+其他这几项占的权重(仅供参考)
- 春季活动策划案例合集(共25份)