使用Python调用Flickr API抓取图片数据
Flickr是雅虎旗下的图片分享网站,上面有全世界网友分享的大量精彩图片,被认为是专业的图片网站。其API也很友好,可以实现多种功能。这里我使用了Python调用其API获得了大量的照片数据。需要注意的是,要想登录其网站,注册成为开发者,并调用其API,需要FQ。但获得的url可以不FQ查看。
首先需要先去Flickr注册成为其开发者,创建应用,获得API_KEY和API_SECRET,其API网址在:https://www.flickr.com/services/api/
Flickr提供了多种开发工具进行使用。这里使用Python开发工具。官方推荐的开发工具是Beej’s Python Flickr API. https://stuvel.eu/flickrapi
可以直接使用pip安装工具进行安装,输入flickrapi即可自动安装好。
官方文档在这里:https://stuvel.eu/flickrapi-doc/
爬取照片数据最好的方法是使用其walk方法。这个方法实质上是调用了flickr.photos.search的接口,各种参数可以参见该API的介绍:https://www.flickr.com/services/api/flickr.photos.search.html
用好这个方法,输入不同的参数,就可以满足大部分数据挖掘的需要,包括时间、地理位置、照片类型等。
这里贴上一段简单的代码,仅供参考:
1 #coding:utf-8 2 import flickrapi 3 #输入API的key和secret 4 flickr=flickrapi.FlickrAPI(api_key,api_secret,cache=True) 5 try: 6 #爬取text为'New York'的照片,这里可以根据自己的需要设置其它的参数 7 photos=flickr.walk(text='New York',extras='url_c') 8 except Exception as e: 9 print('Error') 10 for photo in photos: 11 #获得照片的url,设置大小为url_c(具体参数请参看FlickrAPI官方文档介绍) 12 url=photo.get('url_c') 13 print(str(url))
需要注意的地方在于,倘若出现循环的情况,可能是因为数据量太大,因此需要加一些限制条件限制,例如一次调用只调用一段时间内的数据,再分批次挖掘数据。
转载于:https://www.cnblogs.com/kkyyhh96/p/5675087.html
使用Python调用Flickr API抓取图片数据相关推荐
- python调用lib_基于python调用libvirt API
基于python调用libvirt API 1.程序代码 #!/usr/bin/python import libvirt import sys def createConnection(): con ...
- python 图表_Python入门学习系列——使用Python调用Web API实现图表统计
使用Python调用Web API实现图表统计 Web API:Web应用编程接口,用于URL请求特定信息的程序交互,请求的数据大多以非常易于处理的格式返回,比如JSON或CSV等. 本文将使用Pyt ...
- 用Python调用OpenAI API进行文本创作
文章目录 一.前言 二.使用教程 2.1获取API密钥 2.2 连接API 2.3 文本生成 三.创作示例 3.1 诗歌创作 3.2 推荐书单 3.3 超级百度 四.总结 一.前言 本文将教大家用py ...
- 用Python调用OpenAI API做有趣的事
获取 API KEY 首先需要 可以开全局的梯子,选择日本或韩国节点,可以通过 ipinfo 检查当前 IP 地址是否为日本或韩国地区,然后访问 OpenAI 网站注册账号并完成认证. 如果自己完成账 ...
- 新浪微博OAuth2.0授权及使用python调用微博API
通过调用新浪微博API获取数据时数组采集中一个很好的方法,为了获取较新的资讯数据内容,本文主要介绍新浪微博OAuth2.0授权机制.微博开发者平台的使用.python调用微博API等内容,文末提供测试 ...
- Python通过代理多线程抓取图片
前言 Python作为一门功能强大的脚本语言,经常被用来写爬虫程序,下面是Python通过代理多线程抓取图片代码 Python爬虫多线程抓取代理服务器参考: http://www.linuxeye.c ...
- python调用高德api路径规划_Python调用高德API实现批量地址转经纬度并写入表格的功能...
本段代码是先将需要转换经纬度的地址爬取在 '地址.csv' 文件里,文件截图示例: 代码展示 # coding=utf-8 # SPL # 时间:2020/12/20 21:15 import csv ...
- python电脑怎么打开任务管理器_利用Python调用Windows API,实现任务管理器功能
任务管理器具体功能有: 1. 列出系统当前所有进程. 2. 列出隶属于该进程的所有线程. 3. 如果进程有窗口,可以显示和隐藏窗口. 4. 强行结束指定进程. 通过Python调用Windows AP ...
- Python调用WPS API
Python调用WPS API 完整文档 最佳实践 WPS 在对于Office或WPS的操作场景中,最适合的其实是Pywin32的方式,因为这种方式可以直接调度由原厂商开放的API,目前我们的场景中最 ...
最新文章
- Liststring[] 如何去重
- 详解const和#define
- crontab命令linux,crontab命令
- FixedThreadPool吞掉了异常
- XHTML、HTML4,HTML5 之间的区别
- Linux Socket poll
- python 彩票分析_294期钱哥福彩3D预测奖号:杀号分析
- 今天聊:做好前端的 10 个习惯
- 计算尖峰电流的目的_干货 | 谈谈RCD的计算方法
- python join用法
- 极差标准差方差简单计算
- Paper Reading Notes
- Excel日期修改为统一月份
- 计算机属性显示缩略图 桌面样式变了,Win7任务栏缩略图预览变成列表预览怎么解决?...
- 崔毅东 C++程序设计入门(上) 第5单元:万类霜天竞自由 – 对象和类的更多内容 笔记
- 你们中国人真TM假,微信居然能撤回…
- axios修改服务器地址,axios 生产环境和开发环境 ip 切换(修改文件配置)
- USB转虚拟串口驱动
- 宏基4740g笔记本xp系统sata驱动安装
- 《壹百度—百度十年千倍的29条法则》,互联网营销
热门文章
- linux修改snmp团体名称,HP-UX修改MP卡的SNMP团体字
- 记一次 解决 Xshell 连接 Linux 系统,使用数字小键盘乱码问题
- mvvm框架_引入淘汰赛JavaScript框架(MVVM)
- ProE与UG的比较
- Spark GraphX图计算入门
- 海波龙 11.1.2.4安装指南// hyperion install
- 关于黑苹果clover写入EFI后Deepin无法正常引导的解决方法
- HTML5与CSS3中鼠标悬停会有下拉列表
- 观看无闻老师go语言视频
- c语言 滑窗法_滑动窗口算法(一)