Flickr是雅虎旗下的图片分享网站,上面有全世界网友分享的大量精彩图片,被认为是专业的图片网站。其API也很友好,可以实现多种功能。这里我使用了Python调用其API获得了大量的照片数据。需要注意的是,要想登录其网站,注册成为开发者,并调用其API,需要FQ。但获得的url可以不FQ查看。

首先需要先去Flickr注册成为其开发者,创建应用,获得API_KEY和API_SECRET,其API网址在:https://www.flickr.com/services/api/

Flickr提供了多种开发工具进行使用。这里使用Python开发工具。官方推荐的开发工具是Beej’s Python Flickr API. https://stuvel.eu/flickrapi

可以直接使用pip安装工具进行安装,输入flickrapi即可自动安装好。

官方文档在这里:https://stuvel.eu/flickrapi-doc/

爬取照片数据最好的方法是使用其walk方法。这个方法实质上是调用了flickr.photos.search的接口,各种参数可以参见该API的介绍:https://www.flickr.com/services/api/flickr.photos.search.html

用好这个方法,输入不同的参数,就可以满足大部分数据挖掘的需要,包括时间、地理位置、照片类型等。

这里贴上一段简单的代码,仅供参考:

 1 #coding:utf-8
 2 import flickrapi
 3 #输入API的key和secret
 4 flickr=flickrapi.FlickrAPI(api_key,api_secret,cache=True)
 5 try:
 6     #爬取text为'New York'的照片,这里可以根据自己的需要设置其它的参数
 7     photos=flickr.walk(text='New York',extras='url_c')
 8 except Exception as e:
 9     print('Error')
10 for photo in photos:
11     #获得照片的url,设置大小为url_c(具体参数请参看FlickrAPI官方文档介绍)
12     url=photo.get('url_c')
13     print(str(url))

需要注意的地方在于,倘若出现循环的情况,可能是因为数据量太大,因此需要加一些限制条件限制,例如一次调用只调用一段时间内的数据,再分批次挖掘数据。

转载于:https://www.cnblogs.com/kkyyhh96/p/5675087.html

使用Python调用Flickr API抓取图片数据相关推荐

  1. python调用lib_基于python调用libvirt API

    基于python调用libvirt API 1.程序代码 #!/usr/bin/python import libvirt import sys def createConnection(): con ...

  2. python 图表_Python入门学习系列——使用Python调用Web API实现图表统计

    使用Python调用Web API实现图表统计 Web API:Web应用编程接口,用于URL请求特定信息的程序交互,请求的数据大多以非常易于处理的格式返回,比如JSON或CSV等. 本文将使用Pyt ...

  3. 用Python调用OpenAI API进行文本创作

    文章目录 一.前言 二.使用教程 2.1获取API密钥 2.2 连接API 2.3 文本生成 三.创作示例 3.1 诗歌创作 3.2 推荐书单 3.3 超级百度 四.总结 一.前言 本文将教大家用py ...

  4. 用Python调用OpenAI API做有趣的事

    获取 API KEY 首先需要 可以开全局的梯子,选择日本或韩国节点,可以通过 ipinfo 检查当前 IP 地址是否为日本或韩国地区,然后访问 OpenAI 网站注册账号并完成认证. 如果自己完成账 ...

  5. 新浪微博OAuth2.0授权及使用python调用微博API

    通过调用新浪微博API获取数据时数组采集中一个很好的方法,为了获取较新的资讯数据内容,本文主要介绍新浪微博OAuth2.0授权机制.微博开发者平台的使用.python调用微博API等内容,文末提供测试 ...

  6. Python通过代理多线程抓取图片

    前言 Python作为一门功能强大的脚本语言,经常被用来写爬虫程序,下面是Python通过代理多线程抓取图片代码 Python爬虫多线程抓取代理服务器参考: http://www.linuxeye.c ...

  7. python调用高德api路径规划_Python调用高德API实现批量地址转经纬度并写入表格的功能...

    本段代码是先将需要转换经纬度的地址爬取在 '地址.csv' 文件里,文件截图示例: 代码展示 # coding=utf-8 # SPL # 时间:2020/12/20 21:15 import csv ...

  8. python电脑怎么打开任务管理器_利用Python调用Windows API,实现任务管理器功能

    任务管理器具体功能有: 1. 列出系统当前所有进程. 2. 列出隶属于该进程的所有线程. 3. 如果进程有窗口,可以显示和隐藏窗口. 4. 强行结束指定进程. 通过Python调用Windows AP ...

  9. Python调用WPS API

    Python调用WPS API 完整文档 最佳实践 WPS 在对于Office或WPS的操作场景中,最适合的其实是Pywin32的方式,因为这种方式可以直接调度由原厂商开放的API,目前我们的场景中最 ...

最新文章

  1. Liststring[] 如何去重
  2. 详解const和#define
  3. crontab命令linux,crontab命令
  4. FixedThreadPool吞掉了异常
  5. XHTML、HTML4,HTML5 之间的区别
  6. Linux Socket poll
  7. python 彩票分析_294期钱哥福彩3D预测奖号:杀号分析
  8. 今天聊:做好前端的 10 个习惯
  9. 计算尖峰电流的目的_干货 | 谈谈RCD的计算方法
  10. python join用法
  11. 极差标准差方差简单计算
  12. Paper Reading Notes
  13. Excel日期修改为统一月份
  14. 计算机属性显示缩略图 桌面样式变了,Win7任务栏缩略图预览变成列表预览怎么解决?...
  15. 崔毅东 C++程序设计入门(上) 第5单元:万类霜天竞自由 – 对象和类的更多内容 笔记
  16. 你们中国人真TM假,微信居然能撤回…
  17. axios修改服务器地址,axios 生产环境和开发环境 ip 切换(修改文件配置)
  18. USB转虚拟串口驱动
  19. 宏基4740g笔记本xp系统sata驱动安装
  20. 《壹百度—百度十年千倍的29条法则》,互联网营销

热门文章

  1. linux修改snmp团体名称,HP-UX修改MP卡的SNMP团体字
  2. 记一次 解决 Xshell 连接 Linux 系统,使用数字小键盘乱码问题
  3. mvvm框架_引入淘汰赛JavaScript框架(MVVM)
  4. ProE与UG的比较
  5. Spark GraphX图计算入门
  6. 海波龙 11.1.2.4安装指南// hyperion install
  7. 关于黑苹果clover写入EFI后Deepin无法正常引导的解决方法
  8. HTML5与CSS3中鼠标悬停会有下拉列表
  9. 观看无闻老师go语言视频
  10. c语言 滑窗法_滑动窗口算法(一)