简介

无需注册登录,不需要API秘钥即可爬取Facebook;受twitter-scraper的启发。

安装:

pip install facebook-scraper

使用:

from facebook_scraper import get_posts# 第一个参数为主页唯一标识:nintendo(https://www.facebook.com/Nintendo/)
# 第二个参数为爬取的页数:1
for post in get_posts('nintendo', pages=1):print(post['text'][:50])

输出:

Take a first look at the super cool Puma x Super M
We’re talking Triforce and discussing Hyrule Warri

命令行用法:

$ facebook-scraper --filename nintendo_page_posts.csv --pages 1 nintendo

其他参数解析:

  • group:群组ID,以抓取小组。默认值为None。
  • pages:要请求多少个帖子页面,通常第一页有2个帖子,其余4个。默认值为10。
  • timeout:超时设置。默认值为5。
  • credentials:请求帖子前登录的用户名和密码的元组。默认值为None。
  • extra_info:布尔值,如果为true,则该函数将尝试执行额外的请求以获取后期响应。默认值为False。
  • youtube_dl:布尔,请使用Youtube-DL进行(高质量)视频提取。您需要在您的环境中安装youtube-dl。默认值为False。

请求返回结构实例:

{'post_id': '2257188721032235','text': 'Don’t let this diminutive version of the Hero of Time fool you, ''Young Link is just as heroic as his fully grown version! Young Link ''joins the Super Smash Bros. series of amiibo figures!','time': datetime.datetime(2019, 4, 29, 12, 0, 1),'image': 'https://scontent.flim16-1.fna.fbcdn.net''/v/t1.0-0/cp0/e15/q65/p320x320''/58680860_2257182054366235_1985558733786185728_n.jpg''?_nc_cat=1&_nc_ht=scontent.flim16-1.fna''&oh=31b0ba32ec7886e95a5478c479ba1d38&oe=5D6CDEE4','images': ['https://scontent.flim16-1.fna.fbcdn.net''/v/t1.0-0/cp0/e15/q65/p320x320''/58680860_2257182054366235_1985558733786185728_n.jpg''?_nc_cat=1&_nc_ht=scontent.flim16-1.fna''&oh=31b0ba32ec7886e95a5478c479ba1d38&oe=5D6CDEE4'],'likes': 2036,'comments': 214,'shares': 0,'reactions': {'like': 135, 'love': 64, 'haha': 10, 'wow': 4, 'anger': 1},  # if `extra_info` was set'post_url': 'https://m.facebook.com/story.php''?story_fbid=2257188721032235&id=119240841493711','link': 'https://bit.ly/something'}

设置代理

代理设置请移步:https://www.xugj520.cn/archives/facebook-scraper.html

FaceBook爬取库:facebook-scraper相关推荐

  1. python爬取小说章节信息用pygame进行数据显示_爬虫不过如此(python的Re 、Requests、BeautifulSoup 详细篇)...

    网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本. 爬虫的本质就是一段自动抓取互联网信息的程序,从网络获取 ...

  2. 爬虫练习(一)爬取Boss直聘的招聘信息

    通过职位搜索"Python开发",看下搜索的结果 https://www.zhipin.com/job_detail/?query=python开发&city=101020 ...

  3. Python:爬取FaceBook用户头像

    博客迁移 个人博客站点,欢迎访问,www.jiingfengji.tech 本文地址 Python爬取源码 本文介绍的爬取方法是基于已经有一些用户的sns_id了,然后通过头像链接进行头像下载. 以下 ...

  4. facebook数据爬取

    Python爬取Facebook请求数据需要的字段:app_id ,access_token 1.app_id 及账户id 2.access_token 获取: 1.facebook开发者账户 pro ...

  5. Python工具 | 9个用来爬取网络站点的 Python 库

    1️⃣Scrapy 一个开源和协作框架,用于从网站中提取所需的数据. 以快速,简单,可扩展的方式. 官网 2️⃣cola 一个分布式爬虫框架. GitHub 3️⃣Demiurge 基于 PyQuer ...

  6. python动态爬取不一样的url_什么情况?python这次居然被web scraper比下去了

    周末,永恒君和一位B站网友讨论交流了一下关于web scraper爬取网页的问题.今天来和各位分享一下,希望能给大家有帮助. 需求 1.爬取的网站地址: http://wenshu.court.gov ...

  7. 9个用来爬取网络站点的 Python 库

    上期入口:10个不到500行代码的超牛Python练手项目 1️⃣Scrapy 一个开源和协作框架,用于从网站中提取所需的数据. 以快速,简单,可扩展的方式. 官网:https://scrapy.or ...

  8. python复杂网络点图可视化_Python学习工具:9个用来爬取网络站点的 Python 库

    Python学习工具 :总结了9个用来爬取网络站点的Python 库,有你在用的吗? Scrapy 一个开源和协作框架,用于从网站中提取所需的数据. 以快速,简单,可扩展的方式. cola 一个分布式 ...

  9. 记录用web scraper爬取裁判文书网的文书列表信息以及批量下载word文书

    这个是一位网友在B站交流的一个问题,这里记录一下. 需求 1.爬取的网站地址:http://wenshu.court.gov.cn/website/wenshu/181217BMTKHNT2W0/in ...

最新文章

  1. Android监视返回键
  2. 在阿里、腾讯、美团工作有什么区别?
  3. Node.js实现TCP和HTTP并作简单的比较
  4. mysql mongo关联查询语句_MongoDB 集合间关联查询后通过$filter进行筛选
  5. 让所有IE支持HTML5
  6. 关于c3样式在浏览器上的兼容问题
  7. js 数字递增递减_js验证连续两位数字递增或递减和连续三位数字相同
  8. php模拟post提交 在线,curl post请求 , postman 模拟请求 , 在线测试工具模拟请求...
  9. zotero抓取知网文献
  10. PHP验证身份证类(包含香港身份证校验)
  11. Tomcat 启动 Dubbo 端口占用报错 Address already in use: bind
  12. 2021高考成绩排名查询河北,河北高考排名查询方法,2021年河北高考成绩位次全省排名查询...
  13. python itertools groupy踩坑
  14. 测试您的杀毒软件的代码(不是病毒)
  15. 【图像检索】基于HSV的图像检索附matlab代码
  16. Solr 7 - 多字段查询及 PHP 调用篇
  17. 北京内推 | 华为诺亚方舟实验室招聘自动驾驶预测/规控/仿真算法研究员
  18. 【增广贤集】先学会说话
  19. 全面揭秘快手与抖音的内容推荐算法
  20. 别人比25岁的今日,你去比25岁后的明天!!!

热门文章

  1. 曲面积分的投影法_曲线曲面积分与重积分知识点汇总
  2. 今天我的app上线了庆祝一下
  3. 交换机的Zoning技术
  4. 东软之行-人生当展翅高飞
  5. Docker 学习笔记(Docker 架构 / 镜像 / 容器 / 常用命令 / Dockerfile / 镜像仓库)
  6. APP 分析 随手记
  7. BEVFormer论文解析
  8. 【转载】如何从win8/8.1中文版(核心版)升级到win8/8.1专业版
  9. 如何解决Sketch导出文件出现色差偏暗或偏淡这个问题?
  10. javadoc 创建html,javadoc html标签