FaceBook爬取库：facebook-scraper

简介

无需注册登录，不需要API秘钥即可爬取Facebook；受twitter-scraper的启发。

安装：

pip install facebook-scraper

使用：

from facebook_scraper import get_posts# 第一个参数为主页唯一标识：nintendo（https://www.facebook.com/Nintendo/）
# 第二个参数为爬取的页数：1
for post in get_posts('nintendo', pages=1):print(post['text'][:50])

输出：

Take a first look at the super cool Puma x Super M
We’re talking Triforce and discussing Hyrule Warri

命令行用法：

$ facebook-scraper --filename nintendo_page_posts.csv --pages 1 nintendo

其他参数解析：

group：群组ID，以抓取小组。默认值为None。
pages：要请求多少个帖子页面，通常第一页有2个帖子，其余4个。默认值为10。
timeout：超时设置。默认值为5。
credentials：请求帖子前登录的用户名和密码的元组。默认值为None。
extra_info：布尔值，如果为true，则该函数将尝试执行额外的请求以获取后期响应。默认值为False。
youtube_dl：布尔，请使用Youtube-DL进行（高质量）视频提取。您需要在您的环境中安装youtube-dl。默认值为False。

请求返回结构实例：

{'post_id': '2257188721032235','text': 'Don’t let this diminutive version of the Hero of Time fool you, ''Young Link is just as heroic as his fully grown version! Young Link ''joins the Super Smash Bros. series of amiibo figures!','time': datetime.datetime(2019, 4, 29, 12, 0, 1),'image': 'https://scontent.flim16-1.fna.fbcdn.net''/v/t1.0-0/cp0/e15/q65/p320x320''/58680860_2257182054366235_1985558733786185728_n.jpg''?_nc_cat=1&_nc_ht=scontent.flim16-1.fna''&oh=31b0ba32ec7886e95a5478c479ba1d38&oe=5D6CDEE4','images': ['https://scontent.flim16-1.fna.fbcdn.net''/v/t1.0-0/cp0/e15/q65/p320x320''/58680860_2257182054366235_1985558733786185728_n.jpg''?_nc_cat=1&_nc_ht=scontent.flim16-1.fna''&oh=31b0ba32ec7886e95a5478c479ba1d38&oe=5D6CDEE4'],'likes': 2036,'comments': 214,'shares': 0,'reactions': {'like': 135, 'love': 64, 'haha': 10, 'wow': 4, 'anger': 1},  # if `extra_info` was set'post_url': 'https://m.facebook.com/story.php''?story_fbid=2257188721032235&id=119240841493711','link': 'https://bit.ly/something'}

设置代理

代理设置请移步：https://www.xugj520.cn/archives/facebook-scraper.html

FaceBook爬取库：facebook-scraper相关推荐

python爬取小说章节信息用pygame进行数据显示_爬虫不过如此（python的Re 、Requests、BeautifulSoup 详细篇）...
网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本. 爬虫的本质就是一段自动抓取互联网信息的程序,从网络获取 ...
爬虫练习（一）爬取Boss直聘的招聘信息
通过职位搜索"Python开发",看下搜索的结果 https://www.zhipin.com/job_detail/?query=python开发&city=101020 ...
Python:爬取FaceBook用户头像
博客迁移个人博客站点,欢迎访问,www.jiingfengji.tech 本文地址 Python爬取源码本文介绍的爬取方法是基于已经有一些用户的sns_id了,然后通过头像链接进行头像下载. 以下 ...
facebook数据爬取
Python爬取Facebook请求数据需要的字段:app_id ,access_token 1.app_id 及账户id 2.access_token 获取: 1.facebook开发者账户 pro ...
Python工具 | 9个用来爬取网络站点的 Python 库
1️⃣Scrapy 一个开源和协作框架,用于从网站中提取所需的数据. 以快速,简单,可扩展的方式. 官网 2️⃣cola 一个分布式爬虫框架. GitHub 3️⃣Demiurge 基于 PyQuer ...
python动态爬取不一样的url_什么情况？python这次居然被web scraper比下去了
周末,永恒君和一位B站网友讨论交流了一下关于web scraper爬取网页的问题.今天来和各位分享一下,希望能给大家有帮助. 需求 1.爬取的网站地址: http://wenshu.court.gov ...
9个用来爬取网络站点的 Python 库
上期入口:10个不到500行代码的超牛Python练手项目 1️⃣Scrapy 一个开源和协作框架,用于从网站中提取所需的数据. 以快速,简单,可扩展的方式. 官网:https://scrapy.or ...
python复杂网络点图可视化_Python学习工具：9个用来爬取网络站点的 Python 库
Python学习工具 :总结了9个用来爬取网络站点的Python 库,有你在用的吗? Scrapy 一个开源和协作框架,用于从网站中提取所需的数据. 以快速,简单,可扩展的方式. cola 一个分布式 ...
记录用web scraper爬取裁判文书网的文书列表信息以及批量下载word文书
这个是一位网友在B站交流的一个问题,这里记录一下. 需求 1.爬取的网站地址:http://wenshu.court.gov.cn/website/wenshu/181217BMTKHNT2W0/in ...

FaceBook爬取库：facebook-scraper

简介

安装：

使用：

命令行用法：

其他参数解析：

请求返回结构实例：

设置代理

FaceBook爬取库：facebook-scraper相关推荐

最新文章

热门文章