Facebook数据被滥用?8个视频案例教你用好Facebook Graph API
大数据文摘作品
编译:Aileen
过去的一个周末,社交网络Facebook因为用户数据被第三方API滥用帮助美国大选的事情上了热搜。直到现在,Facebook CEO小扎也没有发出任何官方回应,以及未来该如何更好的保护私人数据。有人认为作为坐拥海量用户数据的网站在获得巨大收益的同时,理应预想到数据被滥用的可能并作出防范措施,在事情发生之后也应该更积极的面对而不是回避。也有人提出犯法的是第三方API, 原罪不在Facebook。
先把这件事情放一边,可以确定的是Facebook拥有大量可供人们浏览的数据,人们可以使用此数据做很多事情。今天我们来了解一下如何使用Facebook Graph API用Python进行数据抓取和分析。
Facebook拥有大量数据供您探索,您可以使用以下数据做很多事情:分析Facebook页面或Facebook群组,将这些数据用于社交网络分析(SNA),为数字营销做数据分析, 甚至收集和保存自己个人项目的数据。
这些视频将向你展示如何做基本的分析,例如:
从Facebook下载数据
从json转换为更方便的数据结构
处理Graph API中的日期变量和其他数据
第1课:介绍和了解Graph API
在本视频中,我将向您介绍GRAPH API,我将使用GRAPH API Explorer并向您展示一些示例请求。
class="video_iframe" allowfullscreen="" width="652" height="366.75" scrolling="no" src="https://v.qq.com/iframe/player.html?vid=k0609zt3a00&width=652&height=366.75&auto=0&encryptVer=6.0&platform=61001&cKey=x4JOJKogtfJfu7QvUC0+RbkxbqSPJ/jpg/fI6/QmDPlrU0LL9n9DP4A+c+6GWLRL">
第2课:下载并保存Facebook数据
在本视频中,我将向您展示如何从Facebook页面或Facebook群组下载并保存所有数据,并记住某些要点。
class="video_iframe" allowfullscreen="" width="652" height="366.75" scrolling="no" src="https://v.qq.com/iframe/player.html?vid=q0609y8kvp9&width=652&height=366.75&auto=0&encryptVer=6.0&platform=61001&cKey=x4JOJKogtfJfu7QvUC0+RbkxbqSPJ/jpg/fI6/QmDPlrU0LL9n9DP4A+c+6GWLRL">
第3课:设置和清理数据
在第三课中,我将使用notebook来清理和审计从Facebook获得的数据,并为分析做好准备。
class="video_iframe" allowfullscreen="" width="652" height="366.75" scrolling="no" src="https://v.qq.com/iframe/player.html?vid=s06098fb92o&width=652&height=366.75&auto=0&encryptVer=6.0&platform=61001&cKey=x4JOJKogtfJfu7QvUC0+RbkxbqSPJ/jpg/fI6/QmDPlrU0LL9n9DP4A+c+6GWLRL">
第4课:评论最多的帖子
在第四课中,我将向您展示一种简单的方式,以获得评论最多的帖子。
https://v.qq.com/x/page/s06098fb92o.html
第5课:点赞最多帖子
在这个课程中发生了一些有趣的事情,因为我发现我可以使用API访问了一些已删除的帖子。
https://v.qq.com/x/page/r0609s6vt80.html
第6课:计算词频
在这个视频中,我将向您展示如何数一个组或一个页面中的所有帖子词频。
您也可以在评论中使用相同的功能。
https://v.qq.com/x/page/j0609g7vvhp.html
第7课:按关键字对帖子进行分组
在这个视频中,我会将在页面中具有关键字“free”的帖子进行分组,并计算有多少人拥有这个关键字,以及有多少人没有这个关键字。
分组方式非常有用,我们将在未来的视频中更频繁地使用更多变量。
https://v.qq.com/x/page/f06099j7ats.html
第8课:按日期分组
在本视频中,我们将探索“创建时间”变量,以按照年份,月份或星期几对帖子进行分组。
这可以用来查找发布模式等等。
https://v.qq.com/x/page/e0609puvw9j.html
原文作者:Nour Galaby
原文地址:https://www.kdnuggets.com/2017/06/6-interesting-things-facebook-python.html
Facebook数据被滥用?8个视频案例教你用好Facebook Graph API相关推荐
- 字节流(IO流)概述、字节流(写入/输出)数据(3种)和换行、追加写入、异常处理办法、字节缓冲流、字节流复制图片视频案例
目录 IO流概述和分类 字节流写入数据(OutputStream) FileOutputStream 字节流写数据的3种方式 字节流写入数据的两个小问题 字节流写数据如何换行 字节流如何实现追加写入 ...
- 大数据公司挖掘数据价值的49个典型案例
大数据公司挖掘数据价值的49个典型案例 对于企业来说,100条理论确实不如一个成功的标杆有实践意义,本文的主旨就是寻找"正在做"大数据的49个样本. 本文力图从企业运营和管理的角度 ...
- 大数据公司挖掘数据价值的49个典型案例!信息量很大
大数据公司挖掘数据价值的49个典型案例 对于企业来说,100条理论确实不如一个成功的标杆有实践意义,本文的主旨就是寻找"正在做"大数据的49个样本. 力图从企业运营和管理的角度,梳 ...
- Facebook数据科学家解密数据分析驱动用户增长
本文内容来源于作者在知乎的一场直播,内容关于如何通过数据分析驱动用户增长.由于 Facebook 有严格的保密要求,所以这次直播内容不会透露属于内部消息的数据.产品或者策略.直播里提到的例子如果涉及到 ...
- 2019版云计算大数据学习路线图(含大纲+视频+工具+书籍+面试)
新版学习路线图上线,对云计算大数据感兴趣的同学们,赶紧学起来吧! 一.2019新版大数据学习路线图---每阶段能力培养及可掌握的能力 二.2019新版大数据学习路线图---每阶段学习大纲及各阶段知识点 ...
- 如何避免Facebook数据泄漏事件,这家公司用四大新兴技术给出了答案
冲量在线揭秘数据流通和隐私保护背后的技术关键. 当企业数字化需求加速,上云成了时代的特征,数据逐渐成为企业的核心资产.企业数字化一片利好的背后,数据泄露事故频出,背后的企业也因此付出了巨大的代价. 在 ...
- 社交视频Socialcam独领风骚:躺在Facebook的温床上借力YouTube?
在硅谷有一条流行的座右铭:赢得了用户基础就不愁赚不到钱了.Facebook重金收购完全还没盈利的Instagram让这句座右铭显得更有分量. 社交视频分享应用Viddy 和 Socialcam,同被誉 ...
- Facebook数据中心实践分析,OCP主要工作成果介绍
Facebook数据中心实践分析,OCP主要工作成果介绍 摘要:用讲故事的方式重点介绍了Facebook在数据中心方面的实践,其成立开放计算项目(OCP)以来的主要工作成果. 以下为正文: 保密 ...
- 电商大数据——用数据驱动电商和商业案例解析
电商大数据--用数据驱动电商和商业案例解析(国内第1本将大数据与电商完美结合的权威之作!) 雪鹰传奇 著 ISBN 978-7-121-22556-7 2014年3月出版 定价:98.00元 36 ...
最新文章
- 设计模式之备忘录模式(Memento)摘录
- STL与泛型编程(1)---模板
- thinkphp 框架自动加载原理_ThinkPHP5分析Part 1 基本框架流程
- Activiti工作流引擎使用详解(一)
- vc mysql_vc6.0连接mysql数据库
- JAVA基本数据结构
- 国内主流大数据平台对比
- java创建mysql视图_Mysql视图的创建及使用
- 功能测试的类型之用户验收测试
- 常见TCP/IP、HTTP协议以及三次握手和四次挥手
- 《图解HTTP》全文笔记梳理
- 紫光国芯 数字后端 面经
- 套件端口 群晖_群晖NAS安装teamviwer套件,桌面版远程访问群晖设置教程
- 群体遗传分析—LD连锁不平衡
- python释放变量内存_Python变量内存管理
- 模型选择+过拟合+欠拟合
- Lora和LoraWAN
- Linux搭建LDAP Account Manager(LAM)
- 功率谱有什么用_所有电器功率单位都用瓦,为什么空调要用匹,一匹等于多少瓦...
- 高效管理:10年资深项目经理,最喜欢用这两招
热门文章
- 音乐第三方(腾讯正版曲库直通车)
- 微软禁俄下载、开源投毒攻击、Rust不会重写Linux、开放原子峰会7月举办 | 开源月报 Vol. 07...
- P31 multi-threading 多线程 P32 multiprocessing 多核 P33 tkinter
- 计算机中通常使用英文单词hit表示的是,计算机四级中常考的英语单词(2)
- 合格前端系列第十一弹-初探 Nuxt.js 秘密花园
- Java配置文件的使用、加载
- 2012总结--第6篇--装备篇
- 2019年全球区块链企业发明专利排行榜(TOP100)
- 【前端】ext formulas data method
- my server与mysql_my sql和sql server有什么区别?