大数据文摘作品

编译:Aileen

过去的一个周末,社交网络Facebook因为用户数据被第三方API滥用帮助美国大选的事情上了热搜。直到现在,Facebook CEO小扎也没有发出任何官方回应,以及未来该如何更好的保护私人数据。有人认为作为坐拥海量用户数据的网站在获得巨大收益的同时,理应预想到数据被滥用的可能并作出防范措施,在事情发生之后也应该更积极的面对而不是回避。也有人提出犯法的是第三方API, 原罪不在Facebook。

先把这件事情放一边,可以确定的是Facebook拥有大量可供人们浏览的数据,人们可以使用此数据做很多事情。今天我们来了解一下如何使用Facebook Graph API用Python进行数据抓取和分析。

Facebook拥有大量数据供您探索,您可以使用以下数据做很多事情:分析Facebook页面或Facebook群组,将这些数据用于社交网络分析(SNA),为数字营销做数据分析, 甚至收集和保存自己个人项目的数据。

这些视频将向你展示如何做基本的分析,例如:

  • 从Facebook下载数据

  • 从json转换为更方便的数据结构

  • 处理Graph API中的日期变量和其他数据

第1课:介绍和了解Graph API

在本视频中,我将向您介绍GRAPH API,我将使用GRAPH API Explorer并向您展示一些示例请求。

class="video_iframe" allowfullscreen="" width="652" height="366.75" scrolling="no" src="https://v.qq.com/iframe/player.html?vid=k0609zt3a00&width=652&height=366.75&auto=0&encryptVer=6.0&platform=61001&cKey=x4JOJKogtfJfu7QvUC0+RbkxbqSPJ/jpg/fI6/QmDPlrU0LL9n9DP4A+c+6GWLRL">

第2课:下载并保存Facebook数据

在本视频中,我将向您展示如何从Facebook页面或Facebook群组下载并保存所有数据,并记住某些要点。

class="video_iframe" allowfullscreen="" width="652" height="366.75" scrolling="no" src="https://v.qq.com/iframe/player.html?vid=q0609y8kvp9&width=652&height=366.75&auto=0&encryptVer=6.0&platform=61001&cKey=x4JOJKogtfJfu7QvUC0+RbkxbqSPJ/jpg/fI6/QmDPlrU0LL9n9DP4A+c+6GWLRL">

第3课:设置和清理数据

在第三课中,我将使用notebook来清理和审计从Facebook获得的数据,并为分析做好准备。

class="video_iframe" allowfullscreen="" width="652" height="366.75" scrolling="no" src="https://v.qq.com/iframe/player.html?vid=s06098fb92o&width=652&height=366.75&auto=0&encryptVer=6.0&platform=61001&cKey=x4JOJKogtfJfu7QvUC0+RbkxbqSPJ/jpg/fI6/QmDPlrU0LL9n9DP4A+c+6GWLRL">

第4课:评论最多的帖子

在第四课中,我将向您展示一种简单的方式,以获得评论最多的帖子。

https://v.qq.com/x/page/s06098fb92o.html

第5课:点赞最多帖子

在这个课程中发生了一些有趣的事情,因为我发现我可以使用API访问了一些已删除的帖子。

https://v.qq.com/x/page/r0609s6vt80.html

第6课:计算词频

在这个视频中,我将向您展示如何数一个组或一个页面中的所有帖子词频。

您也可以在评论中使用相同的功能。

https://v.qq.com/x/page/j0609g7vvhp.html

第7课:按关键字对帖子进行分组

在这个视频中,我会将在页面中具有关键字“free”的帖子进行分组,并计算有多少人拥有这个关键字,以及有多少人没有这个关键字。

分组方式非常有用,我们将在未来的视频中更频繁地使用更多变量。

https://v.qq.com/x/page/f06099j7ats.html

第8课:按日期分组

在本视频中,我们将探索“创建时间”变量,以按照年份,月份或星期几对帖子进行分组。

这可以用来查找发布模式等等。

https://v.qq.com/x/page/e0609puvw9j.html

原文作者:Nour Galaby

原文地址:https://www.kdnuggets.com/2017/06/6-interesting-things-facebook-python.html

Facebook数据被滥用?8个视频案例教你用好Facebook Graph API相关推荐

  1. 字节流(IO流)概述、字节流(写入/输出)数据(3种)和换行、追加写入、异常处理办法、字节缓冲流、字节流复制图片视频案例

    目录 IO流概述和分类 字节流写入数据(OutputStream) FileOutputStream 字节流写数据的3种方式 字节流写入数据的两个小问题 字节流写数据如何换行 字节流如何实现追加写入 ...

  2. 大数据公司挖掘数据价值的49个典型案例

    大数据公司挖掘数据价值的49个典型案例 对于企业来说,100条理论确实不如一个成功的标杆有实践意义,本文的主旨就是寻找"正在做"大数据的49个样本. 本文力图从企业运营和管理的角度 ...

  3. 大数据公司挖掘数据价值的49个典型案例!信息量很大

    大数据公司挖掘数据价值的49个典型案例 对于企业来说,100条理论确实不如一个成功的标杆有实践意义,本文的主旨就是寻找"正在做"大数据的49个样本. 力图从企业运营和管理的角度,梳 ...

  4. Facebook数据科学家解密数据分析驱动用户增长

    本文内容来源于作者在知乎的一场直播,内容关于如何通过数据分析驱动用户增长.由于 Facebook 有严格的保密要求,所以这次直播内容不会透露属于内部消息的数据.产品或者策略.直播里提到的例子如果涉及到 ...

  5. 2019版云计算大数据学习路线图(含大纲+视频+工具+书籍+面试)

    新版学习路线图上线,对云计算大数据感兴趣的同学们,赶紧学起来吧! 一.2019新版大数据学习路线图---每阶段能力培养及可掌握的能力 二.2019新版大数据学习路线图---每阶段学习大纲及各阶段知识点 ...

  6. 如何避免Facebook数据泄漏事件,这家公司用四大新兴技术给出了答案

    冲量在线揭秘数据流通和隐私保护背后的技术关键. 当企业数字化需求加速,上云成了时代的特征,数据逐渐成为企业的核心资产.企业数字化一片利好的背后,数据泄露事故频出,背后的企业也因此付出了巨大的代价. 在 ...

  7. 社交视频Socialcam独领风骚:躺在Facebook的温床上借力YouTube?

    在硅谷有一条流行的座右铭:赢得了用户基础就不愁赚不到钱了.Facebook重金收购完全还没盈利的Instagram让这句座右铭显得更有分量. 社交视频分享应用Viddy 和 Socialcam,同被誉 ...

  8. Facebook数据中心实践分析,OCP主要工作成果介绍

     Facebook数据中心实践分析,OCP主要工作成果介绍 摘要:用讲故事的方式重点介绍了Facebook在数据中心方面的实践,其成立开放计算项目(OCP)以来的主要工作成果. 以下为正文: 保密 ...

  9. 电商大数据——用数据驱动电商和商业案例解析

    电商大数据--用数据驱动电商和商业案例解析(国内第1本将大数据与电商完美结合的权威之作!) 雪鹰传奇 著   ISBN 978-7-121-22556-7 2014年3月出版 定价:98.00元 36 ...

最新文章

  1. 设计模式之备忘录模式(Memento)摘录
  2. STL与泛型编程(1)---模板
  3. thinkphp 框架自动加载原理_ThinkPHP5分析Part 1 基本框架流程
  4. Activiti工作流引擎使用详解(一)
  5. vc mysql_vc6.0连接mysql数据库
  6. JAVA基本数据结构
  7. 国内主流大数据平台对比
  8. java创建mysql视图_Mysql视图的创建及使用
  9. 功能测试的类型之用户验收测试
  10. 常见TCP/IP、HTTP协议以及三次握手和四次挥手
  11. 《图解HTTP》全文笔记梳理
  12. 紫光国芯 数字后端 面经
  13. 套件端口 群晖_群晖NAS安装teamviwer套件,桌面版远程访问群晖设置教程
  14. 群体遗传分析—LD连锁不平衡
  15. python释放变量内存_Python变量内存管理
  16. 模型选择+过拟合+欠拟合
  17. Lora和LoraWAN
  18. Linux搭建LDAP Account Manager(LAM)
  19. 功率谱有什么用_所有电器功率单位都用瓦,为什么空调要用匹,一匹等于多少瓦...
  20. 高效管理:10年资深项目经理,最喜欢用这两招

热门文章

  1. 音乐第三方(腾讯正版曲库直通车)
  2. 微软禁俄下载、开源投毒攻击、Rust不会重写Linux、开放原子峰会7月举办 | 开源月报 Vol. 07...
  3. P31 multi-threading 多线程 P32 multiprocessing 多核 P33 tkinter
  4. 计算机中通常使用英文单词hit表示的是,计算机四级中常考的英语单词(2)
  5. 合格前端系列第十一弹-初探 Nuxt.js 秘密花园
  6. Java配置文件的使用、加载
  7. 2012总结--第6篇--装备篇
  8. 2019年全球区块链企业发明专利排行榜(TOP100)
  9. 【前端】ext formulas data method
  10. my server与mysql_my sql和sql server有什么区别?