《为什么:因果关系的新科学》(The Book of Why: The New Science of Cause and Effect)是今年3月刚出版的新书,作者是一位传奇人物,81岁的计算机科学家和哲学家朱迪亚·珀尔(Judea Pearl)。
        
这本书的主题是在当今这个相关性运用越来越广泛的时代,因果是否还有必要存在,或者因果这一概念自身就是人类的一个错误认知?这本书给了我们一个很好的解答。趁着周末,用上下两篇博客分析一下本书的主要内容以及思想。

传送门:

相关与因果的相爱相杀——新书《为什么:因果关系的新科学》解读(上)
相关与因果的相爱相杀——新书《为什么:因果关系的新科学》解读(下)

1.因果关系的三种思维

在简单世界通常是一个原因导致一个结果的发生,即A->B(A导致的B的发生),也就是我们熟知的因果关系。但复杂世界中很难判断一件事发生的缘故,可能B这个结果的发生除了A还有C、D等原因。正因如此,近年来人们喜爱用基于大数据和机器学习来分析相关性。一个经典的例子
当飓风侵袭某个地区的时候,那里的沃尔玛商店卖的一种草莓馅饼干的销量就会大增。这是为什么呢?没人知道。但是有这个信息就够了,你看天气预报说要来飓风,你就多给草莓馅饼干备货,没有必要分析为什么。
有统计学家相信科学世界中没有因果,所有的知识都是相关性的,人的行为也是基于经验的。这一学说听起来看似有道理,但作者明确指出这是错的,并用因果关系的三个等级来阐述自己的思想:
  • 第一级:观察。即通过数据分析做出预测。你的生活经验表明下雨会把衣服淋湿,所以下次下雨你最好打伞,这就是观察思维。观察是寻找变量之间的相关性,观察就是积累经验。现在所有实用 AI 技术都是基于这个第一级思维。比如你开个便利店,有卖牙膏和牙线。观察思维问的问题是,如果一个顾客买牙膏的话,他有多大的概率同时也买牙线呢?这是个数学问题,可以在日常销售记录中进行计算。
  • 第二级:干预。即预判一个行动的结果。如果我现在把牙膏的价格给提高一倍,对牙线的销量会有什么影响?这不是以往的数据所能告诉你的想知道这件事的结果,最好的办法是亲自做实验。生活中我们可以借助第一级的知识来辅助分析,但是干预的结果到底会如何?你需要更高级的判断。
  • 第三级:想象。即对以前发生的事的反思并想象未来可能发生的事。你问的是一个从来没发生过的事情。这叫反事实(counterfactual)分析。如果纳粹德国抢先一步发明原子弹,现在的世界会是什么样的?这件事儿在历史上并有没有发生,积累的大数据是用不上的。但这种想象正是智人独有的特性,早在三万年前就有智人运用想象雕刻出了“狮面人身像”,把头部替换为了狮子头,如下所示。这是一种高级的认知,是AI所不具备的。

2.皮尔逊的尴尬

皮尔逊相关系数(Pearson Correlation Coefficient)是统计分析中的一个重要系数。物理定律里根本就不包括因果关系。比如你拿个气压计测量大气压,物理定律说你的气压计读数 B 和大气压 P 之间有一个正比关系 ——B = kP
但是这个定律里根本没说“谁导致了谁”。是气压导致了气压计的读数吗?上面的方程完全可以改写成 P = B/k,只看方程,你完全可以说是气压计的读数导致了大气压的大小。物理定律只是描述一个规律,并不在乎因果。这也是皮尔逊坚信的观点,可能也是他研究相关系数的一个原因吧。。。
重点在于,皮尔逊的观点为相关系数等于1时,即A发生B一定发生,相关系数为1等同于因果关系,这个观点现在看来肯定是错误的。来看看作者的观点:
作者阐述了第一个使用因果模型图搞研究的例子。
1920年,休厄尔·赖特(Sewall Wright)发表了一篇有关天竺鼠的毛色遗传的论文。他假设有三种因素可能影响毛色,分别是发展(d)、遗传(h)和环境(e),他把这三种因素画成了因果关系图 —— 
赖特根据自己的实验结果,用解方程的方法算出了三种因素的相对大小。他把天竺鼠的毛色问题给解决了。
这绝对是开创性的工作。赖特不但第一次使用了因果模型,而且还提出了一个洞见。赖特说,我这个因果模型并不是客观的。你不可能通过数据分析、用机械化的流程得到这张图。因果图之所以这么画,图中之所以考虑了这些关系而没考虑别的关系,这是你自己主观的选择 —— 是你用自己的知识、阅历和判断画出来的。
也就是说,因果关系,其实是你的主观假设
数据是客观的,而人的观点是主观的。相关性是客观的,因果是主观的
有了这个洞见,我们解决问题的步骤就是下面这样的 ——
第一步,根据你自己的见识,画一张主观的因果模型图。模型里有些因果关系是概率性的,A 发生并不一定会让 B 发生,只要 A 对 B 有影响就行。
第二步,使用实验和数据分析,确定图中每个因果关系的强弱大小。这样你就有了一个完整的因果模型。
第三步,使用因果模型,你就可以回答“观察、干预、想象”那三种问题了。
(ps:这个道理琢磨了一段时间,归根到底算是一个哲学问题,不好理解。。欢迎各位指点交流)

3.知识的核实与修正——伟大的贝叶斯定理

贝叶斯定理的核心就是科学地修正,不是坚定不移,也不是听风就是雨。先来看一下贝叶斯公式(这里只是理论上介绍一下,想具体了解贝叶斯请自行百度)
右边乘法的第一项 P(B|A)/P(B) 有时候被称为“似然比”。那么贝叶斯公式可以写成
你可以把它理解成“观念更新”的公式。P(假设) 是你的老观念,新证据发生之后,你的新观念是 P(假设|证据)。新观念等于老观念乘以似然比。你的观点,随着事实,发生了改变
传统科学对贝叶斯定理是持抨击态度的,因为传统的科学方法是
  1. 提出一个理论假设。
  2. 做实验验证。
  3. 如果实验结果符合理论,这个理论就暂时站得住脚,如果不符合,理论就被证伪了。
这是非黑即白的剧情,理论要么就继续保留,要么就彻底抛弃。
而贝叶斯方法则是先给理论假设设定一个可信度。新证据并不直接证实或者证伪理论,只是调整可信度的大小,做一个动态的判断。
贝叶斯方法是一种实用主义的态度。其实咱们想想,我们搞研究的目的并不一定是了解*绝对真实*的世界 —— 也许绝对真实的世界根本就不可知 —— 我们的目的是通过获取实用的知识,做出尽可能准确的判断和决策。这跟前面说的不追求绝对的因果关系和“为什么”,只追求回答三种实用的因果问题,是一样的道理。可以说,贝叶斯为我们提供了一个理性分析世界的方法。

相关与因果的相爱相杀——新书《为什么:因果关系的新科学》解读(上)相关推荐

  1. Anchor Based和Anchor Free的相爱相杀与ATSS的诞生

    前言 我们都知道按照是否出现RPN可将目标检测算法分为two-stage和one-stage,其中one-stage的一个主要代表便是YOLO系列,而根据是否存在先验锚框的定义我们也可以将其分为Anc ...

  2. 阿里云CDN技术掌舵人文景:相爱相杀一路狂奔的这十年

    提到阿里云CDN,不得不提技术掌舵人姚伟斌(文景),虽然他不是团队中最"老"的同学,但他却历经了淘宝业务发展最为飞速的几年,见证了从最初服务淘宝和集团内部的CDN,到如今国内服务客 ...

  3. 人类一败涂地电脑版_iOS账号分享 |人类一败涂地 我们继续相爱相杀,PC大火游戏移植!...

    「 改变能改变的一切,接受不能改变的一切!」 ▼ PC 平台上爆火的多人物理益智游戏<人类一败涂地>(Human: Fall Flat)移动版正式登陆 iOS 和 Android 平台,游 ...

  4. 美团支付宝互探腹地 相爱相杀再度升级

    文章原创来自洞见网:http://www.localonline.com.cn/view/ec/735.html,转载请注明出处.​ 20年前,网络还未盛行,曾有人做过一场行为艺术"不出门, ...

  5. 无责任猜想#冰桶挑战#大佬们相爱相杀众生相

    看#冰桶挑战#大佬们点名的关系图谱,无意中发现很多有趣的关系啊,下面为八妹子自娱自乐无责任猜想,认真你就输了哦! 1.  微软谷歌苹果Facebook,老大哥.新小弟之间的相互厮杀 FACEBOOK的 ...

  6. 支付宝与微信转战刷脸支付,多年相爱相杀情归何处?

    说起阿里巴巴与腾讯,似乎怎么也绕不开马云跟马化腾. 两马同台,自是不同凡响. 有次,两人同台颁奖. 主持人问马云:"你们都信马,你觉得两人之间最显著的区别是什么?" 马云笑答:&q ...

  7. 30年「相爱相杀」 :30张照片回顾乔布斯和比尔盖茨之间「不得不说」的故事

    Python实战社群 Java实战社群 长按识别下方二维码,按需求添加 扫码关注添加客服 进Python社群▲ 扫码关注添加客服 进Java社群▲ 来源丨BI 来源公众号丨新智元(ID:AI_era) ...

  8. 30年「相爱相杀」 :30张照片回顾乔布斯和比尔盖茨之间「不得不说」的故事...

    Python实战社群 Java实战社群 长按识别下方二维码,按需求添加 扫码关注添加客服 进Python社群▲ 扫码关注添加客服 进Java社群▲ 来源丨BI 来源公众号丨新智元(ID:AI_era) ...

  9. 哥本哈根学派创始人:不会踢足球的物理学家不是一个牛逼的教育家,与爱因斯坦相爱相杀...

    要说史上最帅的物理学家是马克斯·普朗克,很多人是反对的,他们表示: 那今天,咱们就来说说这个建立了哥本哈根学派,拿过诺贝尔物理学奖,跟爱因斯坦相爱相杀的物理界男神玻尔! 尼尔斯·玻尔 足球?物理? 1 ...

最新文章

  1. Docker学习笔记之在开发环境中使用服务发现
  2. POJ 2799 IP Networks
  3. leetcode 面试题 17.21. 直方图的水量(单调栈)
  4. Too many files with unapproved license: 2 See RAT report
  5. Struts2 + MySQL 实现分页
  6. asp.net 子域跨域 带cookie
  7. 敏捷开发“松结对编程”实践之二:计划与设计篇(大型研发团队,学习型团队,139团队,师徒制度,设计评审,预想陈述,共同估算,扑克牌估算)...
  8. java计算课程学分绩点_【Java爬虫】爬取南通大学教务系统成绩计算绩点
  9. NYOJ ~ 58 ~ 最小步数(BFS)
  10. java applet运行jmx,通过tomcat设置jvm及添加jmx远程访问、gc输出日志
  11. gbk编码在线转换工具_珍藏的4个PDF格式转换网站「在线工具,无需下载,还免费哦。」...
  12. 【C++】atoi与stoi
  13. Swiper:基础学习
  14. 数据结构 严蔚敏 习题总结
  15. URI和URL差别以及相对路径和绝对路径的差别
  16. 半部秘籍--分类、回归、集成与无监督
  17. C语言数组相似度比对,C语言实验报告:碱基相似度比较
  18. Bellman_Ford模版
  19. 最近喜欢的几款乐器和民谣
  20. linux:framebuffer驱动之ssd1363驱动和fbtft驱动修改

热门文章

  1. 上海交大计算机专业报录比,上海交通大学2020硕士研究生各学院各专业报录比汇总!含数据分析...
  2. 谷歌2012年I/O
  3. 局域网的网络硬件主要包括有什么
  4. Java程序员,面试阿里Java开发你必需要先理解的题库!
  5. 关于运动控制中S型速度曲线的简单演示(C++实现)
  6. 一些软件测试与C语言面试题
  7. 【Cubase】Cubase编曲时声卡没有声音的解决方法
  8. 牛客 旋变字符串问题
  9. java 电池类类代码举例_教案:Java第7章 类的方法
  10. 眼里有光:从1到N次的路演启示