第四章 混杂和去混杂:或者,消灭潜伏变量

CHAPTER 4 — Confounding and Deconfounding: Or, Slaying the Lurking Variable

  • 当一个变量同时影响到选择接受处理的对象以及实验结果时,混杂偏倚就产生了。(115)⭐

  • 如上图所示,位于叉接合中心的变量Z就是X和Y的混杂因子。真正的因果效应X->Y与由叉接合X<-Z->Y诱导的X和Y之间的伪相关混合在一起。(115)

  • 本章的目标之一就是从因果图的角度来解释,为什么随机对照实验能估计出X->Y的因果效应,同时免除混杂偏倚的影响。因果图使分析重心从混杂因子向去混杂因子的转变成为可能(117)

  • 因果革命允许我们超越费舍尔的随机对照实验,通过非实验性研究推断因果效应,其主要途径就来自这种分析重点的转变。(117)

  • “后门准则”(back-door criterion)可以明确识别出因果图中哪些变量是去混因子。(118)

  • 目前的普遍共识:(1)混杂需要,也具备一个因果解决方案;(2)因果图提供了一种完整的、系统的方法引领我们找到那个解决方案。(118)

对混杂的长期恐惧

  • 掌握既定结论背后的假设比试图用随机对照试验来规避这些假设更有价值。且随机对照试验本身也由局限性。(120)

对自然的巧妙询问:随机对照试验为何有效

混杂的新范式

  • 已知条件概率P(Y | X)、X与Y之间的因果关系P(Y | do(X)),混杂可定义为导致P(Y | X) ≠ P(Y | do(X)),即两个概率出现差异的所有因素。(127)
  • “后门准则”将定义混杂、识别混杂因子和根据混杂因子进行统计调整这些问题变成了一个简单的过程。(133)

do算子和后门准则⭐(本节有很多图示例子可参考学习)

  • 可以将链接看作一个管道,找个管道将信息从起点X传递到终点Y。(133)

  • 事实上,非因果路径是混杂的根源。(之前将混杂定义为任何使得P(Y | X) ≠ P(Y | do(X))的因素),do算子会清除指向X的所有箭头,这样它就可以防止有关X的任何信息在非因果方向流动。(133)

  • 需要牢记的一条基本规则:(134)

    控制一个变量的后代节点(或替代物)如同“部分地”控制变量本身;

    控制一个中介物的某个后代节点意味着部分的关闭了信息管道;

    控制一个对撞变量的某个后代节点意味着部分地打开了信息管道。

  • A <— B <— C —> D <— E —> F —> G <— H —> I —> J

    如上面的因果图,如果这条路径的一个接合被阻断,那么J就无法通过这条路径“找到”A。

    因此有很多办法阻断A和J之间的信息流通:控制B、控制C、不控制D、控制E、控制F、不控制G、控制H、控制I等,并且只需要做到一项就足够了。这就是为什么常规的统计过程——控制我们可以测量的一切,造成了如此严重的误导。

    事实上,对上图所示的路径来说,在不控制任何变量的前提下,这条路径本身就算被阻断的!D和G的对撞在没有任何外部帮助的情况下阻断了这条路径。而控制D和G将打开这条路径,使A和J能完成信息流通。(134)

  • 更确切地说,后门准则(back-door criterion)定义为所有X和Y之间以指向X的箭头为开始的路径;如果阻断了后门路径(这些路径允许X和Y之间的伪相关信息在管道中流动),就完成了对X和Y的去混杂。

    如果试图通过控制某一组变量Z来实现这一点,还需要确保Z的任何成员都不是X的后代,否则可能部分或完全地关闭这条X和Y之间地因果路径。(135)

  • “M偏倚”指出了传统方法的一个错误:仅仅因为某个变量与X和Y都相关就将该变量视为混杂因子是错误的。(137)

  • 混杂问题的完整解决方案是因果革命的主要两点之一。(140)

《THE BOOK OF WHY: THE NEW SCIENCE OF CAUSE AND EFFECT》

——JUDEA PEARL AND DANA MACKENZIE

《The Book of Why》 — Chapter4相关推荐

  1. 《机器学习算法竞赛实战》-chapter4特征工程

    <机器学习算法竞赛实战>学习笔记,记录一下自己的学习过程,详细的内容请大家购买作者的书籍查阅. 特征工程 特征工程是算法竞赛中工作量最大,决定参赛者能否拿到较好名次的关键部分.吴恩达老师说 ...

  2. 显微镜下的大明内容_《显微镜下的大明》epub、mobi、azw3

    <显微镜下的大明>电子书 作者: 马伯庸 出版社: 湖南文艺出版社 出品方: 博集天卷 出版年: 2019-1 页数: 344 定价: 52.00元 装帧: 平装 丛书: 博集天卷·马伯庸 ...

  3. MySQL数据库实用教程考核_《MySQL数据库实用教程》郑明秋,蒙连超,赵海侠【pdf】...

    内容简介 郑明秋.蒙连超.赵海侠主编的<MySQL数据库实用教程>是作者在多年的数据库开发实践与教学经验的基础上,根据计算机相关专业的职业岗位能力需求及学生的认知规律倾心组织编写的.本教材 ...

  4. axure 模板_《惢客创业日记》2019.09.03(周二) 用Axure管理项目流程

    今天,花了一整天的时间,搭建了一个本地服务器,并且,把Axure生成的网页系统部署在了IIS上.之所以,用Axure来把整个项目的资源做一个汇总,主要目的有三个: 第一.用Axure实现基于网页的项目 ...

  5. GitHub分享《深度学习500问》优质资源

    GitHub分享的<深度学习500问>,以问答形式对常用的概率知识.线性代数.机器学习.深度学习.计算机视觉等热点问题进行阐述,以帮助自己及有需要的读者. GitHub网址参见:https ...

  6. 《UNIX高级环境编程》 -- apue.h

    在看<UNIX高级环境编程>这本书的时候,会遇到一个问题就是这个"apue.h",这个是作者为了编写代码方便封装了一个库,我们可以使用下面的方式解决这个问题,让我们的代 ...

  7. 老李推荐:第14章4节《MonkeyRunner源码剖析》 HierarchyViewer实现原理-装备ViewServer-端口转发 1...

    老李推荐:第14章4节<MonkeyRunner源码剖析> HierarchyViewer实现原理-装备ViewServer-端口转发 在初始化HierarchyViewer的实例过程中, ...

  8. 《Java: The Complete Reference》等书读书笔记

    春节期间读了下<Java: The Complete Reference>发现这本书写的深入浅出,我想一个问题,书中很多内容我们也知道,但是为什么我们就写不出这样一本书,这么全面,这么系统 ...

  9. 《深入理解Java虚拟机》(第二版)学习3:垃圾收集器

    垃圾收集器 如果说收集算法是内存回收的方法论,那么垃圾收集器就是内存回收的具体实现. 我们这里讨论的收集器主要是基于JDK 1.7 Update 14之后的 Hotspot VM . Serial 收 ...

最新文章

  1. 3.1 A Historical Perspective 历史观点
  2. C#的ApartmentState的属性:[STAThread]
  3. 18张难以置信的照片,封面这张你就没见过
  4. linux c语言编程内嵌汇编,gcc编译c语言中内嵌汇编
  5. 网络基础2(分层模型,通信过程,以太网,ARP协议格式和具体功能详解)
  6. Linux后台运行jar不产生nohup.out
  7. azure云数据库_在Azure SQL数据库中配置多重身份验证
  8. TensorFlow版本的HelloWord
  9. 使用Eclipse构建Maven项目 (step-by-step) (转收藏)
  10. Luogu P2595 [ZJOI2009]多米诺骨牌 容斥,枚举,插头dp,轮廓线dp
  11. 如何生成随机数(上)
  12. Hexo 添加百度统计
  13. 解决天正M_批打印没有天正的打印格式(TArch20V6.ctb)的问题
  14. 使用TypeScript两年后,还值得吗?
  15. Java实现欧姆龙Fins协议(推荐用springboot)
  16. 为什么中国的游戏没有做出像欧美那种自由度很高的RPG游戏?
  17. 树莓派系统最新系统镜像Bullseye更换镜像源
  18. new(创建)一个对象时都发生了什么?
  19. Go 函数式编程实战
  20. 三容水箱液位控制系统_三容水箱液位控制系统的设计与仿真

热门文章

  1. 学以致用,光棍极客通过大数据搞定女朋友
  2. 2022暑期杭电第九场
  3. 多线程下 redis阻塞线程
  4. RocketMQ消息发送常见错误与解决方案
  5. JAVA 堆栈的区别
  6. 如何构建满足信创需求的数据库云一体机?
  7. signature=4f0a1c9773fc07031e260b016c514c92,针对协同过滤推荐系统的推举托攻击研究
  8. JSP include指令与动作的 相应时间对比
  9. 欧盟REACH认证法规跟新至224项
  10. 嵌入式linux哪个版本,嵌入式Linux的主流版本及开发商