上次已经和大家分享了因果推断中的贝叶斯相关知识,今天这部分和大家分享因果推断中的混杂因子,D-分离,后门准则的相关内容。

先上例子

以上一篇中的诺贝尔奖和巧克力的事件为例,下图是他们三者的因果图,从图中可以看出这是一个叉式结构,即A和C相关。但是他们的相关性是通过“经济,教育水平”关联的,他们之间是伪相关,而B就是混杂因子,是它造成了A和C之间的伪相关。从字面上也很好理解,是因为B的存在导致我们对A和C之间的因果关系产生了混乱。

下图这种形式B也是confunder,即混杂因子。这种情况下,我们想要去发掘A和C的因果关系时,需要去除混杂因子,因为A->C的因果关系和A<-B->C造成的伪相关混合在一起了。

为了能正确分析因果关系,我们需要消除混杂,伪相关。

条件独立与D-分离

在因果推断(一)中,我们介绍了三种结构。链式结构和叉式结构中的A和C相关都是因为B的存在,因此如果B是确定的某一个值,那么A和C就以B为条件独立了,即

。而对于对撞结构,刚好相反,在对撞结构中A和C是独立的,当B的值确定后,以B为条件,A和C就相关了。链式结构和叉式结构的比较好理解,对撞结构的可能会比较难理解,这里举个例子:

这个例子不一定符合事实,单纯为了理解这个结构。假设A为是否不运动,C为是否吃垃圾食品,B为是否肥胖。那么在对撞结构中,我们想要确定这个人是否肥胖需要知道他是否运动,以及是否吃垃圾食品。当知道B为肥胖时,如果我们知道A为不运动则可以推断出C为吃垃圾食品,即A和C在条件B下相关。而如果B的答案未知,那么A和C就没有关系,即是否运动和是否吃垃圾食品没有关系。

在因果关系领域,这种判断是否条件独立的方法被称为D-分离

D-分离可以被定义为:假如链式结构的中间节点在节点集合E中,或者叉式结构的节点在节点集E中,或对撞结构的中间节点不在节点集合E中也不在其子孙节点中,则该路径被E节点D-分离了。如果A到C的每条路径都被E节点集合中的节点阻断了,则A和C被D-分离。

后门准则

消除伪相关的一种方法是采用后门准则。图2中A->C为前门路径,A<-B->C为后门路径。后门准则就是将A和C之间的后门路径都阻断,从而得到A和C之间真正的因果关系。

简单总结

形如叉式结构的容易造成伪相关,A<-B->C,A<-B<-D->C这两个结构中A和C之间都存在混杂,结合D-分离方法,第一个结构可以通过以B为条件消除混杂,第二个结构可以以B或D为条件消除混杂。在消除混杂的时候我们需要关注的是对于哪两个变量来说,即从第二个结构来说,如果我们以B为条件可以得到A和B<-D->C,A和C之间的伪相关是可以消除的,但是B和C之间貌似还存在着伪相关。因此伪相关的消除,我们需要关注是去消除哪两个变量之间的伪相关。

更多内容可以关注我的公众号“秋枫学习笔记”

因果推断(二)——混杂因子,D-分离,后门准则相关推荐

  1. 因果推断(二)-Causal effect 因果效应推理

    1.因果效应推理定义 套用一个发券和购买转化率的关系,已知发优惠券与购买转化率有因果关系,发优惠券是因,购买转化率是果,我们想知道,当发券的情况下,购买转化率会增加多少? 2.因果效应推理估计对象 估 ...

  2. 因果推断笔记——自整理因果推断理论解读(七)

    之前有整理过一篇:因果推断笔记-- 相关理论:Rubin Potential.Pearl.倾向性得分.与机器学习异同(二) 不过,那时候刚刚开始学,只能慢慢理解,所以这边通过一轮的学习再次整理一下手里 ...

  3. 因果推断会是下一个AI热潮吗?朱迪亚•珀尔新作《因果论》重磅上市!

    从"大数据时代和机器学习热潮"到"第二次因果革命",从以数据为中心到数据理解的转变不仅涉及技术上的转变,还意味着更加深刻的范式转换. 因果关系理论与现有机器学习 ...

  4. 因果推断学习笔记(一)——反事实推理中的归因问题

    文章目录 前言 一.问题描述 二."必要性概率"PN的求解 1. 单调性情况下 2. 非单调性情况下 三.案例分析 总结 前言 考虑这样一个情景,A先生早晨来到工位上,边摘下口罩边 ...

  5. 因果推断——借微软EconML测试用DML和deepIV进行反事实预测实验(二十五)

    文章目录 1 导言 1.1 KDD2021:盒马-融合反事实预测与MDP模型的清滞销定价算法 1.2 本篇想法 1.3 其他一些问题追踪 2 代码 2.1 数据生成 2.2 DML模型:有干预下的Y增 ...

  6. 因果推断与反事实预测——盒马KDD2021的一篇论文(二十三)

    文章目录 1 已有研究者的描述 1.1 YuyangZhangFTD 1.1.1 Introduction 1.1.2 Problem Formulation 1.1.3 Counterfactual ...

  7. 因果推断笔记——因果图建模之Uber开源的CausalML(十二)

    它提供了一个标准框架,允许用户从实验或观察数据估计条件平均治疗效果(CATE)或个人治疗效果(ITE).本质上,它估计了干预T对具有观察到的特征X的用户结果Y的因果影响,而没有对模型形式有很强的假设. ...

  8. [因果推断] 倾向得分Propensity Score 原理(二)

    目录 一 前置知识 干预效果 Treatment Effect Randomized Controlled Trials(RCT) Observational Studies ATT Average ...

  9. 因果推断笔记——DR :Doubly Robust学习笔记(二十)

    文章目录 0 观测数据的估计方法 0.1 Matching 0.2 Propensity Score Based Methods 0.2.1 PSM 0.2.2 IPW 0.2.3 Doubly Ro ...

最新文章

  1. 01基于配置文件方式的SpringMVC,三种HandlerMapping,三种控制器
  2. CI框架源码阅读笔记4 引导文件CodeIgniter.php
  3. python scrapy框架爬虫_Python Scrapy爬虫框架
  4. hibernate get方法有执行sql但是后台拿不到_「6」进大厂必须掌握的面试题-Hibernate...
  5. Google 不要 Android 了?新系统 Fuchsia 或将支持 Java
  6. 计算机英语900句.pdf,计算机英语900句第一章第一课:概貌
  7. 火狐浏览器怎么安装未经认证的附加组件
  8. linux中printf命令,总结linux下printf命令的用法
  9. ubuntu下载android11源码
  10. 使用批处理实现分组多用户的创建和权限分配
  11. 那个幻想奇特的诗意女孩
  12. 12月的第一天!给你一个11月回血指南!
  13. 微信自定义分享卡片链接的解决方案(可自定义标题 描述 缩列图)
  14. python两个等于号是代表什么_python两个等于号是什么意思_等于号表示什么意思...
  15. 鸿蒙三部曲 吞噬星空,我吃西红柿最新作品竟然是它?看来鸿蒙金榜第四名已有归属...
  16. 家庭宽带服务器有什么作用,服务器用的宽带和家用宽带有什么区别?
  17. python去除数据集里空格_Python将文本去空格并保存到txt文件中
  18. 汽车的一类、二类、三类、四类底盘是怎么划分的?
  19. 计算机毕设(附源码)JAVA-SSM建筑工地环保监控系统研究
  20. 自建对象存储 minio 搭建和使用

热门文章

  1. 权限管理系统3—集成MyBatis框架
  2. Kepware助力宾夕法尼亚大学实现校园运营管理
  3. NetConf简介之一篇文章读懂NetConf
  4. NETCONF —— 格式化 NETCONF 回显内容
  5. 计算机主板上实时时钟晶振频率为,电脑主板里的晶振才是网络时代发展的根源...
  6. 云服务器(云数据库)连接Mysql数据库【超详细-少踩雷】
  7. 三维空间长度温度数量_我就随便问问:有多少人知道三维在物理上指的不是长宽高?...
  8. UE5项目设置必须开启光晕时,某一场景关闭光晕的方法
  9. ARFoundation+Unity中遇到的问题
  10. mysql 数据倾斜 索引_索引,索引优化,mysql索引失效场景