因果推断(二)——混杂因子,D-分离,后门准则
上次已经和大家分享了因果推断中的贝叶斯相关知识,今天这部分和大家分享因果推断中的混杂因子,D-分离,后门准则的相关内容。
先上例子
以上一篇中的诺贝尔奖和巧克力的事件为例,下图是他们三者的因果图,从图中可以看出这是一个叉式结构,即A和C相关。但是他们的相关性是通过“经济,教育水平”关联的,他们之间是伪相关,而B就是混杂因子,是它造成了A和C之间的伪相关。从字面上也很好理解,是因为B的存在导致我们对A和C之间的因果关系产生了混乱。
下图这种形式B也是confunder,即混杂因子。这种情况下,我们想要去发掘A和C的因果关系时,需要去除混杂因子,因为A->C的因果关系和A<-B->C造成的伪相关混合在一起了。
为了能正确分析因果关系,我们需要消除混杂,伪相关。
条件独立与D-分离
在因果推断(一)中,我们介绍了三种结构。链式结构和叉式结构中的A和C相关都是因为B的存在,因此如果B是确定的某一个值,那么A和C就以B为条件独立了,即
。而对于对撞结构,刚好相反,在对撞结构中A和C是独立的,当B的值确定后,以B为条件,A和C就相关了。链式结构和叉式结构的比较好理解,对撞结构的可能会比较难理解,这里举个例子:
这个例子不一定符合事实,单纯为了理解这个结构。假设A为是否不运动,C为是否吃垃圾食品,B为是否肥胖。那么在对撞结构中,我们想要确定这个人是否肥胖需要知道他是否运动,以及是否吃垃圾食品。当知道B为肥胖时,如果我们知道A为不运动则可以推断出C为吃垃圾食品,即A和C在条件B下相关。而如果B的答案未知,那么A和C就没有关系,即是否运动和是否吃垃圾食品没有关系。
在因果关系领域,这种判断是否条件独立的方法被称为D-分离。
D-分离可以被定义为:假如链式结构的中间节点在节点集合E中,或者叉式结构的节点在节点集E中,或对撞结构的中间节点不在节点集合E中也不在其子孙节点中,则该路径被E节点D-分离了。如果A到C的每条路径都被E节点集合中的节点阻断了,则A和C被D-分离。
后门准则
消除伪相关的一种方法是采用后门准则。图2中A->C为前门路径,A<-B->C为后门路径。后门准则就是将A和C之间的后门路径都阻断,从而得到A和C之间真正的因果关系。
简单总结
形如叉式结构的容易造成伪相关,A<-B->C,A<-B<-D->C这两个结构中A和C之间都存在混杂,结合D-分离方法,第一个结构可以通过以B为条件消除混杂,第二个结构可以以B或D为条件消除混杂。在消除混杂的时候我们需要关注的是对于哪两个变量来说,即从第二个结构来说,如果我们以B为条件可以得到A和B<-D->C,A和C之间的伪相关是可以消除的,但是B和C之间貌似还存在着伪相关。因此伪相关的消除,我们需要关注是去消除哪两个变量之间的伪相关。
更多内容可以关注我的公众号“秋枫学习笔记”
因果推断(二)——混杂因子,D-分离,后门准则相关推荐
- 因果推断(二)-Causal effect 因果效应推理
1.因果效应推理定义 套用一个发券和购买转化率的关系,已知发优惠券与购买转化率有因果关系,发优惠券是因,购买转化率是果,我们想知道,当发券的情况下,购买转化率会增加多少? 2.因果效应推理估计对象 估 ...
- 因果推断笔记——自整理因果推断理论解读(七)
之前有整理过一篇:因果推断笔记-- 相关理论:Rubin Potential.Pearl.倾向性得分.与机器学习异同(二) 不过,那时候刚刚开始学,只能慢慢理解,所以这边通过一轮的学习再次整理一下手里 ...
- 因果推断会是下一个AI热潮吗?朱迪亚•珀尔新作《因果论》重磅上市!
从"大数据时代和机器学习热潮"到"第二次因果革命",从以数据为中心到数据理解的转变不仅涉及技术上的转变,还意味着更加深刻的范式转换. 因果关系理论与现有机器学习 ...
- 因果推断学习笔记(一)——反事实推理中的归因问题
文章目录 前言 一.问题描述 二."必要性概率"PN的求解 1. 单调性情况下 2. 非单调性情况下 三.案例分析 总结 前言 考虑这样一个情景,A先生早晨来到工位上,边摘下口罩边 ...
- 因果推断——借微软EconML测试用DML和deepIV进行反事实预测实验(二十五)
文章目录 1 导言 1.1 KDD2021:盒马-融合反事实预测与MDP模型的清滞销定价算法 1.2 本篇想法 1.3 其他一些问题追踪 2 代码 2.1 数据生成 2.2 DML模型:有干预下的Y增 ...
- 因果推断与反事实预测——盒马KDD2021的一篇论文(二十三)
文章目录 1 已有研究者的描述 1.1 YuyangZhangFTD 1.1.1 Introduction 1.1.2 Problem Formulation 1.1.3 Counterfactual ...
- 因果推断笔记——因果图建模之Uber开源的CausalML(十二)
它提供了一个标准框架,允许用户从实验或观察数据估计条件平均治疗效果(CATE)或个人治疗效果(ITE).本质上,它估计了干预T对具有观察到的特征X的用户结果Y的因果影响,而没有对模型形式有很强的假设. ...
- [因果推断] 倾向得分Propensity Score 原理(二)
目录 一 前置知识 干预效果 Treatment Effect Randomized Controlled Trials(RCT) Observational Studies ATT Average ...
- 因果推断笔记——DR :Doubly Robust学习笔记(二十)
文章目录 0 观测数据的估计方法 0.1 Matching 0.2 Propensity Score Based Methods 0.2.1 PSM 0.2.2 IPW 0.2.3 Doubly Ro ...
最新文章
- 01基于配置文件方式的SpringMVC,三种HandlerMapping,三种控制器
- CI框架源码阅读笔记4 引导文件CodeIgniter.php
- python scrapy框架爬虫_Python Scrapy爬虫框架
- hibernate get方法有执行sql但是后台拿不到_「6」进大厂必须掌握的面试题-Hibernate...
- Google 不要 Android 了?新系统 Fuchsia 或将支持 Java
- 计算机英语900句.pdf,计算机英语900句第一章第一课:概貌
- 火狐浏览器怎么安装未经认证的附加组件
- linux中printf命令,总结linux下printf命令的用法
- ubuntu下载android11源码
- 使用批处理实现分组多用户的创建和权限分配
- 那个幻想奇特的诗意女孩
- 12月的第一天!给你一个11月回血指南!
- 微信自定义分享卡片链接的解决方案(可自定义标题 描述 缩列图)
- python两个等于号是代表什么_python两个等于号是什么意思_等于号表示什么意思...
- 鸿蒙三部曲 吞噬星空,我吃西红柿最新作品竟然是它?看来鸿蒙金榜第四名已有归属...
- 家庭宽带服务器有什么作用,服务器用的宽带和家用宽带有什么区别?
- python去除数据集里空格_Python将文本去空格并保存到txt文件中
- 汽车的一类、二类、三类、四类底盘是怎么划分的?
- 计算机毕设(附源码)JAVA-SSM建筑工地环保监控系统研究
- 自建对象存储 minio 搭建和使用
热门文章
- 权限管理系统3—集成MyBatis框架
- Kepware助力宾夕法尼亚大学实现校园运营管理
- NetConf简介之一篇文章读懂NetConf
- NETCONF —— 格式化 NETCONF 回显内容
- 计算机主板上实时时钟晶振频率为,电脑主板里的晶振才是网络时代发展的根源...
- 云服务器(云数据库)连接Mysql数据库【超详细-少踩雷】
- 三维空间长度温度数量_我就随便问问:有多少人知道三维在物理上指的不是长宽高?...
- UE5项目设置必须开启光晕时,某一场景关闭光晕的方法
- ARFoundation+Unity中遇到的问题
- mysql 数据倾斜 索引_索引,索引优化,mysql索引失效场景