目录

  • 基础知识
  • 案例实战

版权:转载前请联系作者获得授权。
声明:部分内容出自因果关系之梯,已获得原作者授权。
参考书籍:《The Book of Why》——Judea Pearl

基础知识

定义:对于包含外生变量UUU和内生变量XXX和YYY的SCM,形如YX=x(U=u)=yY_{X=x}(U=u)=yYX=x​(U=u)=y表示“在U=uU=uU=u的情况下,如果X=xX=xX=x,则Y=yY=yY=y”。其中,YX=x(U=u)=yY_{X=x}(U=u)=yYX=x​(U=u)=y可以简写为Yx(u)=yY_x(u)=yYx​(u)=y。

反事实分析的一般步骤

  1. 外展。基于数据对外生变量UUU进行估算。
  2. 干预。利用dododo算子改变模型(删除指向XXX的箭头),得到新模型MxM_xMx​,反映我们提出的反事实假设。
  3. 预测。基于UUU和MxM_xMx​来计算结果。

以上三个步骤可以总结为:

因果推断第一定律:Yx(u)=YMx(u)Y_x(u)=Y_{M_x}(u)Yx​(u)=YMx​​(u)

反事实和干预的区别

  1. 表现形式:do(x)do(x)do(x) vs YxY_xYx​
  2. 对XXX进行干预,不会对XXX的子孙节点造成影响,而反事实会。

如何理解第2条?可以考虑如下因果图,P(Y∣do(x))P(Y|do(x))P(Y∣do(x))和P(Yx)P(Y_x)P(Yx​)的含义显然不同。

  • 计算P(Y∣do(x))P(Y|do(x))P(Y∣do(x))时,YYY的结果实际上和XXX的取值毫无关系,因为路径被ZZZ阻断了!
  • 计算P(Yx)P(Y_x)P(Yx​)时,会根据X=xX=xX=x对对应的ZZZ进行改动,进而得到YxY_xYx​。

案例实战

下面基于一个案例,加深对反事实分析的理解。
在下表中,学历共分为0,1,20,1,20,1,2三种,分别代表高中,本科,研究生。S0(u)S_0(u)S0​(u)表示雇员uuu在学历是高中时,现有的工资水平,S1(u)S_1(u)S1​(u)和S2(u)S_2(u)S2​(u)则是在本科和研究生学历下的工资水平。由于在工作时,每个人的学历已经固定,只会是高中、本科和研究生中的一种。故,对于每一个雇员,有两个工资的值为???,表示无法获得。

雇员 (u) 工龄 EX(u) 学历 ED(u) 工资 S0(u) 工资 S1(u) 工资 S2(u)
Alice 6 0 81000 ? ?
Bob 9 1 ? 92500 ?
Lucy 9 2 ? ? 97000
Daivd 8 1 ? 91000 ?
Est 12 1 ? 100000 ?
Flxs 13 0 97000 ? ?

现在,我们想要研究一个反事实问题——如果Alice的学历是本科,那么她的工资应为多少?即:通过上表中的数据,估算S1(Alice)S_1(Alice)S1​(Alice)。

在不使用反事实分析的情况下,我们或许可以采用线性回归,通过统计得到你和数据的最佳直线:

S=2500×EX+5000×ED+65000S=2500 \times EX + 5000 \times ED + 65000S=2500×EX+5000×ED+65000

并依此得出S1(Alice)=2500×6+5000×1+65000=85000S_1(Alice)=2500 \times 6 + 5000 \times 1 + 65000 = 85000S1​(Alice)=2500×6+5000×1+65000=85000

但是,上述方法有一个明显的弊端,即:对于任何雇员,如果他们的工龄和学历一致,则预测出的工资也是一致的!通过观察Bob和Lucy的工资,我们可以发现,这显然是不对的!

从表中可以看出,Bob和Lucy具有相同的工龄,但Bob的学历更低。那么,假如Lucy的学历和Bob一致,二人的工资应该一致吗?答案显然是否定的。因为,如果Lucy降低了学历,那么理论上她的工龄会比Bob更长,这会导致S1(Lucy)>S1(Bob)S_1(Lucy)>S_1(Bob)S1​(Lucy)>S1​(Bob)。

如何在模型中体现这一点呢?

从因果的角度出发,我们首先可以构建如下的因果图:

我们还是通过线性回归拟合最佳直线,但是和上文中稍有不同:

S=2500×EX+5000×ED+65000+USS=2500 \times EX + 5000 \times ED + 65000 + U_SS=2500×EX+5000×ED+65000+US​

同时,我们还需要一个(可能是)下式的方程:

EX=10−4×ED+UEXEX=10-4 \times ED + U_{EX}EX=10−4×ED+UEX​

有了这两个方程后,我们就可以根据反事实分析的三个步骤,计算S1(Alice)S_1(Alice)S1​(Alice):

  1. 根据数据估算出US=1000,UEX=−1U_S=1000, U_{EX} = -1US​=1000,UEX​=−1;
  2. 使用dododo算子修改Alice的学历;
  3. 根据US=1000,UEX=−1U_S=1000, U_{EX} = -1US​=1000,UEX​=−1计算出ED=2ED=2ED=2,再结合ED=1ED=1ED=1计算出S1(Alice)=76000S_1(Alice)=76000S1​(Alice)=76000。

因果推断 - 反事实相关推荐

  1. 机器学习hierarchical clustering_ICLR 2020 | 反事实因果理论如何帮助深度学习?

    以深度学习为代表的表示机器学习取得了巨大的成功,尤其是在特征提取的能力方面.但是与此同时,一个巨大的问题是深度神经网络的黑箱问题和不稳定性问题.其中的一个根本原因,是基于相关性的统计模型容易学习到数据 ...

  2. 因果推断、强化学习与理性人工智能奇点

    近年来,人工智能技术呈现加速发展的趋势,引发社会对其产生"智能爆炸",甚至超越人类,产生诸如隐私安全.数据独裁.算法偏见.机器权利等科技挑战与伦理困境,并可能对人类社会秩序造成严重 ...

  3. 因果推断——借微软EconML测试用DML和deepIV进行反事实预测实验(二十五)

    文章目录 1 导言 1.1 KDD2021:盒马-融合反事实预测与MDP模型的清滞销定价算法 1.2 本篇想法 1.3 其他一些问题追踪 2 代码 2.1 数据生成 2.2 DML模型:有干预下的Y增 ...

  4. 因果推断与反事实预测——盒马KDD2021的一篇论文(二十三)

    文章目录 1 已有研究者的描述 1.1 YuyangZhangFTD 1.1.1 Introduction 1.1.2 Problem Formulation 1.1.3 Counterfactual ...

  5. 因果推断(五)——反事实,后悔药?

    反事实推断一个词概括就是"后悔". 例子:"还是以小夏开店为例,小夏请了A明星代言后,销售量虽然有提升,但是由于该明星的代言费很贵,导致最终还是亏本了.于是,小夏想要是当 ...

  6. 因果推断学习笔记(一)——反事实推理中的归因问题

    文章目录 前言 一.问题描述 二."必要性概率"PN的求解 1. 单调性情况下 2. 非单调性情况下 三.案例分析 总结 前言 考虑这样一个情景,A先生早晨来到工位上,边摘下口罩边 ...

  7. 因果推断与反事实预测——几篇关联论文(二十六)

    有几篇关联的论文,如果论文开源代码了,笔者比较喜欢读+code练习,所以看这类文献比较慢,先Mark再精读了- 文章目录 1 Auto IV: Counterfactual Prediction vi ...

  8. 因果推断dowhy之-医学案例中的反事实分析

    0x01. 背景 在这个例子中,我们知道三个观察变量的因果结构,我们想得到一些反事实的问题,例如"如果我采用了医生的不同建议,会发生什么?" 更具体地说,患有严重眼干症的爱丽丝决定 ...

  9. 《因果学习周刊》第8期:因果反事实预测

    No.08 智源社区 因果学习组 因 果 学  习 研究 观点 资源 活动 关于周刊 因果学习作为人工智能领域研究热点之一,其研究进展与成果也引发了众多关注.为帮助研究与工程人员了解该领域的相关进展和 ...

最新文章

  1. R语言编写自定义函数自定义ggplot图像中的图例(legend)的位置、图例标题、键值、文本字体大小(title、text、key)、颜色标识的大小、点形状pch的大小
  2. 分分钟一键部署Zabbix Server
  3. Scala模拟Spark分布式计算流程示例代码
  4. Puzzle (II) UVA - 519
  5. 小程序读取几种不同格式json数据(小程序json解析)
  6. PowerPivot for Sharepoint 2010 配制及常见错误
  7. 【简介】操作系统概念
  8. 2008 r2 server 提权_Windows UAC 本地提权(CVE-2019-1388)
  9. 机器学习(三)——决策树(decision tree)算法介绍
  10. 第五次作业--原型设计(结对)
  11. xtrabackup备份还原的具体操作过程
  12. 小程序学习笔记(8)-导航组件
  13. html5 innerhtml标签,innerHTML、outerHTML与innerText、outerText
  14. 无法正常显示计算机,电脑Office Word文档图标无法正常显示怎么办
  15. 计算机键盘按不动怎么办,电脑键盘上档键怎么失灵
  16. 如何在企业微信网页授权链接中加入自定义参数
  17. 9860计算机测量程序,卡西欧9860测量放样程序-绘星
  18. 什么是微服务?一看就会系列!
  19. 计算机开机选择用户界面,Windows10每次开机都会出现选择操作系统界面的解决方法...
  20. netkeeper客户端_netkeeper

热门文章

  1. USTC English Club Note20171012(4)
  2. 科大星云诗社动态20201216
  3. 二、“究恒常之宇宙,成一家之学说”
  4. postman 400 bad request 原因_盐城400电话
  5. CFNet:End-to-end representation learning for Correlation Filter based tracking
  6. 一个简单的反向连接服务程序
  7. 从用户接触到完成需求说明书
  8. 使用cmake重写live555工程-附源码和视频教程
  9. shell逐行读取每一列
  10. 程序员面试系列——有符号数的溢出