目录

  • 因果关系之梯
  • 因果图的路径结构
  • 阻断
  • d-分离
  • 混杂
  • 结构因果模型(SCM)

版权:转载前请联系作者获得授权。
声明:部分内容出自因果关系之梯,已获得原作者授权。
参考书籍:《The Book of Why》——Judea Pearl

因果关系之梯

因果关系之梯可以分为三个层次(由低到高):

  1. 关联 :X和Y是否相关,有没有互相影响。
  2. 干预:如果改变X,Y会有什么变化?
  3. 反事实:如果想让Y发生变化,能否通过改变X来实现?

因果图的路径结构

因果图的路径结构可以分为三种:

  1. 链式:X -> Z -> Y
  2. 叉式:X <- Z -> Y
  3. 对撞:X -> Z <- Y

在两种情况下,节点之间具有相关性(不相互独立):

  1. 有信息从一个节点流向另一个节点,如链式中的X和Y;
  2. 有相同节点的信息流向这两个节点,如叉式中的X和Y。

阻断

定义:在一条路径中,在不以任何节点为条件的前提下,当且仅当两条箭头在某个变量处对撞时,称该路径被阻断,该变量称为对撞子

  • 在链式路径和叉式路径中,X和Y是相关的,但是如果以Z为条件(也称为“控制Z”),考虑(X | Z)和(Y | Z),它们是不相关的。这是由于X和Y之间的路径被阻断了。
  • 在对撞路径中,X和Y是不相关的,但是如果以Z为条件,考虑(X | Z)和(Y | Z),它们是相关的。这是由于原本阻断的路径被打开了。

d-分离

定义:假设N为节点集,如果一条路径满足下面三种情况的至少一种,则称该路径被N(节点集)d-分离。

  1. 路径包含链式接合X -> Z -> Y,且Z∈N;
  2. 路径包含叉式接合X <- Z -> Y,且Z∈N;
  3. 路径包含对撞接合X -> Z <- Y,且Z∉{N∪N的子孙节点}。
    更一般地,如果节点N阻断了X -> Y之间的每条路径,则称X和Y被N(节点)d-分离。

d-分离法则

  1. 非对撞子为条件时,包含该节点的路径被阻断;
  2. 对撞子为条件时,由于该对撞子造成的阻断会解除;
  3. 对撞子的子孙为条件时,由于该对撞子造成的阻断会解除。

混杂

定义:任何使P(Y∣do(X))P(Y|do(X))P(Y∣do(X))不同于P(Y∣X)P(Y|X)P(Y∣X)的因素。
例子:下图中,Z就是X和Y之间的混杂因子。

结构因果模型(SCM)

SCM用于对因果推断过程建模。在SCM中,包含外生变量集合U、内生变量集合V和函数集合F。

  • 外生变量:表示模型没有考虑到的一些因素,如:噪声、不确定性等。图中的U1和U2都是外生变量。
  • 内生变量:主要要研究的变量,图中的X和Y都是内生变量。
  • 函数:外生变量与内生变量之间的计算关系,图中右侧的两个式子即为函数。
  • 单向箭头:表示两个变量之间存在直接的因果关系。
  • 双向箭头:表示两个变量之间存在未知的混杂因素。

因果推断 - 基础知识相关推荐

  1. 因果推断笔记——自整理因果推断理论解读(七)

    之前有整理过一篇:因果推断笔记-- 相关理论:Rubin Potential.Pearl.倾向性得分.与机器学习异同(二) 不过,那时候刚刚开始学,只能慢慢理解,所以这边通过一轮的学习再次整理一下手里 ...

  2. 留言赠书|因果推断与机器学习,终于有本书能讲明白啦!

    随着大数据时代的来临,机器学习技术突飞猛进,并且在人类社会中扮演越来越重要的角色. 例如,你可能已经习惯了每天使用谷歌.百度.Bing等搜索引擎查找信息,或者在电商网站和视频网站的推荐系统 ,以及利用 ...

  3. 因果推断综述-基础知识2

    这一节是文章中第二部分基础知识.这一节公式较多,会影响阅读时效. 2.3假设 为了估计治疗效果,在因果推断文献中通常使用以下假设. 假设2.1  稳定的unit治疗价值假设(SUTVA) 任何unit ...

  4. AI研习丨专题:因果推断与因果性学习研究进展

    来源:<中国人工智能学会通讯> 2020年  第10卷  第5期  机器学习及其应用专题 0 引言 因果关系一直是人类认识世界的基本方式和现代科学的基石.爱因斯坦就曾指出,西方科学的发展是 ...

  5. 因果推断 - 反事实

    目录 基础知识 案例实战 版权:转载前请联系作者获得授权. 声明:部分内容出自因果关系之梯,已获得原作者授权. 参考书籍:<The Book of Why>--Judea Pearl 基础 ...

  6. 【推荐实践】因果推断在阿里文娱用户增长中的应用

    分享嘉宾:天师 阿里文娱 高级算法专家 编辑整理:Hoh 内容来源:阿里文娱技术 出品平台:DataFunTalk 导读:如何实现产品的用户增长?显然,这是各家移动互联网应用的头等大事,也是悬在各家业 ...

  7. 因果推断与反事实预测——盒马KDD2021的一篇论文(二十三)

    文章目录 1 已有研究者的描述 1.1 YuyangZhangFTD 1.1.1 Introduction 1.1.2 Problem Formulation 1.1.3 Counterfactual ...

  8. 因果推断笔记——数据科学领域因果推断案例集锦(九)

    文章目录 1 腾讯看点:启动重置问题 1.1 观测数据 . 实验数据的理论介绍 2.2 启动重置问题阐述:短期.长期.异质 2.3 短期影响的解决 2.4 长期影响构造准实验 2.5 异质性用户 1. ...

  9. hawk大数据基础知识总结(1)

    一.大数据概述 1.1大数据的概念 大数据一共具有三个特征:(1)全样而非抽样:(2)效率而非精确:(3)相关而非因果. (1)在过去由于缺乏获取全体样本的手段,人们发明了"随机调研数据&q ...

最新文章

  1. 视频中的运动特征--Learning Motion Patterns in Videos
  2. RMAN异机复制数据库(不同路径)
  3. oracle存储照片,[oracle]中存储图片
  4. python3.5安装tensorflow_pip install tensorflowgpu在python3.5中的安装
  5. 《Python Cookbook 3rd》笔记(1.3):保留最近N个元素
  6. linux下mysql主从同步是主从i/o线程显示为no_mysql主从同步IO线程NO
  7. perl语言学习笔记(3)列表与数组、子程序’、参数
  8. APP 自动化测试封装结构模式
  9. 词汇的积累 —— 同义反复、写景状物
  10. QComboBox使用方法,QComboBox详解
  11. 背景减法——自组织算法
  12. 2011-5-学习总结
  13. 华云数据收购国际超融合软件厂商Maxta全部资产
  14. Matlab中求解总体标准差和样本标准差的区别(std函数)
  15. VS2010 旗舰版和专业版 下载
  16. 【CAS】CAS原理
  17. 【历史上的今天】10 月 24 日:1024 程序员节;中文维基百科上线;iPad mini 诞生十周年
  18. Yahoo的Spark实践
  19. Docker 中文文档(译)
  20. 【React】React全家桶(八)React Router 6

热门文章

  1. 无盘服务器怎么修改ip,怎么进入无盘服务器修改IP地址呢
  2. dev c++怎么调试_「正点原子NANO STM32开发板资料连载」第十八章 USMART 调试组件...
  3. WinForm之创建word并操作文档
  4. FFmpg音视频入门教程
  5. 为了输出“,可以使用如下语句print(“““)————(×)
  6. python 中的序列
  7. python 中的 for-else 和 while-else 语句
  8. 【快乐水题】997. 找到小镇的法官
  9. Java修饰符:public,protected,private,不加修饰符的区别
  10. Python实例 -- .git格式转为.png格式