因果推断 - 基础知识
目录
- 因果关系之梯
- 因果图的路径结构
- 阻断
- d-分离
- 混杂
- 结构因果模型(SCM)
版权:转载前请联系作者获得授权。
声明:部分内容出自因果关系之梯,已获得原作者授权。
参考书籍:《The Book of Why》——Judea Pearl
因果关系之梯
因果关系之梯可以分为三个层次(由低到高):
- 关联 :X和Y是否相关,有没有互相影响。
- 干预:如果改变X,Y会有什么变化?
- 反事实:如果想让Y发生变化,能否通过改变X来实现?
因果图的路径结构
因果图的路径结构可以分为三种:
- 链式:X -> Z -> Y
- 叉式:X <- Z -> Y
- 对撞:X -> Z <- Y
在两种情况下,节点之间具有相关性(不相互独立):
- 有信息从一个节点流向另一个节点,如链式中的X和Y;
- 有相同节点的信息流向这两个节点,如叉式中的X和Y。
阻断
定义:在一条路径中,在不以任何节点为条件的前提下,当且仅当两条箭头在某个变量处对撞时,称该路径被阻断,该变量称为对撞子。
- 在链式路径和叉式路径中,X和Y是相关的,但是如果以Z为条件(也称为“控制Z”),考虑(X | Z)和(Y | Z),它们是不相关的。这是由于X和Y之间的路径被阻断了。
- 在对撞路径中,X和Y是不相关的,但是如果以Z为条件,考虑(X | Z)和(Y | Z),它们是相关的。这是由于原本阻断的路径被打开了。
d-分离
定义:假设N为节点集,如果一条路径满足下面三种情况的至少一种,则称该路径被N(节点集)d-分离。
- 路径包含链式接合X -> Z -> Y,且Z∈N;
- 路径包含叉式接合X <- Z -> Y,且Z∈N;
- 路径包含对撞接合X -> Z <- Y,且Z∉{N∪N的子孙节点}。
更一般地,如果节点N阻断了X -> Y之间的每条路径,则称X和Y被N(节点)d-分离。
d-分离法则:
- 以非对撞子为条件时,包含该节点的路径被阻断;
- 以对撞子为条件时,由于该对撞子造成的阻断会解除;
- 以对撞子的子孙为条件时,由于该对撞子造成的阻断会解除。
混杂
定义:任何使P(Y∣do(X))P(Y|do(X))P(Y∣do(X))不同于P(Y∣X)P(Y|X)P(Y∣X)的因素。
例子:下图中,Z就是X和Y之间的混杂因子。
结构因果模型(SCM)
SCM用于对因果推断过程建模。在SCM中,包含外生变量集合U、内生变量集合V和函数集合F。
- 外生变量:表示模型没有考虑到的一些因素,如:噪声、不确定性等。图中的U1和U2都是外生变量。
- 内生变量:主要要研究的变量,图中的X和Y都是内生变量。
- 函数:外生变量与内生变量之间的计算关系,图中右侧的两个式子即为函数。
- 单向箭头:表示两个变量之间存在直接的因果关系。
- 双向箭头:表示两个变量之间存在未知的混杂因素。
因果推断 - 基础知识相关推荐
- 因果推断笔记——自整理因果推断理论解读(七)
之前有整理过一篇:因果推断笔记-- 相关理论:Rubin Potential.Pearl.倾向性得分.与机器学习异同(二) 不过,那时候刚刚开始学,只能慢慢理解,所以这边通过一轮的学习再次整理一下手里 ...
- 留言赠书|因果推断与机器学习,终于有本书能讲明白啦!
随着大数据时代的来临,机器学习技术突飞猛进,并且在人类社会中扮演越来越重要的角色. 例如,你可能已经习惯了每天使用谷歌.百度.Bing等搜索引擎查找信息,或者在电商网站和视频网站的推荐系统 ,以及利用 ...
- 因果推断综述-基础知识2
这一节是文章中第二部分基础知识.这一节公式较多,会影响阅读时效. 2.3假设 为了估计治疗效果,在因果推断文献中通常使用以下假设. 假设2.1 稳定的unit治疗价值假设(SUTVA) 任何unit ...
- AI研习丨专题:因果推断与因果性学习研究进展
来源:<中国人工智能学会通讯> 2020年 第10卷 第5期 机器学习及其应用专题 0 引言 因果关系一直是人类认识世界的基本方式和现代科学的基石.爱因斯坦就曾指出,西方科学的发展是 ...
- 因果推断 - 反事实
目录 基础知识 案例实战 版权:转载前请联系作者获得授权. 声明:部分内容出自因果关系之梯,已获得原作者授权. 参考书籍:<The Book of Why>--Judea Pearl 基础 ...
- 【推荐实践】因果推断在阿里文娱用户增长中的应用
分享嘉宾:天师 阿里文娱 高级算法专家 编辑整理:Hoh 内容来源:阿里文娱技术 出品平台:DataFunTalk 导读:如何实现产品的用户增长?显然,这是各家移动互联网应用的头等大事,也是悬在各家业 ...
- 因果推断与反事实预测——盒马KDD2021的一篇论文(二十三)
文章目录 1 已有研究者的描述 1.1 YuyangZhangFTD 1.1.1 Introduction 1.1.2 Problem Formulation 1.1.3 Counterfactual ...
- 因果推断笔记——数据科学领域因果推断案例集锦(九)
文章目录 1 腾讯看点:启动重置问题 1.1 观测数据 . 实验数据的理论介绍 2.2 启动重置问题阐述:短期.长期.异质 2.3 短期影响的解决 2.4 长期影响构造准实验 2.5 异质性用户 1. ...
- hawk大数据基础知识总结(1)
一.大数据概述 1.1大数据的概念 大数据一共具有三个特征:(1)全样而非抽样:(2)效率而非精确:(3)相关而非因果. (1)在过去由于缺乏获取全体样本的手段,人们发明了"随机调研数据&q ...
最新文章
- 视频中的运动特征--Learning Motion Patterns in Videos
- RMAN异机复制数据库(不同路径)
- oracle存储照片,[oracle]中存储图片
- python3.5安装tensorflow_pip install tensorflowgpu在python3.5中的安装
- 《Python Cookbook 3rd》笔记(1.3):保留最近N个元素
- linux下mysql主从同步是主从i/o线程显示为no_mysql主从同步IO线程NO
- perl语言学习笔记(3)列表与数组、子程序’、参数
- APP 自动化测试封装结构模式
- 词汇的积累 —— 同义反复、写景状物
- QComboBox使用方法,QComboBox详解
- 背景减法——自组织算法
- 2011-5-学习总结
- 华云数据收购国际超融合软件厂商Maxta全部资产
- Matlab中求解总体标准差和样本标准差的区别(std函数)
- VS2010 旗舰版和专业版 下载
- 【CAS】CAS原理
- 【历史上的今天】10 月 24 日:1024 程序员节;中文维基百科上线;iPad mini 诞生十周年
- Yahoo的Spark实践
- Docker 中文文档(译)
- 【React】React全家桶(八)React Router 6
热门文章
- 无盘服务器怎么修改ip,怎么进入无盘服务器修改IP地址呢
- dev c++怎么调试_「正点原子NANO STM32开发板资料连载」第十八章 USMART 调试组件...
- WinForm之创建word并操作文档
- FFmpg音视频入门教程
- 为了输出“,可以使用如下语句print(“““)————(×)
- python 中的序列
- python 中的 for-else 和 while-else 语句
- 【快乐水题】997. 找到小镇的法官
- Java修饰符:public,protected,private,不加修饰符的区别
- Python实例 -- .git格式转为.png格式