因果推理(五):随机试验和可识别
上次介绍了identification的方法——后门调整。但后门调整不是实现identification的唯一方法,这次会介绍identification的其他方法。
1. 随机试验的神奇之处
随机意味着协变量平衡
协变量平衡:协变量X再干预组和对照组中的分布相同,那么就说协变量平衡。即:
P(X∣T=1)=dP(X∣T=0)P(X \mid T=1) \stackrel{d}{=} P(X \mid T=0)P(X∣T=1)=dP(X∣T=0)
因为随机实验中T的取值完全不取决于X,而是随机决定的,于是有T独立于X,于是,
P(X∣T=1)=dP(X)P(X \mid T=1) \stackrel{d}{=} P(X)P(X∣T=1)=dP(X)
P(X∣T=0)=dP(X)P(X \mid T=0) \stackrel{d}{=} P(X)P(X∣T=0)=dP(X)
即T=1时的条件分布和T=0时的条件分布都等于边缘分布,于是有,
P(X∣T=1)=dP(X∣T=0)P(X \mid T=1) \stackrel{d}{=} P(X \mid T=0)P(X∣T=1)=dP(X∣T=0)
所以说,随机实验意味着协变量平衡。
协变量平衡意味着关联就是因果
令X为充分调整集,可以得到:
于是,协变量平衡意味着关联就是因果。
于是,
随机实验可以使得关联就是因果。
同样,我们也可以证明随机实验可以实现exchangeability以及没有后门路径,从而使得关联是因果。
2. 前门调整
上图的情况中,W是一个观测不到的变量,所以无法以W为条件,也就没法进行后门调整。这种情况下,我们就可以使用前门调整。
前门调整大致分为三个步骤:
- 确定T对M的影响
- 确定M对Y的影响
- 结合前面两步确定T对Y的影响
具体过程如下三个图所示:
于是得到了前门调整公式:
P(y∣do(t))=∑mP(m∣t)∑t′P(y∣m,t′)P(t′)P(y \mid d o(t))=\sum_{m} P(m \mid t) \sum_{t^{\prime}} P\left(y \mid m, t^{\prime}\right) P\left(t^{\prime}\right)P(y∣do(t))=∑mP(m∣t)∑t′P(y∣m,t′)P(t′)
前门标准:如果满足以下条件,则一组变量MMM满足从TTT到YYY的前门准则:
- MMM完全介导XXX对YYY的影响(即从X到Y的所有因果路径都经过M) 。
- 从TTT到MMM没有畅通无阻的后门路径。
- 从MMM到YYY的所有后门路径都被TTT阻止。
do-演算
有时候,前门调整和后门调整都无法计算因果关系,这时可以尝试使用do-演算。
符号介绍:GXˉG_{\bar{X} }GXˉ代表删除图G中所有指向节点X的边后的图,GX‾G_{\underline{X}}GX代表删除图G中所有从X出发的边后的图。例如,图G是下左图的话,图GXˉZ‾G_{\bar{X} \underline{Z}}GXˉZ是下右图。
do演算的规则:
- rule 1.
P(Y∣do(X),Z,W)=P(Y∣do(X),Z)P(Y \mid d o(X), Z, W)=P(Y \mid do(X), Z)P(Y∣do(X),Z,W)=P(Y∣do(X),Z)
解释:在我们删除了指向X的所有箭头后,变量集Z会阻断所有从W到Y的路径。
- rule 2.
P(Y∣do(X),Z)=P(Y∣X,Z)P(Y \mid d o(X), Z)=P(Y \mid X, Z)P(Y∣do(X),Z)=P(Y∣X,Z)
解释:如果变量集Z阻断了从X到Y的所有后门路径,那么以Z为条件(对Z进行控制),则do(X)等同于see(X)。即,在控制了一个充分的去混因子集后,留下的相关性就是真正的因果效应。
- rule 3.
P(Y∣do(X))=P(Y)P(Y \mid d o(X))=P(Y)P(Y∣do(X))=P(Y)
解释:如果从X到Y没有因果路径,我们就可以将do(X)从P(Y|do(X))中移除。即,如果我们实施的干预行动(do)不会影响Y,那么Y的概率分布就不会改变。
规则1允许增加或删除某个观察结果;规则2允许用观察替换干预,或者反过来;规则3允许删除或添加干预。这些操作都必须在适当的条件下进行,并且必须在关于特定情况下的因果图中得到证实。
do演算的完备性以得到证明。do演算的完备性告诉我们,如果我们在规则1到3中找不到根据数据估计P(Y|do(X))的方法,那么这个问题,解决方案就是不存在的。在此情况下,我们呢就能意识到除了进行随机对照试验,我们别无选择。
do演算解决因果问题的例子:
通常,艾滋病治疗使在较长的一段时间内进行的,并且在每个治疗阶段,医生都会根据患者的实际情况调整后续治疗的强度和用药剂量。同时,患者的病情也会受到此前治疗方案的影响。因此,我们得到了下图所示的因果图,其中展示了两个治疗阶段和两种治疗方案,第一种治疗方案(X)是完全随机的,第二种治疗方案(Z)则由中期结果的观测值(W)决定,其中W取决于X。
根据收集到的证据,任务是在保持Z恒定不变且独立于观测值W的前提下,预测治疗方案X对结果Y的影响。
在这个问题中,我们的目标量是P(Y∣do(X),do(Z))P(Y|do(X),do(Z))P(Y∣do(X),do(Z)),而我们可以采集到的数据以P(Y|do(X),Z,W)和P(W|do(X))为表示形式。这两个表达式反映了这样一个事实:此研究中的Z并不取决于某个外部因素,而是遵循某种(未知的)机制随W的变化而变化。因此,我们的任务就是将目标表达式变换为另一个表达式,以反映do算子仅适用于X而非Z的这一研究条件。如此一来,我们就可以通过简单地运用do演算的三条规则来解决这个问题了。【??】
通过图确定可识别性
虽然do演算的完备性可以告诉我们什么样的因果量可以转换为统计量,但并不直观,下面介绍如何通过图确定一个因果量的可识别性。
【不想整理了,先截图有空再整理】
因果推理(五):随机试验和可识别相关推荐
- 百度BML飞桨训练营(五)商品种类识别
百度BML&飞桨训练营(五)商品种类识别 文章相关内容资料已经取得百度BML允许,仅用与交流学习,请不要用于商业传播. 这一期继续来手把手教学如何进行视觉上对商品饮料分类. 下载商品识别模板( ...
- OpenCV C++案例实战五《答题卡识别》
OpenCV C++案例实战五<答题卡识别> 前言 一.图像矫正 1.源码 二.获取选项区域 1.扣出每题选项 2.源码 三.获取答案 1.思路 2.辅助函数 3.源码 4.效果 总结 前 ...
- 2021年人工神经网络第四次作业-第五题:危险品识别
简 介: 通过对于物品X射线数据集合的整理,挑选出15类体积比较大的物品,训练LeNet网络进行识别. 关键词: X射线,危险品识别,LeNet,Paddle #mermaid-svg-wZUMACG ...
- 深度学习自学(十五):人脸识别数据预处理方法
整理的人脸系列学习经验:包括人脸检测.人脸关键点检测.人脸优选.人脸对齐.人脸特征提取.人脸跟踪.人脸活体检测等学习过程总结,有需要的可以参考,仅供学习,请勿盗用.https://blog.csdn. ...
- doe五步法_【准则讲解之IFRS15】第贰章 五步法之贰识别P.O.(一)
今天进入新收入准则的第三讲,新收入确认模型[五步法]的第二步,识别P.O.(履约义务). 上一讲中,我们提到识别合同的五个条件,其中,明确权利义务,就是为了更好地能进行第二步,也就是本讲需要介绍的识别 ...
- 安卓OpenCV开发(五)小狗识别
##使用OpenCV进行小狗脸蛋识别 新鲜?不,还是换汤不换药,其实原理和人脸识别一样,只是换了一下识别模型而已. 基础知识可以回顾我之前写的文章: OpenCV导入 OpenCV人脸检测 OpenC ...
- 信息抽取(五)实体命名识别之嵌套实体识别哪家强,我做了一个简单的对比实验
实体命名识别之嵌套实体识别哪家强 嵌套实体识别 实体矩阵构建框架 方法比较 GlobalPointer TPLinker Tencent Muti-head Deep Biaffine 实验结果 总结 ...
- OpenMV(五)--STM32实现人脸识别
STM32实现人脸识别 引 前言 1. 人脸检测 1.1 构造函数 1.2 源码分析 2. 人脸识别 2.1 构造函数 2.2 源码分析 3.通过本地特征文件进行人脸识别 3.1 将人脸特征保存到本地 ...
- 【NLP入门教程】五、命名实体识别
命名实体识别(Named Entity Recognition, NER)是自然语言处理中的一项重要任务,其目标是从文本中识别并分类实体,如人名.地名.组织名.时间表达式等.命名实体识别对于信息抽取. ...
最新文章
- Sublime Text 菜单栏消失问题
- svn提示out of date的解决方法
- c语言创建学生成绩表,C语言创建信息链表,求助
- 无线模块的电源设计指南
- mysql约束类型 A P_mysql笔记: 数据类型、约束、范式
- 读取pdf文件信息(pdfinfo)
- ASP.NET2.0 HiddenField控件
- 使用 google_breakpad 分析 Electron 崩溃日志文件
- SetZOrder 无效
- PKD-Bert:基于多层网络的Bert知识蒸馏
- 【基础】位与运算与取余
- centOS7 清理系统垃圾
- 入秋的第一篇数据结构算法:看看归并与快排的风采
- 独立站SaaS建站模式是什么
- 笔记本电脑应用商店服务器错误,打开win10商店出错 出现win10商店请稍后重试问题怎么办 - 驱动管家...
- SRCNN:Image Super-Resolution Using Deep Convolutional Networks
- Excel 复制时数据提示图片太大,超过部分将被截去
- js 将秒数换算成时分秒
- 内网渗透代理知识以及渗透某CTF三层靶机实例
- 南通大学python期末考试试卷答案_南通大学大一下学期英语期末考试必考题答(已排版)...