上次介绍了identification的方法——后门调整。但后门调整不是实现identification的唯一方法,这次会介绍identification的其他方法。

1. 随机试验的神奇之处

随机意味着协变量平衡

协变量平衡:协变量X再干预组和对照组中的分布相同,那么就说协变量平衡。即:

P(X∣T=1)=dP(X∣T=0)P(X \mid T=1) \stackrel{d}{=} P(X \mid T=0)P(X∣T=1)=dP(X∣T=0)

因为随机实验中T的取值完全不取决于X,而是随机决定的,于是有T独立于X,于是,

P(X∣T=1)=dP(X)P(X \mid T=1) \stackrel{d}{=} P(X)P(X∣T=1)=dP(X)

P(X∣T=0)=dP(X)P(X \mid T=0) \stackrel{d}{=} P(X)P(X∣T=0)=dP(X)

即T=1时的条件分布和T=0时的条件分布都等于边缘分布,于是有,

P(X∣T=1)=dP(X∣T=0)P(X \mid T=1) \stackrel{d}{=} P(X \mid T=0)P(X∣T=1)=dP(X∣T=0)

所以说,随机实验意味着协变量平衡。

协变量平衡意味着关联就是因果

令X为充分调整集,可以得到:

于是,协变量平衡意味着关联就是因果。

于是,

随机实验可以使得关联就是因果。

同样,我们也可以证明随机实验可以实现exchangeability以及没有后门路径,从而使得关联是因果。

2. 前门调整


上图的情况中,W是一个观测不到的变量,所以无法以W为条件,也就没法进行后门调整。这种情况下,我们就可以使用前门调整。
前门调整大致分为三个步骤:

  1. 确定T对M的影响
  2. 确定M对Y的影响
  3. 结合前面两步确定T对Y的影响

具体过程如下三个图所示:


于是得到了前门调整公式:
P(y∣do(t))=∑mP(m∣t)∑t′P(y∣m,t′)P(t′)P(y \mid d o(t))=\sum_{m} P(m \mid t) \sum_{t^{\prime}} P\left(y \mid m, t^{\prime}\right) P\left(t^{\prime}\right)P(y∣do(t))=∑m​P(m∣t)∑t′​P(y∣m,t′)P(t′)

前门标准:如果满足以下条件,则一组变量MMM满足从TTT到YYY的前门准则:

  1. MMM完全介导XXX对YYY的影响(即从X到Y的所有因果路径都经过M) 。
  2. 从TTT到MMM没有畅通无阻的后门路径。
  3. 从MMM到YYY的所有后门路径都被TTT阻止。

do-演算

有时候,前门调整和后门调整都无法计算因果关系,这时可以尝试使用do-演算。

符号介绍:GXˉG_{\bar{X} }GXˉ​代表删除图G中所有指向节点X的边后的图,GX‾G_{\underline{X}}GX​​代表删除图G中所有从X出发的边后的图。例如,图G是下左图的话,图GXˉZ‾G_{\bar{X} \underline{Z}}GXˉZ​​是下右图。


do演算的规则

  • rule 1.

P(Y∣do(X),Z,W)=P(Y∣do(X),Z)P(Y \mid d o(X), Z, W)=P(Y \mid do(X), Z)P(Y∣do(X),Z,W)=P(Y∣do(X),Z)

解释:在我们删除了指向X的所有箭头后,变量集Z会阻断所有从W到Y的路径。

  • rule 2.

P(Y∣do(X),Z)=P(Y∣X,Z)P(Y \mid d o(X), Z)=P(Y \mid X, Z)P(Y∣do(X),Z)=P(Y∣X,Z)

解释:如果变量集Z阻断了从X到Y的所有后门路径,那么以Z为条件(对Z进行控制),则do(X)等同于see(X)。即,在控制了一个充分的去混因子集后,留下的相关性就是真正的因果效应。

  • rule 3.

P(Y∣do(X))=P(Y)P(Y \mid d o(X))=P(Y)P(Y∣do(X))=P(Y)

解释:如果从X到Y没有因果路径,我们就可以将do(X)从P(Y|do(X))中移除。即,如果我们实施的干预行动(do)不会影响Y,那么Y的概率分布就不会改变。

规则1允许增加或删除某个观察结果;规则2允许用观察替换干预,或者反过来;规则3允许删除或添加干预。这些操作都必须在适当的条件下进行,并且必须在关于特定情况下的因果图中得到证实。

do演算的完备性以得到证明。do演算的完备性告诉我们,如果我们在规则1到3中找不到根据数据估计P(Y|do(X))的方法,那么这个问题,解决方案就是不存在的。在此情况下,我们呢就能意识到除了进行随机对照试验,我们别无选择。

do演算解决因果问题的例子
通常,艾滋病治疗使在较长的一段时间内进行的,并且在每个治疗阶段,医生都会根据患者的实际情况调整后续治疗的强度和用药剂量。同时,患者的病情也会受到此前治疗方案的影响。因此,我们得到了下图所示的因果图,其中展示了两个治疗阶段和两种治疗方案,第一种治疗方案(X)是完全随机的,第二种治疗方案(Z)则由中期结果的观测值(W)决定,其中W取决于X。


根据收集到的证据,任务是在保持Z恒定不变且独立于观测值W的前提下,预测治疗方案X对结果Y的影响。

在这个问题中,我们的目标量是P(Y∣do(X),do(Z))P(Y|do(X),do(Z))P(Y∣do(X),do(Z)),而我们可以采集到的数据以P(Y|do(X),Z,W)和P(W|do(X))为表示形式。这两个表达式反映了这样一个事实:此研究中的Z并不取决于某个外部因素,而是遵循某种(未知的)机制随W的变化而变化。因此,我们的任务就是将目标表达式变换为另一个表达式,以反映do算子仅适用于X而非Z的这一研究条件。如此一来,我们就可以通过简单地运用do演算的三条规则来解决这个问题了。【??】

通过图确定可识别性

虽然do演算的完备性可以告诉我们什么样的因果量可以转换为统计量,但并不直观,下面介绍如何通过图确定一个因果量的可识别性。

【不想整理了,先截图有空再整理】


因果推理(五):随机试验和可识别相关推荐

  1. 百度BML飞桨训练营(五)商品种类识别

    百度BML&飞桨训练营(五)商品种类识别 文章相关内容资料已经取得百度BML允许,仅用与交流学习,请不要用于商业传播. 这一期继续来手把手教学如何进行视觉上对商品饮料分类. 下载商品识别模板( ...

  2. OpenCV C++案例实战五《答题卡识别》

    OpenCV C++案例实战五<答题卡识别> 前言 一.图像矫正 1.源码 二.获取选项区域 1.扣出每题选项 2.源码 三.获取答案 1.思路 2.辅助函数 3.源码 4.效果 总结 前 ...

  3. 2021年人工神经网络第四次作业-第五题:危险品识别

    简 介: 通过对于物品X射线数据集合的整理,挑选出15类体积比较大的物品,训练LeNet网络进行识别. 关键词: X射线,危险品识别,LeNet,Paddle #mermaid-svg-wZUMACG ...

  4. 深度学习自学(十五):人脸识别数据预处理方法

    整理的人脸系列学习经验:包括人脸检测.人脸关键点检测.人脸优选.人脸对齐.人脸特征提取.人脸跟踪.人脸活体检测等学习过程总结,有需要的可以参考,仅供学习,请勿盗用.https://blog.csdn. ...

  5. doe五步法_【准则讲解之IFRS15】第贰章 五步法之贰识别P.O.(一)

    今天进入新收入准则的第三讲,新收入确认模型[五步法]的第二步,识别P.O.(履约义务). 上一讲中,我们提到识别合同的五个条件,其中,明确权利义务,就是为了更好地能进行第二步,也就是本讲需要介绍的识别 ...

  6. 安卓OpenCV开发(五)小狗识别

    ##使用OpenCV进行小狗脸蛋识别 新鲜?不,还是换汤不换药,其实原理和人脸识别一样,只是换了一下识别模型而已. 基础知识可以回顾我之前写的文章: OpenCV导入 OpenCV人脸检测 OpenC ...

  7. 信息抽取(五)实体命名识别之嵌套实体识别哪家强,我做了一个简单的对比实验

    实体命名识别之嵌套实体识别哪家强 嵌套实体识别 实体矩阵构建框架 方法比较 GlobalPointer TPLinker Tencent Muti-head Deep Biaffine 实验结果 总结 ...

  8. OpenMV(五)--STM32实现人脸识别

    STM32实现人脸识别 引 前言 1. 人脸检测 1.1 构造函数 1.2 源码分析 2. 人脸识别 2.1 构造函数 2.2 源码分析 3.通过本地特征文件进行人脸识别 3.1 将人脸特征保存到本地 ...

  9. 【NLP入门教程】五、命名实体识别

    命名实体识别(Named Entity Recognition, NER)是自然语言处理中的一项重要任务,其目标是从文本中识别并分类实体,如人名.地名.组织名.时间表达式等.命名实体识别对于信息抽取. ...

最新文章

  1. Sublime Text 菜单栏消失问题
  2. svn提示out of date的解决方法
  3. c语言创建学生成绩表,C语言创建信息链表,求助
  4. 无线模块的电源设计指南
  5. mysql约束类型 A P_mysql笔记: 数据类型、约束、范式
  6. 读取pdf文件信息(pdfinfo)
  7. ASP.NET2.0 HiddenField控件
  8. 使用 google_breakpad 分析 Electron 崩溃日志文件
  9. SetZOrder 无效
  10. PKD-Bert:基于多层网络的Bert知识蒸馏
  11. 【基础】位与运算与取余
  12. centOS7 清理系统垃圾
  13. 入秋的第一篇数据结构算法:看看归并与快排的风采
  14. 独立站SaaS建站模式是什么
  15. 笔记本电脑应用商店服务器错误,打开win10商店出错 出现win10商店请稍后重试问题怎么办 - 驱动管家...
  16. SRCNN:Image Super-Resolution Using Deep Convolutional Networks
  17. Excel 复制时数据提示图片太大,超过部分将被截去
  18. js 将秒数换算成时分秒
  19. 内网渗透代理知识以及渗透某CTF三层靶机实例
  20. 南通大学python期末考试试卷答案_南通大学大一下学期英语期末考试必考题答(已排版)...

热门文章

  1. 旋转正方体加径向渐变
  2. 【fpga里Verilog语言的小知识点】
  3. 【论文笔记】Neural Relation Extraction with Multi-lingual Attention
  4. Powershell-批量重命名替换文件名
  5. 递归实现对多层嵌套的对象数组依照某属性进行排序
  6. 一次性餐具 disposable dishware
  7. 学习笔记(一)Mobilenetv1的解读
  8. 歌尔首次闪耀CES Asia,展示全面创新力量
  9. 企业如何搭建并运营好积分商城?
  10. 苏州微软面试--机器学习自然语言处理