文章目录

  • 主题.
  • 因果模型.
  • 外部干预.

主题.

  • 图模型 GraphicalModels\rm Graphical~ModelsGraphical Models 与统计分析因果性 Causality\rm CausalityCausality 之间的关系。

因果模型.

  • 图模型是我们用于研究因果性的重要助力,Pearl\rm PearlPearl 在该文章中重点就是讨论图模型如何与因果模型关联起来。
  • 区别于一般的联合分布告诉我们某个事件发生的可能性有多大,因果模型还会给出系统中出现外部干预时概率的变化情况。
  • 基于图模型来研究因果性面临着以下两个挑战:
  • ①①① 如何将复杂的外部干预融入图模型中予以组织、表示;
  • ②②② 如何利用图模型来促进对于外部干预影响的预测任务。
  • 在图模型中引入外部干预非常易于执行,这一良好性质根源于图模型本身。Simon\rm SimonSimon 于 197719771977 年对其进行了简要的论述:

  • Pearl\rm PearlPearl 和 Verma\rm VermaVerma 于 199119911991 年提出了概率因果理论,即有向无环图 G\mathcal GG 中的每个节点与其父亲节点集合之间的关系由函数 fff 形式化描述:Xi=fi(pai,ϵi)(1)X_i=f_i({\rm pa}_i,\epsilon_i)\tag{1}Xi​=fi​(pai​,ϵi​)(1)并且整个概率图的联合分布依旧满足马尔可夫性:P(x1,x2,⋯,xn)=∏i=1nP(xi∣pai)(2)P(x_1,x_2,\cdots,x_n)=\prod_{i=1}^nP(x_i|{\rm pa}_i)\tag{2}P(x1​,x2​,⋯,xn​)=i=1∏n​P(xi​∣pai​)(2)
  • (1)(1)(1) 式中函数 fif_ifi​ 代表了一种确定性映射法则,如果将由于外部干预而造成法则 fif_ifi​ 的改变表示为随机变量 FiF_iFi​,那么 (1)(1)(1) 式可以更加普遍地写为:Xi=hi(pai,Fi,ϵi)(3)X_i=h_i({\rm pa}_i,F_i,\epsilon_i)\tag{3}Xi​=hi​(pai​,Fi​,ϵi​)(3)当 Fi=fiF_i=f_iFi​=fi​ 时,有 hi(pai,Fi,ϵi)=fi(pai,ϵi).h_i({\rm pa}_i,F_i,\epsilon_i)=f_i({\rm pa}_i,\epsilon_i).hi​(pai​,Fi​,ϵi​)=fi​(pai​,ϵi​).
  • (3)(3)(3) 式的意义在于,对于任意外部干预引起的映射法则变化 FiF_iFi​ 可以通过为 XiX_iXi​ 增加父亲节点这一操作融入图模型中进行表示。

外部干预.

  • 最简单的外部干预 FiF_iFi​ 就是将随机变量 XiX_iXi​ 的取值固定,例如:Fi=set(Xi=a)(4)F_i={\rm set}(X_i=a)\tag{4}Fi​=set(Xi​=a)(4)这一外部干预等价于用 Xi=aX_i=aXi​=a 这一等式关系替换 (1)(1)(1) 式。
  • (4)(4)(4) 式代表的外部干预反映在 DAG\rm DAGDAG 图中为一条新增的边 Fi→XiF_i\rightarrow X_iFi​→Xi​ ,下图中分别以 Γ,Γ′\Gamma,\Gamma'Γ,Γ′ 表示原概率图和新概率图:
  • 如果 Fi∈{null,set(Xi=a)}F_i\in\big\{{\rm null},{\rm set}(X_i=a)\big\}Fi​∈{null,set(Xi​=a)},那么变量 XiX_iXi​ 的父结点集合更新为 pai′=pai⋃{Fi}{\rm pa}_i'={\rm pa}_i\bigcup\{F_i\}pai′​=pai​⋃{Fi​},对应的条件概率分布更新如下:P(xi∣pai′)={P(xi∣pai),F=null1,F=set(Xi=a)∧xi=a0,F=set(Xi=a)∧xi≠a(5)P(x_i|{\rm pa}_i')=\left\{\begin{aligned}&P(x_i|{\rm pa}_i)~,~F={\rm null}\\ &1~~~~~~~~~~~~~~~,~F={\rm set}(X_i=a)\wedge x_i=a\\ &0~~~~~~~~~~~~~~~,~F={\rm set}(X_i=a)\wedge x_i\neq a\\ \end{aligned}\right.\tag{5}P(xi​∣pai′​)=⎩⎪⎨⎪⎧​​P(xi​∣pai​) , F=null1               , F=set(Xi​=a)∧xi​=a0               , F=set(Xi​=a)∧xi​​=a​(5)其中 null\rm nullnull 表示不做外部干预。
  • (2)(2)(2) 式中的联合分布 P(x1,x2,⋯,xn)P(x_1,x_2,\cdots,x_n)P(x1​,x2​,⋯,xn​) 由于外部干预 set(Xi=a){\rm set}(X_i=a)set(Xi​=a) 的影响,更新为 Pa(x1,x2,⋯,xn)P_{a}(x_1,x_2,\cdots,x_n)Pa​(x1​,x2​,⋯,xn​):Pa(x1,x2,⋯,xn)=P′(x1,x2,⋯,xn∣Fi=set(Xi=a))(6.1)P_a(x_1,x_2,\cdots,x_n)=P'\Big(x_1,x_2,\cdots,x_n|F_i={\rm set}(X_i=a)\Big)\tag{6.1}Pa​(x1​,x2​,⋯,xn​)=P′(x1​,x2​,⋯,xn​∣Fi​=set(Xi​=a))(6.1)其中 P′P'P′ 是由新概率图 Γ′=Γ⋃{Fi}\Gamma'=\Gamma\bigcup\{F_i\}Γ′=Γ⋃{Fi​} 确定的联合分布。
  • 对 (6.1)(6.1)(6.1) 式进一步分析可知:P′(x1,x2,⋯,xn∣Fi=set(Xi=a))=P′(xi∣x1,x2,⋯,xi−1,xi+1,⋯,xn,Fi=set(Xi=a))⋅P′(x1,x2,⋯,xi−1,xi+1,⋯,xn∣Fi=set(Xi=a))=P′(xi∣Fi=set(Xi=a))⋅P′(x1,x2,⋯,xi−1,xi+1,⋯,xn)\begin{aligned}&P'\Big(x_1,x_2,\cdots,x_n\Big|F_i={\rm set}(X_i=a)\Big)\\&=P'\Big(x_i\Big|x_1,x_2,\cdots,x_{i-1},x_{i+1},\cdots,x_n,F_i={\rm set}(X_i=a)\Big)\\&\cdot P'\Big(x_1,x_2,\cdots,x_{i-1},x_{i+1},\cdots,x_n\Big|F_i={\rm set}(X_i=a)\Big)\\ &=P'\Big(x_i\Big|F_i={\rm set}(X_i=a)\Big)\cdot P'\Big(x_1,x_2,\cdots,x_{i-1},x_{i+1},\cdots,x_n\Big) \end{aligned}​P′(x1​,x2​,⋯,xn​∣∣∣​Fi​=set(Xi​=a))=P′(xi​∣∣∣​x1​,x2​,⋯,xi−1​,xi+1​,⋯,xn​,Fi​=set(Xi​=a))⋅P′(x1​,x2​,⋯,xi−1​,xi+1​,⋯,xn​∣∣∣​Fi​=set(Xi​=a))=P′(xi​∣∣∣​Fi​=set(Xi​=a))⋅P′(x1​,x2​,⋯,xi−1​,xi+1​,⋯,xn​)​并且有:P′(xi=a∣Fi=set(Xi=a))=1P'\Big(x_i=a|F_i={\rm set}(X_i=a)\Big)=1P′(xi​=a∣Fi​=set(Xi​=a))=1P′(xi≠a∣Fi=set(Xi=a))=0P'\Big(x_i\neq a|F_i={\rm set}(X_i=a)\Big)=0P′(xi​​=a∣Fi​=set(Xi​=a))=0因此得到如下表达式:Pa(x1,x2,⋯,xn)={P(x1,x2,⋯,xn)P(xi∣pai),xi=a0,xi≠a(6.2)P_a(x_1,x_2,\cdots,x_n)=\left\{\begin{aligned} &\cfrac{P(x_1,x_2,\cdots,x_n)}{P(x_i|{\rm pa}_i)}~,~x_i=a\\ &0~~~~~~~~~~~~~~~~~~~~~~~~~~~~~,~x_i\neq a\\ \end{aligned}\right.\tag{6.2}Pa​(x1​,x2​,⋯,xn​)=⎩⎪⎨⎪⎧​​P(xi​∣pai​)P(x1​,x2​,⋯,xn​)​ , xi​=a0                             , xi​​=a​(6.2)观察 (6.2)(6.2)(6.2) 式发现,Pa(x1,x2,⋯,xn)P_a(x_1,x_2,\cdots,x_n)Pa​(x1​,x2​,⋯,xn​) 的值等于从联合分布 ∏k=1nP(xk∣pak)\prod_{k=1}^n P(x_k|{\rm pa}_k)∏k=1n​P(xk​∣pak​) 中移除了第 iii 项 P(xi∣pai).P(x_i|{\rm pa}_i).P(xi​∣pai​).
  • (6.2)(6.2)(6.2) 式是容易理解的,因为外部干预 FiF_iFi​ 的存在,原父亲节点集合 pai{\rm pa}_ipai​ 对于 XiX_iXi​ 不再产生影响。

  • 从 (6.1)(6.1)(6.1) 式可以推知以下等式:Pa(S∣pai)=P(S∣xi=a,pai)(7)P_a(S|{\rm pa}_i)=P(S|x_i=a,{\rm pa}_i)\tag{7}Pa​(S∣pai​)=P(S∣xi​=a,pai​)(7)其中 SSS 是任意变量集合。(7)(7)(7) 式之所以成立,是因为集合 {Xi}⋃pai\{X_i\}\bigcup{\rm pa}_i{Xi​}⋃pai​ 有向分割 d−separated-{\rm separate}d−separate 了 FiF_iFi​ 与 G\mathcal GG 的其余部分,因此有以下的条件独立性成立:S⊥⁣ ⁣ ⁣ ⁣⊥(Fi∣{Xi}⋃pai)S\perp\!\!\!\!\perp\Big(F_i\Big|\{X_i\}\bigcup{\rm pa}_i\Big)S⊥⊥(Fi​∣∣∣​{Xi​}⋃pai​)
  • 疑惑】参考概率图 Γ′\Gamma'Γ′,实际上集合 {Xi}\{X_i\}{Xi​} 就能够有向分割 FiF_iFi​ 与 G\mathcal GG 的其他部分。

  • (6.2)(6.2)(6.2) 式明确如下事实:我们可以从进行干预前的分布 P(x1,x2,⋯,xn)P(x_1,x_2,\cdots,x_n)P(x1​,x2​,⋯,xn​) 中推知干预后的分布 Pa(x1,x2,⋯,xn).P_a(x_1,x_2,\cdots,x_n).Pa​(x1​,x2​,⋯,xn​).

  • 当估计 (6.2)(6.2)(6.2) 式中分母 P(xi∣pai)P(x_i|{\rm pa}_i)P(xi​∣pai​) 有难度时,可以从 (6.1)(6.1)(6.1) 式入手。以概率 Pa(xj)P_a(x_j)Pa​(xj​) 为例,根据 (6.1)(6.1)(6.1) 式可得:Pa(xj)=P′(xj∣Fi=set(Xi=a))=∑SP′(xj∣S,Fi)⋅P′(S∣Fi)\begin{aligned}P_a(x_j) &=P'\Big(x_j\Big|F_i={\rm set}(X_i=a)\Big)\\ &=\sum_SP'\Big(x_j\Big|S,F_i\Big)\cdot P'\big(S|F_i\big)\\ \end{aligned}Pa​(xj​)​=P′(xj​∣∣∣​Fi​=set(Xi​=a))=S∑​P′(xj​∣∣∣​S,Fi​)⋅P′(S∣Fi​)​观察发现:P′(xj∣S,Fi)=∑xiP′(xj∣xi,S,Fi)⋅P′(xi∣S,Fi)=P′(xj∣Xi=a,S,Fi)⋅P′(Xi=a∣S,Fi)=P′(xj∣Xi=a,S,Fi)\begin{aligned}P'\Big(x_j\Big|S,F_i\Big)&=\sum_{x_i}P'\Big(x_j\Big|x_i,S,F_i\Big)\cdot P'\Big(x_i\Big|S,F_i\Big)\\ &=P'\Big(x_j\Big|X_i=a,S,F_i\Big)\cdot P'\Big(X_i=a\Big|S,F_i\Big)\\ &=P'\Big(x_j\Big|X_i=a,S,F_i\Big) \end{aligned}P′(xj​∣∣∣​S,Fi​)​=xi​∑​P′(xj​∣∣∣​xi​,S,Fi​)⋅P′(xi​∣∣∣​S,Fi​)=P′(xj​∣∣∣​Xi​=a,S,Fi​)⋅P′(Xi​=a∣∣∣​S,Fi​)=P′(xj​∣∣∣​Xi​=a,S,Fi​)​将其代入上式得到:Pa(xj)=∑SP′(xj∣Xi=a,S,Fi)⋅P′(S∣Fi)(8.1)P_a(x_j)=\sum_SP'\Big(x_j\Big|X_i=a,S,F_i\Big)\cdot P'\big(S|F_i\big)\tag{8.1}Pa​(xj​)=S∑​P′(xj​∣∣∣​Xi​=a,S,Fi​)⋅P′(S∣Fi​)(8.1)
  • 如果有 S⊥⁣ ⁣ ⁣ ⁣⊥FiS\perp\!\!\!\!\perp F_iS⊥⊥Fi​ 和 Xj⊥⁣ ⁣ ⁣ ⁣⊥(Fi∣{Xi}⋃S)X_j\perp\!\!\!\!\perp\Big(F_i\Big|\{X_i\}\bigcup S\Big)Xj​⊥⊥(Fi​∣∣∣​{Xi​}⋃S) 成立,那么 (8.1)(8.1)(8.1) 式可以简化为:Pa(xj)=∑SP(xj∣S,Xi=a)⋅P(S)=ES[P(xj∣S,Xi=a)](8.2)P_a(x_j)=\sum_SP\Big(x_j\Big|S,X_i=a\Big)\cdot P(S)=\mathbb E_S\Big[P\Big(x_j\Big|S,X_i=a\Big)\Big]\tag{8.2}Pa​(xj​)=S∑​P(xj​∣∣∣​S,Xi​=a)⋅P(S)=ES​[P(xj​∣∣∣​S,Xi​=a)](8.2)(8.2)(8.2)(8.2) 式的意义在于指明可以通过对分布 P(xj∣S,Xi=a)P\Big(x_j\Big|S,X_i=a\Big)P(xj​∣∣∣​S,Xi​=a) 求取期望来获得对 Pa(xj)P_a(x_j)Pa​(xj​) 的估计。
  • 另外可以证明,所以满足 Back−DoorCriterion\rm Back-Door~CriterionBack−Door Criterion 的集合 SSS 都满足 (8.2)(8.2)(8.2) 式的简化条件。

【XAI】Comment: Graphical Models, Causality and Intervention相关推荐

  1. 【Python】django模型models的外键关联使用

    [Python]django模型models的外键关联使用 Python 2.7.10,django 1.8.6 外键关联:http://www.bubuko.com/infodetail-61830 ...

  2. 【ReID】Beyond Part Models: Person Retrieval with Refined Part Pooling (and A Strong Convolutional...

    [ReID]Beyond Part Models: Person Retrieval with Refined Part Pooling (and A Strong Convolutional Bas ...

  3. 【XAI】Adversarial Defense Framework for Graph Neural Network

    文章目录 简述. DefNet. Dual-Stage Aggregation. Bottleneck Perceptron. Adversarial Contrastive Learning. 实验 ...

  4. 【机器视觉】 comment算子

    00. 目录 文章目录 00. 目录 01. 概述 02. 签名 03. 描述 04. 注意 05. 参数 06. 结果 07. 附录 01. 概述 comment - 为程序添加一行注释. 02. ...

  5. 【XAI】Nettack IG-JSMA

    文章目录 前言. 问题形式化. Nettack. IG-JSMA. 实验. Nettack. IG-JSMA. 细节与补充. 前言. Nettack\rm NettackNettack 和 IG−JS ...

  6. 【XAI】Axiomatic Attribution for Deep Networks

  7. 【机器视觉】机器视觉博客汇总

    00. 目录 文章目录 00. 目录 01. 机器视觉概述 02. 机器视觉环境搭建 03. Halcon初级教程 04. Halcon中级教程 05. Halcon高级教程 06. Halcon与Q ...

  8. PRML读书会第五期——概率图模型(Graphical Models)【上】

    PRML读书会第五期--概率图模型(Graphical Models) 前言 本人系浙江大学人工智能协会(ZJUAI)会员.本学期协会正在举办PRML读书会系列活动,笔者在活动中负责部分记录工作. 下 ...

  9. 【RS】Local Latent Space Models for Top- N Recommendation-利用局部隐含空间模型进行Top-N推荐...

    [论文标题]Local Latent Space Models for Top- N Recommendation  (KDD-2018 ) [论文作者]-Evangelia Christakopou ...

最新文章

  1. 【2015沈阳现场A】
  2. LTE轻松进阶之帧结构
  3. 30 天精通 RxJS (01):认识 RxJS
  4. MVC中Spring.net 对基类控制器无效 过滤器控制器无效
  5. OpenCV——图像修复函数intpaint()使用详解
  6. yara 模式匹配 android,YARA——恶意软件模式匹配利器
  7. 端口隔离配置命令、端口镜像(抓包配置)详解(附图,建议PC观看)
  8. nginx+Tomcat实现动静分离架构
  9. python接口自动化(三十)--html测试报告通过邮件发出去——中(详解)
  10. 腾讯微博等7家网站实行实名制
  11. 用MATLAB计算光的等厚干涉实验中的不确定度
  12. 深入理解 Nginx 之架构篇
  13. 电大网络计算机绘图,计算机绘图与AUTOCAD设计[031005217]-中国大学mooc-题库零氪
  14. SpringBoot用HttpClient调用快递物流查询API接口
  15. GreenPlum学习笔记:split_part与string_to_array字符截取
  16. Oracle数据库存储number类型数据
  17. 正则表达式之基本原理
  18. springboot毕设项目商城积分兑换系统pez18(java+VUE+Mybatis+Maven+Mysql)
  19. 题解 - CF613D Kingdom and its Cities
  20. 信息爆炸的年代,怎么治愈自己的焦虑

热门文章

  1. 【Matlab】ASCII图片生成、迷宫生成和词云图生成
  2. Verilog语言控制Xilinx FPGA引脚demo
  3. 常见网络编程面试题答案征集与面试题(收集) ZZ 【网络编程】
  4. Windows Sockets概述
  5. java imageio 内存问题_java中的内存泄漏ImageIO.read()
  6. Django(14)-应用及分布式路由
  7. 用html语言编写笑脸,怎么使用HTML5中的Canvas绘制笑脸
  8. armbian清理_N1盒子armbian/ubuntu/linux系统修改日志输出到内存
  9. 计算两个数的平均值几种方法
  10. JAVA 面向对象和集合知识点总结