点击蓝字

关注我们

AI TIME欢迎每一位AI爱好者的加入!

本期AI TIME PhD专场,我们有幸邀请到了来自亚利桑那州立大学的博士生郭若城,为我们带来他的精彩分享——利用网络信息减少因果推断中的confounding bias—结合两种思路的新方法IGNITE: A Minimax Game Toward Learning Individual Treatment Effects from Networked Observational Data。

郭若城:亚利桑那州立大学博士生,研究方向为因果推断,数据挖掘,社交网络。2017年至今师从Prof. Huan Liu。博士期间在KDD,WSDM,IJCAI,CIKM,SDM等会议发表论文20余篇,在ACM Computing Surveys发表关于因果推断与机器学习结合的综述 A Survey of Learning Causality with Data: Problems and Methods。曾作为实习生在Google X和Microsoft Research进行因果机器学习方向的研究。

一、Intro

1、什么是因果causality?

基于随机变量的定义来说,假如我们有两个随机变量T和Y,当且仅当不通过intervention改变其他变量值的时候对T的值进行改变一定会引起Y值改变,我们说T是Y的因,Y是T的果。

2、为什么关心因果效应causal effects?

因为因果效应对于决策至关重要,是决策的依据。比如,IT公司的A / B tests,药物的临床试验。

3、为什么我们要在有网络结构的观测型数据networked observational data上研究这个问题呢?

因为在真实世界中,网络结构数据非常常见,比如:社交网络、银行体系中的支行网络。这些数据非常有用,所以我们需要研究和用好这些数据。

网络结构的观测型数据networked observational data,由n个instance和连接它们的网络结构(常用邻接矩阵表示)组成,如图所示:

图1 Networked observational data

二、Challenge and Motivation

如果不能控制隐藏的混淆变量Hidden confounders,就会产生有偏差的估测,得出的错误的因果效应。于是,我们借鉴了已有的两种从数据中学习隐变量来替代隐藏的混淆变量的方法,即Balancing the representation of confounders[1],和Predicting the treatment assignments [2],以对因果效应有更准确的估测。

三、Identification

因果效应估计的第一步是Identification,也就是需要把因果量变成统计量。其中我们用到了measurement bias[3]的思路。

图2 Identification

四、IGNITE

图3 IGNITE overview

我们提出了一种新的Critic based representation balancing方法,同时使用了Gradient penalty [4]的方法让训练更加稳定。

图4 Critic based representation balancing

Min step

图5 Min step

我们在min step这一步会训练Graph NN和用于outcome inference的网络以做到representation balancing,同时minimize Outcome Inference Loss。

Max step

图6  Max step

在max step这一步我们不再训练和Outcome Inference相关的网络,同时固定Graph NN参数,只需训练critic,让它更加能够区别treatment group和control group对应的latent confounders分布,从而更好地丈量两个分布间的divergence。

五、Experiment

因为因果推断的特性,我们只能使用Semi-synthetic datasets。首先,我们从真实世界数据集中获取features和network information,然后基于此用公式模拟treatments and outcomes[5],我们也需要考虑多种不同hidden confounding的强度并使用K2这个参数控制,confounding越强说明问题越难,estimation bias越大。跟之前工作[6]不同的是,我们随机分配了网络边界的权重去更好地反映真实世界网络。

图7 Statistics of the Datasets

(Training/validation/test = 60% : 20% : 20%)

Baselines中,我们选用了SOTA neural network based和ensemble based causal inference methods,包括Ablation models: GATD+, GATD,GATDT,还有Network Deconfounder,Causal Network Embedding,CFRNet, CEVAE, 和Causal Forest。

Evaluation中,我们用估计出的因果效应和模拟出的ground truth相比较,并且探究模型在不同hidden confounding强度下是否具有robustness。

我们用了两个常用Metrics,如下图所示,越小则说明模型预测越好。

图8 Metrics

Results中,我们可以看到IGNITE表现优于the ablation models 和 the state-of-the-art methods,同时横向对比可以发现,当hidden confounding(K2)上升,IGNITE是error增加最少的模型。

图9 Results

REF

Guo, Ruocheng, et al. "IGNITE: A Minimax Game Toward Learning Individual Treatment Effects from Networked Observational Data." IJCAI, 2020.

本篇论文地址:

https://www.ijcai.org/Proceedings/2020/0625.pdf

[1] Shalit, Uri, Fredrik D. Johansson, and David Sontag. "Estimating individual treatment effect: generalization bounds and algorithms." In International Conference on Machine Learning, pp. 3076-3085. PMLR, 2017.

[2] Veitch, Victor, Yixin Wang, and David Blei. "Using embeddings to correct for unobserved confounding in networks." In Advances in Neural Information Processing Systems, pp. 13792-13802. 2019.

[3] Kuroki, Manabu, and Judea Pearl. "Measurement bias and effect restoration in causal inference." Biometrika 101, no. 2 (2014): 423-437.

[4] Gulrajani, Ishaan, Faruk Ahmed, Martin Arjovsky, Vincent Dumoulin, and Aaron C. Courville. "Improved training of wasserstein gans." In Advances in neural information processing systems, pp. 5767-5777. 2017.

[5] Johansson, Fredrik, Uri Shalit, and David Sontag. "Learning representations for counterfactual inference." ICML. 2016.

[6] Guo, Ruocheng, Jundong Li, and Huan Liu. "Learning individual causal effects from networked observational data." In Proceedings of the 13th International Conference on Web Search and Data Mining, pp. 232-240. 2020.

整理:李嘉琪

审稿:郭若城

排版:岳白雪

AI TIME欢迎AI领域学者投稿,期待大家剖析学科历史发展和前沿技术。针对热门话题,我们将邀请专家一起论道。同时,我们也长期招募优质的撰稿人,顶级的平台需要顶级的你!

请将简历等信息发至yun.he@aminer.cn!

微信联系:AITIME_HY

AI TIME是清华大学计算机系一群关注人工智能发展,并有思想情怀的青年学者们创办的圈子,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法、场景、应用的本质问题进行探索,加强思想碰撞,打造一个知识分享的聚集地。

更多资讯请扫码关注

(直播回放:https://b23.tv/ifBA8L)

(点击“阅读原文”下载本次报告ppt)

利用网络信息减少因果推断中的confounding bias--结合两种思路的新方法相关推荐

  1. .net中对HTTP请求的两种请求:Get和Post的操作

    .net中对HTTP请求的简单操作总结 第一部分,HTTP协议的简单了解 一.           什么是HTTP协议 超文本传输协议 (HTTP-Hypertext transfer protoco ...

  2. android中的定时任务一般有两种机制,android 定时任务

    使用timertask进行定时任务 首先创建TimerTask: class SynchroTimerTask extends TimerTask { @Override public void ru ...

  3. 在.NET中执行Async/Await的两种错误方法

    微信公众号:架构师高级俱乐部 关注可了解更多的编程,架构知识.问题或建议,请公众号留言; 如果你觉得此文对你有帮助,欢迎转发 在.NET中执行异步/等待的两种错误方法 在应用开发中,我们为了提高应用程 ...

  4. c++STL中的find()函数 有两种使用方法

    c++STL中的find()函数 有两种使用方法 方法一: 开头引头文件:中的函数 其调用形式为 find(start,end,value) start搜寻的起点,end搜寻的终点,要寻找的value ...

  5. VB中FSO的调用的两种方法

    方法一:   Dim   objFso      Set   objFso   =   CreateObject("Scripting.FileSystemObject")    ...

  6. liferay mysql_Liferay中搭配MySQL数据库的两种措施

    搭配mysql数据库连接一共同如下几个环节: l安装mysql数据库(上面第一步) l创立liferay数据库(利用数据库脚本文件生成数据库文件portal-mysql.sql orcreate-my ...

  7. win7 计算机名称 ip6,Win7系统提示ipv6无网络访问权限的两种原因及解决方法

    Win7系统提示ipv6无网络访问权限,导致无法上网,这该如何解决呢?ipv6无网络访问权限的原因有很多种,针对此问题,下面脚本之家的教大家解决ipv6无网络访问权限的问题,大家一起来看看吧. 故障原 ...

  8. 思科新版EI CCIE 企业网软定义中的VxLAN分布式网关两种部署方式

    思科新版EI CCIE 企业网软定义中的VxLAN分布式网关两种部署方式VXLAN集中式网关部署的不足:第一,同一二层网关下跨子网的数据中心三层流量都需要经过集中三层网关转发.第二,由于采用了集中三层 ...

  9. 计算机word降序排列怎么做,word中怎么进行排序的两种方法

    word文档中表格除了作为我们的编辑和展示功能之外,还可以进行排序功能,十分方便,那么下面就由学习啦小编给大家分享下word中进行排序的技巧,希望能帮助到您. word中进行排序方法一: 步骤一:将光 ...

最新文章

  1. R语言max函数min函数计算各种数据对象最大值最小值实战
  2. 时空大数据可视化表达分析,看MapGIS七大“超能力”
  3. 网络对抗技术_实验二_网络嗅探与欺骗
  4. 问题 RadioButtonList+TextBox的复合控件如何做
  5. selenium V1.0和V2.0差别对比
  6. python时间序列分析航空旅人_python时间序列分析
  7. 反向输出dna序列_蛋白质序列反向(逆向)翻译成DNA序列-在线工具
  8. Flutter Provider 异步通信、Provider状态管理
  9. 误删除Linux中libc.so.6文件急救办法
  10. HTML5的设计目的是为了在移动设备上支持多媒体
  11. 【微信小程序】组件间通信与事件-获取子组件的实例对象
  12. 转hdmi_LT8619CHDMI转LVDS-HDMI支持高达4Kx2K_30Hz的分辨率
  13. 关于mysql保存数据的时候报问题分析
  14. 算法竞赛入门经典(第2版)-刘汝佳-第九章例题解题源码(C++语言)(部分)
  15. sketchup生成面域插件_什么插件这么神奇,SketchUp一秒搞定99%异形建模
  16. 单臂路由实现VLAN间通信
  17. java小组口号,小组口号霸气
  18. 怎么用python画螺旋_用Python tu绘制螺旋
  19. 微前端 - micro-app 数据通信
  20. Python:whl文件是神?如何安装whl文件?

热门文章

  1. 爱码物联SaaS-防伪追溯系统在白酒行业的应用
  2. 『网络安全』蜜罐到蜜网入门指南(一)蜜罐初识
  3. 《天使与魔鬼》读后感
  4. 朗润国际期货:去中心化稳定币谁能笑到最后?
  5. 尝试搭建本地语音转文字系统[1]
  6. Windows - win11取消鼠标右键菜单折叠的方法
  7. mysql 删除的三种方法_mysql 删除表数据的三种方法
  8. 我使用过的拼音输入法
  9. WordPress免费正版图片插件——Pixabay Free Images
  10. IDEA中scala安装与配置(详细步骤)