因果推断(Causal Inference)概要
(随便配的图,其实佛教的因果和我们这里的因果还不太一样的。。。)
这里简单谈一下因果学习相关的一些最为基础的东西。
首先,所谓因果性与相关性不同,相关性指的是如果我们观测到了一个变量X的分布,就能推断出另一个变量Y的分布的话,那么说明X和Y是有相关性的。而因果性则强调,如果我们操作了某个变量X,而这种操作(manipulate)引起了Y变量的变化的话,那么我们才能说明X是Y的cause,而Y是X的effect,这是因果学习的基本出发点,我们要找的是这样的因果关系,而不是简单的相关关系。
因果性与相关性的不同,举一个简单的栗子:比如我们可以通过统计数据发现,一个学校的学生的成绩和其是否戴眼镜有很强的正相关的关系。相关性可以用这样的统计数据直接看出来,但是因果性还没有确定。人们如果误将相关性的变量认为成了因果性的变量的话,就会通过给学生戴上眼镜的方式来提高他们的成绩。这是很荒谬的,原因就在于这是一个manipulate,这种manipulate需要的是因果性,而不是简单的统计相关性。我们根据经验知道,成绩好和戴眼镜背后都有一个common cause,那就是读书时间长。类似的错误并不少见,再举一个日常的例子,这个栗子相对于前面的例子可能有些不太明显:有人发现喝名贵葡萄酒的人寿命更长,所以提出通过每天饮用一点这种葡萄酒来养生。这个操作和前面说的戴眼镜的操作比起来,看上去似乎合理的多,现实中也确实是很多人觉得适量饮酒可以养生。但是这个仍然是一个没有区分相关和因果的情况。在这种情况下,经常喝名酒与寿命长也有共同的原因:那就是这个人很可能社会阶层较高,生活较为富足,因此能经常喝红酒,并且可以享受最好的医疗条件。这样看来,因果性有时候在做判断和决策的意义上可能比统计相关性更加有意义。
如果要按照定义来找因果关系,那么应该通过做实验,控制变量,改变某一个变量X,然后观察另一个变量Y是否跟着改变。但是实际上很多情况下我们只有大量的统计数据,而非实验结果,而且,有些情景我们也无法做实验,比如有违反科学伦理的内容,或者由于客观条件不可能开展实验的,比如宏观经济现象我们就无法通过实验来证明,只能通过已有的数据来进行分析。那么,如何从各个变量的数据集中找到他们的因果关系,就是因果推断的基本内容。
因果推断实际上是学习一个图(graph),就是图论里的那个图。变量作为顶点vertices,是否有因果关系为边edge,这是一个无环图,但是也没有方向。换句话说,我们知道A和B有因果关系,但是究竟是A导致B还是B导致A,我们不知道。这样组成的因果网络一般叫做一个Markovian equivalence,也就是马尔科夫等价。既然是等价,也就说明这个无向图加上方向后的这些有向无环图(DAG)都是Markov等价的。
对图的结构,或者说骨架的学习,得到一个无向图。然后在对每条边确定方向。最终,我们得到的DAG,就可以表示这些变量之间的因果关系。这就是因果推断的基本流程。
在因果推断中,也有数学模型来表示因果关系。比如ANM模型,就是加性噪音模型,它把原因X和结果Y建模成:
Y=f(X)+NY = f(X) + NY=f(X)+N
也就是说,原因和结果之间又一个映射,并加上一定噪声。这里我们认为X和噪声N是不相关的。那么,反过来,如果用
X=g(Y)+N′X = g(Y)+N'X=g(Y)+N′
来表示两者关系,那么Y和N’就不如X和N那么独立。这就产生了一个不等性质。利用这个不等性质,就可以通过各种手段把方向确定下来。
对于实际数据,通常分成continuous和discrete来研究。对不同的数据类型,也有不同的方法被提出。
后面的几篇主要集中在ANM模型相关,以及离散数据类型的causal inference。
2019年03月12日22:41:50
因果推断(Causal Inference)概要相关推荐
- 因果推断在阿里文娱用户增长中的应用
导读:如何实现产品的用户增长?显然,这是各家移动互联网应用的头等大事,也是悬在各家业务负责人头上的"天问".在移动互联网进入下半场的大趋势下,过去粗放式的买量.厂商合作等模式越来越 ...
- 【推荐实践】因果推断在阿里文娱用户增长中的应用
分享嘉宾:天师 阿里文娱 高级算法专家 编辑整理:Hoh 内容来源:阿里文娱技术 出品平台:DataFunTalk 导读:如何实现产品的用户增长?显然,这是各家移动互联网应用的头等大事,也是悬在各家业 ...
- 因果推断笔记——数据科学领域因果推断案例集锦(九)
文章目录 1 腾讯看点:启动重置问题 1.1 观测数据 . 实验数据的理论介绍 2.2 启动重置问题阐述:短期.长期.异质 2.3 短期影响的解决 2.4 长期影响构造准实验 2.5 异质性用户 1. ...
- 耿直:统计学中的因果推断问题(Causal Inference)
来源:量化研究方法 本文约3000字,建议阅读5分钟. 数学科学学院耿直老师为你介绍统计学中的因果推断问题. 今天,小编带来了数学科学学院耿直老师关于统计学中因果推断问题的介绍.文中介绍了几种分析因果 ...
- python 因果推断_因果推断书Causal inference:What if简介(附:因果推断书单推荐)...
Causal Inference: What If 内容简介:本书由哈佛大学 Miguel Hernan.Jamie Robins 教授编著,对因果推理的概念和方法做了系统性阐述.该书在知乎等各大平台 ...
- 【因果推断与机器学习】Causal Inference: Chapter_1
机器学习与因果推断 Chapter 1:the introduction of Causal Reasoning Introduction 机器学习算法越来越多的被应用到生活的方方面面,其中很大一部分 ...
- Introduction to Causal Inference:Chapter 1因果推断概论
本文是学习brady neal于2020年开设的因果推断课程Introduction to Causal Inference的记录 概述 本chapter主要分四个部分: 辛普森悖论 为什么相关性不是 ...
- 推荐系统的因果推断:Causal Inference for Recommender Systems(RecSys,2020)
文章目录 说明 1. 推荐和因果 2. 理论做法 2.1. 符号说明 2.2. 潜在结果下的矩阵分解 2.3. 忽略性假设 2.4. 经典因果推断 3. 去混杂因素推荐器 3.1. 曝光模型 3.2. ...
- 2020年因果推断综述《A Survey on Causal Inference》
最近阅读了TKDD2020年的<A Survey on Causal Inference>,传送门,自己对文章按照顺序做了整理,同时对优秀的内容进行融合,如有不当之处,请多多指教. 文章对 ...
- 计算机术语表达因果,因果推断简介之五:因果图 (Causal Diagram)
原标题:因果推断简介之五:因果图 (Causal Diagram) 编辑部于2019年10月在微信端开启<朝花夕拾>栏目,目的是推送2013年(含)之前主站发表的优秀文章,微信端与主站的同 ...
最新文章
- PyTorch 笔记(04)— Tensor 属性方法(获取元素个数numel/neleme、查看形状size()/shape、增减维度squeeze()/unsqueeze()、resize形状)
- 来聊聊可形变卷积及其应用
- R语言一键批量完成差异统计和可视化
- Linux定时任务Crontab执行PHP脚本
- RIPv1 与 RIPv2 基础配置
- G6 图可视化引擎——简介
- 来自微信团队的6个开源项目
- iOS 友盟分享(微信)
- php新年倒计时源码,2020年-新年倒计时HTML源码
- win10亮度无法调节,怎么处理
- 大数据开发之在idea中开发第一个hadoop程序
- 微信开发_Exception_02_errcode:40164,errmsg:invalid ip 61.172.68.219, not in whitelist hint
- allegro放置器件无法放_allegro 放置元件处无复选框,导致无法放置元件错误。
- 【解决方案】幼儿园安全事件频发,EasyCVR搭建幼教行业连锁园区视频监控系统让家长更放心
- java制作玩游戏并支付游戏币_Java7循环结构综合练习
- 计算机指令中的操作部分指的是什么,什么是指令?计算机的指令由哪两部份组成?什么是程序?...
- 其他公司应用Ceph的具体方案
- FFmpeg学习之八(FFmpeg源码编译)
- 网站被篡改怎么办?如何防护网站被黑
- oracle rman恢复表空间,rman备份恢复表空间