概念和区别

  • 相关性(correlation):两变量在表现上呈现一定的关系,如:夏天用电量很高,夏天冰激凌卖的很好,用电量 和 冰激凌的销量呈现相关性,但没有因果关系
  • 因果性(causality):两变量存在原因和结果的关系,如:夏天温度上升导致冰激凌卖的很好,这是因果性

因果性模型

  • 因果关系挖掘(causal discovery):研究变量间是否存在因果性,以及谁是因谁是果
  • 因果推断(causal inference):定量地研究原因与结果的变化关系

目标

对于因果推断,我们的目标是根据观察数据估计干预效果。

应用领域

  • 广告:广告投放效果,营销预估
  • 推荐:将一个商品推荐给一个用户的过程是一种干预
  • 医疗治疗:A/B治疗和因果推断,本身是一个较成熟的领域
  • 强化学习:强化学习中的action可以看作因果模型的干预,reward可以看做潜在结果[Eligibility traces for off-policy policy evaluation]

因果推断的基本概念

核心思想是比较同一研究对象在接受干预和不接受干预时的结果差异,认为这一差异就是干预的效果

基础概念

  • Unit(个体):被干预的基础对象
  • Treatment(干预):附加在个体上的操作,如:短信、push触达、红包、优惠券发放等
  • Potential outcome(潜在结果):可能的结果空间
  • Observed outcome(观测结果):个体被干预后的实际结果
  • Counterfactual outcome(反事实结果):如果个体收到实验中不同的干预,它的可能结果,不可观测
  • Pre-treatment variables(处理前变量, 类似强化学习的env,Context):不会受干预影响的变量
  • post-treatment variables(处理后变量):受到干预影响的变量

干预效果(treatment effect)

治疗效果可以在:【整体人群】【干预组(treatment)】【部分人群(subgroup)】【个体(individual)】纬度上进行测量。W=1表示干预组,W=0表示对比组,以下在不同纬度的人群下面的干预效果的衡量公式:

  • ATE(Average Treatment Effect)平均干预效果:ATE = E[Y(W=1) - Y(W=0)];Y(W=1),Y(W=0) 分别代表干预和对比组的结果,是一个统计期望值,和个体无关
  • CATE(Conditional Average Treatment Effect)部分平均干预效果:CATE = E[Y(W = 1)|X = x] − E[Y(W = 0)|X = x];Y(W = 1)|X = x ,Y(W = 0)|X = x 代表在人群x下,干预组和对比组的结果期望值
  • ITE( Individual Treatment Effect)个体干预效果:ITEi = Yi(W = 1) − Yi(W = 0);Yi(W = 1) ,Yi(W = 0) 代表个体i在干预组和不干预组的表现

假设

  • Stable Unit Treatment Value Assumption (SUTVA):个体的独立互不影响;干预是一致的
  • Ignorability:人群的潜在结果和人群有关,和是否干预不依赖
  • Positivity:要求在给定环境变量X下,样本需要遍历全部干预

选择偏置和一般解决方案

  • 选择偏置:影响干预分组和结果的变量,比如:年龄,性别这种特征,如果分配比例不均衡,严重影响结果

    • 干预组A的Yong/Older的结果都比干预组B的低,但是A的结果比B的高,因为A/B两种的
    • 实际,A组的偏年轻多了,所以效果肯定更高
  • 解决选择偏置的方法
    • 第一种通用方法通过创建一个近似于干预组的伪组来处理选择偏差。可能的方法包括样本重新加权、配、基于树的方法、混杂平衡、等
    • 另一种通用方法首先仅根据观察到的数据训练基础潜在结果预估模型,然后纠正由选择偏差引起的估计偏差。 比如:元学习

下一章讲因果推断的方法

用户增长因果推断概念相关推荐

  1. 用户增长因果推断方法

    论文:https://arxiv.org/pdf/2002.02770.pdf 因果推断的方法包括7个: 重新加权方法(Re-weighting methods); 分层方法(Stratificati ...

  2. 因果推断6--多任务学习(个人笔记)

    目录 1多任务学习 1.1问题描述 1.2数据集 1.3网络结构 1.4结果 2因果推断使用多任务方式 2.1DRNet 2.2Dragonet 2.3Deep counterfactual netw ...

  3. 数据分析实战(一百零一):项目分析思路 —— 用户增长实践经验分享

    版权声明:本文为博主原创文章,未经博主允许不得转载. 文章目录 一.项目分析 1.1 用户发展路径 1.1.1 用户生命周期 1.1.2 数据附能方式 1.2 基于用户的目标构建体系:KPI 体系 1 ...

  4. 【因果学习】因果推断分析

    #01.因果推断概念 相关不是因果,事物间的因果关系常常是我们经常要面对和分析的问题,研究因果的意义是我们需要理解数据并据此做出进一步的行动和决策.比如对于我们而言,常常会想要知道"学历越高 ...

  5. 因果推断在阿里文娱用户增长中的应用

    导读:如何实现产品的用户增长?显然,这是各家移动互联网应用的头等大事,也是悬在各家业务负责人头上的"天问".在移动互联网进入下半场的大趋势下,过去粗放式的买量.厂商合作等模式越来越 ...

  6. 【推荐实践】因果推断在阿里文娱用户增长中的应用

    分享嘉宾:天师 阿里文娱 高级算法专家 编辑整理:Hoh 内容来源:阿里文娱技术 出品平台:DataFunTalk 导读:如何实现产品的用户增长?显然,这是各家移动互联网应用的头等大事,也是悬在各家业 ...

  7. 如何用因果推断和实验驱动用户增长? | 7月28日TF67

    因果推断是数据科学领域一个重要的分支.通过系统实验发现.探索和推断事物间的因果关系,一直是人类认识世界的基本方式和现代科学的基石,也是数据科学中的一个核心问题.本期活动汇集了跨行业的互联网资深数据科学 ...

  8. 倾向性模型,因果推断以及用户增长的驱动力发现

    点击上方"AI公园",关注公众号,选择加"星标"或"置顶" 作者:Edwin Chen 编译:ronghuaiyang 导读 倾向模型的使用 ...

  9. 因果推断-重要概念:ATE/CATE/ITE/ATT

    开个专栏记录一下数据分析中因果推断的知识点,这篇会先引入一些因果推断中的重要概念. ATE:Average Treatment Effect,平均处理效应.实验组的平均处理效应.比如实验组上线了新的推 ...

  10. 信息流推荐的用户增长机制

    分享嘉宾:天师 阿里巴巴 高级算法专家 编辑整理:王洪达 出品平台:DataFunTalk 导读:本文主要从偏向底层的推荐算法角度来阐述信息流推荐系统升级如何助力用户增长.我们知道,内容信息流实际上已 ...

最新文章

  1. 【opencv】YUV各种色彩、YUV420sp2RGB
  2. 科普漫画:什么是区块链?
  3. 5G与WiFi 6之争,对物联网意味着什么
  4. vscode python环境配置_用VScode配置Python开发环境
  5. Sharepoint学习笔记—Site Definition系列-- 3、创建ListDefinition
  6. css基础媒体查询和rem
  7. 业务复杂就用 if-else?刚来的技术大佬用这招彻底干掉了!
  8. 一般柱子与柱子的距离_建筑中柱子之间的距离多少为好?
  9. 宿主机进程挂载到容器内_微服务架构之 容器技术
  10. 广数系统u盘支持什么格式_数控车床编程导入u盘 数控车床u盘读不出来
  11. 区块链技术学习路线图,区块链技术教程分享
  12. Java图片处理:ico格式转PNG/JPG等格式
  13. c语言的vcl库函数下载,VCL手册 PDF
  14. 《失控》书摘与读书笔记
  15. 垃圾分类很难吗?这是一篇来自AI垃圾回收箱的灵魂拷问…
  16. 蓝牙 4.0 ATT属性协议
  17. All In One - 第7章 安全运营
  18. JPA 链表查询,子查询操作
  19. 【C4D】DNA螺旋
  20. 这个 Spring 循环依赖的坑,90% 以上的人都不知道

热门文章

  1. java计算机毕业设计婴幼儿玩具共享租售平台源码+数据库+系统+lw文档+mybatis+运行部署
  2. allt什么意思_all是什么意思_all怎么读_all翻译_用法_发音_词组_同反义词_全部的-新东方在线英语词典...
  3. python index 报错_Python3 抓取数据报错IndexError: list index out of range
  4. Photoshop_如何使用
  5. 1.3 Go语言上手-高质量编程与性能调优实战
  6. 进一步限塑!洲际酒店集团与联合利华达成合作,旗下酒店将提供大瓶装洗护用品替换一次性小包装 | 美通社头条...
  7. Apache jmeter 压测
  8. 任意进制加法计数器电路设计
  9. STM32 ST-LINK Utility使用步骤
  10. 平行时代的平行智能体系(王飞跃)