因果推断-增益模型综述 :http://proceedings.mlr.press/v67/gutierrez17a/gutierrez17a.pdf​​​​​​​

名词/缩写 英文全称 名词解释 备注
treatment   干预、实验组  
control   不干预、控制组  
uplift model uplift model 增益模型: 预测某种干预treatment的增量的模型  
CE   causal effect 因果效应:  用户在干预和不干预的情况下的提升,即干预前后结果的差值。
ACE Average Causal Effect 平均因果效应:  取所有用户的因果效应期望的估计值来衡量整个用户群的效果。  
ITE Individual Treatment Effect 个体因果效应()  
ATE Average Treatment Effect 平均因果效应 所有用户的因果效应期望。
CATE Conditional Average Treatment Effect 条件平均因果效应 所有用户的因果效应期望。
Conditional是指基于用户的特征。
CIA Conditional Independence Assumption 条件独立假设 用户特征和干预策略相互独立。
AB实验的两组样本在特征分布上基本一致,即满足CIA。
ATT   只关注treatment的ATE  
ATC   只关注control的ATE  
Meta-learning methods Meta-learning methods 元学习方法  
S-learner Conditional Outcome Modeling  (COM)   将treatment作为特征,干预组和非干预组一起训练,解决bias不一致的问题。
问题: 特征维度很高,干预/不干预只有1-dim,容易导致treatment效果丢失。
T-Learner grouped Conditional Outcome Modeling (Grouped COM / GCOM)   为解决COM中增益效果提升趋向于0的问题。模型加强了对T的权重,其他流程跟COM一样。
X-Learner     在T-learner基础上,利用全量的数据进行预测,主要解决Treatment组间数据量差异较大的情况。
R-learner   R-learner的思路将问题转化为定义损失函数R-loss的形式进行学习训练,更专注残差。  
标签转换方法 The Class Transformation Method  

适用于treatment、 outcome都是二分类的情况。通过将预测目标做转换,实现one model的预测。
解决实验组、对照组用户分组概率问题:
(1)数据重采样,个人建议下采样
(2)引入用户倾向分,即每个用户倾向于被分配到实验组、对照组的概率。

增量直接建模 Tree-Based Method    
分布散度     常见的分布散度有KL散度、欧式距离、卡方散度。
因果森林 CausalForest   因果森林的核心是把一个个建立好的因果树 causal tree(或 uplift tree)做组合ensemble,把每棵因果树计算出的干预结果取平均。
CTS算法 Contextual Treatment Selection    
基于神经网络的方法 NN-Based Method    
DragonNet      
uplift柱状图   计算流程:
(1)在测试集上,将实验组和对照组分别按照模型预测出的增量由高到低排序,根据用户占比,分别划分10等份,即Top10%, 20%,…100%
(2)分别计算Top10%, 20%,…100%的用户平均预测转化概率,即Avg(y-pred),预测分数的均值,然后相减作为这个十分位分组内的提升uplift,绘制柱状图
基尼曲线 Qini Curve 计算流程:
(1)在测试集上,将实验组和对照组分别按照模型预测出的增量由高到低排序,根据用户占比,分别划分10等份,即Top10%, 20%,…100%
(2)计算Top10%, 20%,…100%的Qini系数,生成Qini曲线数据(Top10%, Q(Top10%)),…(Top100%, Q(Top100%))

1、Qini系数计算公式:Q(i)
2、因为Qini系数分母是实验组和对照组的总样本量,如果样本量差异比较大,结果将变得不可靠。

调整Qini曲线 Adjusted Qini Curve 调整Qini曲线是为了避免实验组和对照组数据不均衡而导致Qini系数失真而设计的。

1、Aqini系数计算公式:

AUUC
增益曲线面积
Area Under the Uplift Curve  uplift曲线如何绘制?
使用AUUC评价模型时,优点是可以避免实验组和对照组用户数量差别较大导致的指标不可靠问题。
但,当分桶时,对照组边界点预估出的增量与实验组边界点的预估有较大差别的时候,Qini曲线和AUUC两个指标都不可靠。要选AUUC的另一个计算方法。

1、AUUC指标计算公式:G(i)

AUUC非平衡情况分析   如果实验组和对照组满足随机性,但不平衡,即不是1:1或 P(T=1|x)=q, q!=0.5概率。那么增益曲线uplift curve:  
AUUC优化-降低方差      
累积增益曲线 Cumulative Gain Curve   

1、指标计算公式:

uplift model增益模型相关术语概念名词汇总相关推荐

  1. 计算机网络相关术语概念名词汇总总结集合——摘自《计算机网络--自顶向下》第四章

    亲手摘自<计算机网络–自顶向下>的第四章,可以根据这些大概的复习书中的相关知识

  2. 模型相关术语:Model vs DTO vs Entity vs Value Object vs Pojo vs Bean

    此存储库的目标是明确一些术语的含义,这些术语在开发社区中造成了很多混乱.我想提一下,这个澄清将从Java开发人员的角度进行. 型模型 DTO 今天称为数据传输对象的模式在 Core J2EE 模式的第 ...

  3. TensorFlow(1)-模型相关基础概念

    TensorFlow-1 1.Graph对象 2.Session对象 3.Variabels变量 4. placeholders与feed_dict 5. tf.train.Saver() 模型参数保 ...

  4. COLI | DELPH-IN 相关术语及资源汇总

    Deep Linguistic Processing with HPSG (DELPH-IN) DELPH-IN: A project. Aimed at 'deep' linguistic proc ...

  5. 智能营销增益(Uplift Modeling)模型——模型介绍(一)

    文章目录 1 Uplift Modeling与reponse model模型的差异 1.1 增益模型与响应模型的差异 1.2 增益模型与响应模型的混淆 1.3 业务疑问与需求 1.3.1 多维度建模 ...

  6. 智能营销增益模型(Uplift Modeling)的原理与实践

    文章目录 增益模型因果与推论(Causal Inference) 增益模型的表示 差分响应模型(Two-Model Approach) 模型优缺点 差分响应模型升级版(One-Model Approa ...

  7. Leads、SDR、MQL、SQL、L2C术语概念,线索创建与清洗、线索分级模型、线索流转策略、线索的统计与分析

    CRM中的"Leads"是什么?笔者在文中不仅较为全面地介绍了相关术语概念,还分析了线索的创建与清洗.线索的分级模型.线索流转策略以及线索的统计与分析. 刚接触CRM时,抛出的第一 ...

  8. Twitter常用术语和名词解析

    注册了twitter很久,但除了用来聚合输出博客内容,方便那些喜欢用twitter的人follow更新之外,基本很少去看,更没有去研究.我甚至一度分不清"following"和&q ...

  9. 【软件工程】CMMI 能力成熟度模型集成 ( 简介 | 相关术语 | CMMI 等级评估次序 )

    文章目录 一.CMMI 简介 二.CMMI 相关术语 三.CMMI 等级评估次序 一.CMMI 简介 CMMI 全称 Capability Maturity Model Integration , 能 ...

  10. 机器学习的基本概念和相关术语

    文章目录 一.什么是机器学习 二.机器学习的相关术语 三.机器学习的典型任务 四.假设与假设空间 五.假设的选择原则 六.机器学习的三要素 推荐文章 一.什么是机器学习 人工智能标准化白皮书(2018 ...

最新文章

  1. 5 个刁钻的 String 面试题!
  2. 黄金矿工-收益最大化
  3. Gartner的2019战略性技术趋势:量子计算、区块链、AI
  4. zabbix中mysql连不上的排错_zabbix监控软件的使用排错
  5. 解读中国互联网:局部领先、快进的数字化发展
  6. bat 修改txt_多工作簿数据合并,还在复制粘贴就out了,同事用bat文件一秒搞定...
  7. ASP.NET 程序中常用的三十三种代码
  8. Linux中用户的简介与管理
  9. unity算法面试_Unity面试题汇总
  10. 【嵌入式Linux】嵌入式Linux驱动开发基础知识之按键驱动框架
  11. 2020 年,远程办公太难?技术大佬齐支招!
  12. 20145234黄斐《信息安全系统设计基础》第十周
  13. 青海贵德黄河岸边现雾凇奇观
  14. 心有所鼠,鼠年快乐~
  15. netty LEAK: ByteBuf.release() was not called before it's garbage-collected
  16. 用WAIK for Win7制作Winpe3.0
  17. 【图像分割】基于matlab直觉模糊C均值聚类图像分割IFCM【含Matlab源码 120期】
  18. [家里蹲大学数学杂志]第039期高等数学习题集
  19. cryptographic algorithms
  20. java对接银联商务扫码支付(银联商务扫码支付文档)

热门文章

  1. 【超硬核】秒杀活动技术方案,Redis申请32个G,被技术总监挑战了...
  2. 【更新中】SmartGit 注册码 算法注册机
  3. 2018 iOS 面试法宝+绝密文件
  4. pe卸载linux系统软件,Windows和Linux双系统下完美卸载linux
  5. Android保存图片到本地或者数据库,并通知相册更新
  6. 【电子学会】2021年12月图形化四级 -- 棕熊大战
  7. 软件开发培训学校四大培训标准,引领行业标杆
  8. BZOJ 2101: [Usaco2010 Dec]Treasure Chest 藏宝箱
  9. 移动4g手机信号测试软件,中移动4G网络测试:网速快但信号不稳
  10. markdown快捷键大全