你的标签错了,而且错了很多!

一元@炼丹笔记

在推荐搜索的建模中,我们经常会使用D+1天的数据作为label,从1~D天的数据中的进行特征抽取等工作,和我们时间序列问题建模类似,但和很多其他的时间序列问题建模不一样的地方在于,我们的label不一定可靠,比如在传统的时间序列回归中,D+1天的销量是多少就是多少,我们没有太多的犹豫,因为不大会有其他的情况。但是在电商的问题中,就存在下面这种情况:

D+1天未购买可能并不一定是真正意义上的未购买,而可能是加入购物车或者意愿清单了, 只是没有在当天下单, 而是过了一天在D+2天的时候下了单, 而这样的标签如果我们直接默认其为负样本就会有较大的问题,因为它并不是真正意义上的负样本,只是反馈延迟了。

这在搜索推荐系统中,我们称之为延迟反馈的问题。

那么这个问题严重吗?如果只有1%不到的数据在第二天甚至之后出现了延迟,那么或许并不是一个问题,但实际呢?在Criteo公司早期,

  • 有35%的商品会在点击后一个小时内得到转化;
  • 有50%的商品会在点击后24h内得到转化;
  • 有13%的商品会在点击后2周之后才得到转化。

那么如何解决该问题呢?

对时间延迟建模

这个问题较早在2014文章Modelling Delayed Feedback in Display Advertising中被提出,该文十分经典,同时提出的问题十分具有实践价值,但是已经过去了6年, 本文我们就研讨最新的IJCAI20关于CVR预估标签延迟的paper.《An Attention-based Model for CVR with Delayed Feedback via Post-Click Calibration》。

最新延迟反馈论文解读

问题背景

在早期对于标签反馈延迟的建模都是建立在LR等传统模型上,会存在模型表示能力欠缺以及需要大量人工专家特征的问题,本文将传统的模型替换为现在火热的深度学习模型,从而大大提高模型的表示能力。

但是在深度模型用于推荐问题时,又会出现大量类别特征EMbedding的稀疏性问题,这在CTR建模的时候是很容易得到解决的,因为CTR数据集是非常大的,模型往往可以学习到不错的Embedding信息,但是CVR的数据集是相对较小的。

所以如何解决数据稀疏性的问题是一个非常大的挑战;

此外,早期的文章都假设,也就是说,用户在点击商品之后到现在的时间是不影响我们商品的最终转化以及转化时间,这其实是不对的。

很明显地,用户在点击完某个商品之后对于其他商品的点击会影响最终是否会购买该商品?

以及最终购买该商品的时间(本文做了一定泛化,依然假设点击item之后到目前的时间不会影响最终商品是否会转化,但是会影响商品最终转化的时间)。

所以本篇文章就是Focus在解决数据稀疏性以及标签延迟反馈的问题上提出了一种新的解决方案。

下面我们看看本文是如何来解决这两大挑战的。数据稀疏性问题&时间延迟建模

模型部分

数据稀疏性问题

为了处理因为数据样本量稀少而带来的大量ID特征学习不充分的问题,本文使用预训练好的Telepath从Item的图像中学习得到结果替换稀疏的ID特征,以此来缓解该问题。从文章最后的实验中我们也发现,数据稀疏性带来的影响是巨大的,具体地可以参见实验部分。

转化模型&时间延迟模型

在稀疏ID的Embedding处理完成之后,接下来我们看一下我们的模型框架,

本文的模型框架主要分为左右两个模块,左侧的转化模型以及右侧的时间延迟模型。

1.左侧转化模型

我们可以用自己设计的网络结构来构建自己的转化模型. 本文的转化模型的构建主要有三个模块,我们由后往前看,

2.时间延迟模型

2.1 关系梳理

和《Modeling Delayed Feedback in Display Advertising》论文中类似,我们还需要得到

我们将转换的延迟时间全部转化为天的粒度, 在Survival Analysis中我们知道, 只要得到其中任意一个的表示,就可以得到其他的表示,也就是说我们对f(t)或者s(t)进行假设之后,就可以推导得到f(t),h(t)以及s(t)三者的表示.

2.2 网络表示

那么接下来我们只需要看一下该概率是如何通过网络层进行表示的,具体可以参考文章给出的右侧的网络大致框架进行解读。和之前的一样,我们由后往前看,

实验结果

1.整体性能比较

我们看一下本文的实验结果,

从上面的实验中,我们发现:

  • Item的Embedding初始化对效果的影响是巨大的;
  • Time Delay模块的影响仅次于Item的Embedding初始化;
  • SelfAttention的影响是WP1和JD-MP数据集上的影响是相对较小的。

2.Time Delay分析:

我们从Figure2中可以看到,我们的在训练集和测试集上的时间延迟分布是类似的,此处我们用Jensen-Shannon divergence来刻画不同模型对于time delay的预测,而从结果上看,本文的算法对于时间延迟的预测也是最好的。

一本有仙气的笔记,记录了AI里的不凡

标签修正:CVR预估时间延迟问题相关推荐

  1. 负样本修正:CVR预估时间延迟问题

    你的标签错了,而且错了很多! 一元@炼丹笔记 在推荐搜索的建模中,我们经常会使用D+1天的数据作为label,从1~D天的数据中的进行特征抽取等工作,和我们时间序列问题建模类似,但和很多其他的时间序列 ...

  2. 搜索推荐炼丹笔记:CVR预估中的延迟反馈问题

    CVR预估中的延迟反馈问题 一元@炼丹笔记 问题描述 在很多推荐搜索的建模中,我们经常会使用D+1天的数据作为label,从1~D天的数据中的进行特征抽取等工作,和我们时间序列问题建模类似,但和很多其 ...

  3. CIKM 2021 | AutoHERI: 基于层次表示自动聚合的 CVR 预估模型

    本文主要介绍阿里妈妈大外投广告算法团队在 CVR 预估模型与多任务学习方法上的一些探索.我们提出了一种基于层次表示自动聚合的 AutoHERI 模型(Automated Hierarchical Re ...

  4. 推荐系统模型之: 基于层次表示自动聚合的 CVR 预估模型

    猜你喜欢 0.某视频APP推荐策略和推荐算法详解 1.如何搭建一套个性化推荐系统? 2.内容推荐策略产品经理的方法与实践 3.京东推荐算法精排技术实践 4.微博推荐算法实践与机器学习平台演进 5.腾讯 ...

  5. [阿里]基于多任务学习的CVR预估模型ESM2

    今天介绍的文章名称是<Conversion Rate Prediction via Post-Click Behaviour Modeling> 论文下载地址为:https://arxiv ...

  6. 【搜索/推荐排序】FM,FFM,AFM,PNN,DeepFM:进行CTR和CVR预估

    文章目录 1.FM 1.1代码-是否点击预测 效果和参数量级 1.3 和其他模型的比较 SVM MF 2. FFM one-hot的比较 eg 训练注意事项 效果和参数量级 实现 3. AFM 4.F ...

  7. 【雅虎2017】一个在线展示广告的CVR预估框架实践

    论文 A Practical Framework of Conversion Rate Prediction for Online Display Advertising 定期更新,获取更多,欢迎st ...

  8. 阿里CVR预估模型之ESMM

    本文介绍 阿里妈妈团队 发表在 SIGIR'2018 的论文<Entire Space Multi-Task Model: An Effective Approach for Estimating ...

  9. RS Meet DL(76)-CVR预估中的延迟反馈问题建模

    1.背景介绍 在展示广告场景中,有多种多样的计费方式,如按每次展示计费CPM.按每次点击计费CPC.以及按每次转化计费CPA.但不论何种计费方式,在实时竞价的场景下,供给方(媒体)对于广告的排序基本都 ...

最新文章

  1. 【radar】毫米波雷达动态障碍物检测相关论文汇总(聚类、分类、稀疏2D点、4D点、雷达成像、原始数据处理)(4)
  2. vue中textarea标签自适应高度
  3. 第一个出现一次的字符
  4. IDEA运行VUE项目
  5. RabbitMQ事务和Confirm发送方消息确认——深入解读
  6. makefile工作笔记0003---Makefile的ifeq逻辑或,逻辑与的变通实现
  7. Java编程解密-Dubbo负载均衡与集群容错机制
  8. 生物聚集细胞生物化学反应的组织者Biomolecular condensates: organizers of cellular biochemistry
  9. 原创 leetcode[349]两个数组的交集/ Intersection of Two Arrays 哈希策略
  10. 【转载】教你使用 Reflexil 反编译.NET
  11. ZZULIOJ:1047: 对数表
  12. 实现OPEN 哈希表模板类
  13. 获取通过谷歌Google广告下载AndroidAPP并登录用户数量
  14. 微信小程序注册教程-详细图文教程
  15. python中--snip--是什么意思
  16. c语言中.def文件,VC++中的.DEF文件详解
  17. MYSQL 只能回环口链接_loopback回环口详解
  18. [HNOI2018]毒瘤
  19. 我们使用 Kafka 生产者在发消息的时候我们关注什么(Python 客户端 1.01 broker)...
  20. spark(day05)

热门文章

  1. (2.19)备份与还原--备份的原理与总结
  2. IIS中 flv、swf 文件无法播放
  3. Delphi 2009 超前预知!
  4. jsdk php,jsdk.php · webeautiful/dashpianku - Gitee.com
  5. mysql5.6 pt-query-digest,分析pt-query-digest输出信息
  6. Android(五)——控制UI界面的方法
  7. python tensorflow教程推荐_TensorFlow教程和文章推荐大全 -DZone AI
  8. SCI论文写作--中科院自动化所牛博士教你如何搞科研
  9. 参考用-惯性导航系统简介(转载)
  10. Java实现归并排序 Merge Sort