今天分享的是阿里在SIGIR2022中稿的一篇短文,主要关注点在于对广告推荐链路中精排阶段和创意优选阶段的优化,一起来看一下。

1、背景

广告系统中,创意(如标题和图片)包含了丰富的产品信息,能够帮助用户快速了解产品。相同的广告通常情况下有不同的创意,如下图所示,但不同创意的CTR可能有较大的差别,有的用户可能偏好于带促销信息的图片,而有的用户偏好于简明的图片风格。因此基于用户的不同偏好,选择合适的广告创意展现给用户,对于广告系统来说是十分重要的一环。

现有的广告推荐系统,为了平衡效果和性能,大都数采用串行多阶段的架构,包括广告召回、广告精排阶段。精排阶段是重点优化的部分,往往通过复杂的模型结构对效果进行优化。出于计算复杂度的考虑,精排阶段往往无法将所有的候选创意都考虑在内,假设每个广告有3个候选创意,计算所有创意对应的CTR会使QPS增长为3倍,因此大多选择随机的创意或者统计CTR最高的创意作为精排阶段的输入。在精排阶段之后,再对每个广告选择合适的创意进行展示。这种架构下,精排阶段输入的并非最终展示的创意,因此创意对于排序的影响是比较小的,对于效果会有一定的影响。

打开收益空间上限的一种理想的优化方式是将创意前置,如放在召回和精排中间,在精排前首先为每个广告选择合适的创意,再进行精排CTR的预估。但这种方式仍然存在以下两方面的挑战:
1)从效率上:多个广告创意的预估计算量级会显著的提升,如何解决创意优选前置带来的耗时问题?
2)从效果上:大部分的广告创意没有得到足够的曝光,在数据稀疏的情况下,如何提升创意选择的准确性?

为了解决效率和效果两方面的问题,论文提出了Cascade Architecture of Creative Selection (CACS)的框架,将创意优选和精排预估做了良好的联动,一起来看一下。

2、CACS架构介绍

2.1 整体架构

CACS架构如下图所示:

相较于现有的大多数框架,CACS将创意选择前置到精排之前,首先进行广告内部的创意选择,再进行广告间的CTR排序。在创意选择过程中,首先,引入双塔结构,有效控制创意阶段的耗时,其次,引入蒸馏学习,来重点学习创意的优先顺序而非准确的CTR预估值,同时也可以在一定程度上减小模型的大小,减少耗时,最后,通过自适应的dropout网络,来学习创意的多模态信息表示,通过多模态的side-information来减少创意没有足够曝光所带来的影响。接下来,对这两部分的具体结构进行介绍。

2.2 List-wise Ranking Distillation

在创意优选阶段,重点是预估准确的创意之间的序关系,而非准确的CTR预估值, 因此论文提出了List-wise Ranking Distillation方法,引入精排阶段的模型进行蒸馏学习。

在loss设计上,并非直接学习精排模型给出的CTR值,而是通过交叉熵损失,使得创意选择模型给出的top1的创意和精排模型给出的top1的创意尽可能接近。具体来说,假设创意优选模型计算的score为{s1,s2,...,sm},精排模型给出的score为{y1,y2,...,ym}。假设第i个创意为精排给出的top1的创意,那么loss计算如下:

2.3 Adaptive Dropout Network

由于大多数创意没有足够的展示,因此仅仅使用ID特征会面临数据稀疏的问题,很多ID对应的Embedding无法进行充分的学习,因此在输入特征上,引入了标题、图片等多模态的side-information。并通过CNN和Bert等对图像和文本信息进行处理。不同用户对于不同模态的信息关注程度不同,进一步引入Attention机制来对用户的模态信息偏好进行建模。

另一方面,为了减少ID特征对于最终结果的影响,论文提出了自适应的Dropout网络,基于ID对应的曝光量自适应计算Dropout的比例,如果曝光次数越多,ID学习越充分,此时可以更多依赖ID信息来进行预测,dropout的比例可以适当减少,反之增加,过滤比例计算如下:

基于每个创意的dropout比例,通过伯努利分布计算得到对应的mask,再乘上相应的系数保证训练和预测阶段的分布一致:

论文的基本思路就介绍到这里,接下来看一下实验结果。

3、实验结果

论文的实验结果分离线和在线两部分。首先来看下离线部分,离线实验主要关注创意选择方法的准确性,结果如下:

线上部分主要关注CACS架构和无创意优选模块以及传统创意选择架构的对比,关注效果和耗时两方面,结果如下:

好了,论文就介绍到这里,感兴趣的同学可以阅读原文~

推荐系统遇上深度学习(一三七)-[阿里]广告精排和创意优选联合优化相关推荐

  1. 推荐系统遇上深度学习(八十七)-[阿里]基于搜索的用户终身行为序列建模

    本文介绍的论文是<Search-based User Interest Modeling with Lifelong Sequential Behavior Data for Click-Thr ...

  2. 推荐系统遇上深度学习(十七)--探秘阿里之MLR算法浅析及实现

    阿里近几年公开的推荐领域算法可真不少,既有传统领域的探索如MLR算法,还有深度学习领域的探索如entire -space multi-task model,Deep Interest Network等 ...

  3. 推荐系统遇上深度学习(一三九)-[阿里]商品属性变化感知的分层注意力演化网络CAEN...

    今天给大家带来Recsys2022上阿里中稿的一篇文章.商品的属性如价格,评分等对于用户在电商场景下的行为决策起着较为重要的作用,但过往的推荐系统大都关注用户历史行为的建模,而对于商品属性的变化很少关 ...

  4. 推荐系统遇上深度学习,9篇阿里推荐论文汇总!

    作者 | 石晓文 转载自小小挖掘机(ID: wAIsjwj) 业界常用的推荐系统主要分为两个阶段,召回阶段和精排阶段,当然有时候在最后还会接一些打散或者探索的规则,这点咱们就不考虑了. 前面九篇文章中 ...

  5. 推荐系统遇上深度学习(九十二)-[腾讯]RecSys2020最佳长论文-多任务学习模型PLE

    今天介绍的是腾讯提出的一种新的多任务学习个性化推荐模型,该论文荣获了RecSys2020最佳长论文奖,一起来学习下! 1.背景 多任务学习通过在一个模型中同时学习多个不同的目标,如CTR和CVR,最近 ...

  6. 推荐系统遇上深度学习(三十九)-推荐系统中召回策略演进!

    推荐系统中的核心是从海量的商品库挑选合适商品最终展示给用户.由于商品库数量巨大,因此常见的推荐系统一般分为两个阶段,即召回阶段和排序阶段.召回阶段主要是从全量的商品库中得到用户可能感兴趣的一小部分候选 ...

  7. 知识图谱论文阅读(八)【转】推荐系统遇上深度学习(二十六)--知识图谱与推荐系统结合之DKN模型原理及实现

    学习的博客: 推荐系统遇上深度学习(二十六)–知识图谱与推荐系统结合之DKN模型原理及实现 知识图谱特征学习的模型分类汇总 知识图谱嵌入(KGE):方法和应用的综述 论文: Knowledge Gra ...

  8. 推荐系统遇上深度学习(十九)--探秘阿里之完整空间多任务模型ESSM

    欢迎关注天善智能,我们是专注于商业智能BI,人工智能AI,大数据分析与挖掘领域的垂直社区,学习,问答.求职一站式搞定! 对商业智能BI.大数据分析挖掘.机器学习,python,R等数据领域感兴趣的同学 ...

  9. 推荐系统遇上深度学习(二十)--探秘阿里之完整空间多任务模型ESSM

    笔者是一个痴迷于挖掘数据中的价值的学习人,希望在平日的工作学习中,挖掘数据的价值,找寻数据的秘密,笔者认为,数据的价值不仅仅只体现在企业中,个人也可以体会到数据的魅力,用技术力量探索行为密码,让大数据 ...

最新文章

  1. 干货丨从概念到案例:初学者须知的十大机器学习算法
  2. 百年通信史:落后西方半世纪的中国,用 20 年绝地反杀! | 文末送福利
  3. Android:30分钟弄明白Touch事件分发机制
  4. 深度学习中,Batch_Normalization加速收敛并提高正确率的内部机制
  5. 云原生下,如何实现高可用的MySQL?
  6. AgileConfig-如何使用AgileConfig.Client读取配置
  7. 为什么需要动态SQL
  8. 命令行查看图片_you-get:使用命令行工具下载网络资源,可下载 B 站视频
  9. 嵌入式Linux系统编程学习之十一Linux进程的创建与控制
  10. 13-Mybatis 注解开发
  11. 物理安全是指保护计算机,计算机网络 物理安全
  12. c++socket发送文字少一个字符_Socket粘包问题的3种解决方案,最后一种最完美
  13. 【层级多标签文本分类】融合标签层级结构的文本分类
  14. Face2Face: Real-time Face Capture and Reenactment of RGB Videos 论文翻译
  15. 上海计算机一级和四六级,上海市关于英语四六级考试的改革通知
  16. vcf格式(vCard)转成excel的操作方法
  17. Android Studio查看错误信息
  18. HTML表格做个人简历
  19. 支付宝周期扣款(支付后签约)业务功能总结(php+golang)
  20. 网络安全专业应该从事哪个方向前景比较好。。?

热门文章

  1. 产品迭代团队协作敏捷流程图
  2. mysql 安顺寻_16名被拐宝贝到安顺寻亲 6个“贵州娃”与家人团圆
  3. 办公室局域网打印机共享设置
  4. 单屏(全屏)适配解决方案(jQuery插件)
  5. CocosCreator中移动摄像机之后转世界坐标
  6. GEE水体提取之NDWI(矢量裁剪、统计面积、数据导出)
  7. 【docker基础用法】
  8. 6套毕业设计PPT模板拯救你的毕业答辩
  9. Linux(一)操作系统基础知识
  10. Bzoj3583 杰杰的女性朋友