导读:随着大数据和人工智能的技术进步,数字营销行业也在不断变化。得益于雄厚技术实力,爱奇艺效果广告得到蓬勃发展,实现了海量触达、定向精准、效果显著的广告投放,为广告主提供跨平台、多终端的网络推广服务。本次我将分享爱奇艺效果广告个性化方面的思考与实践,聚焦广告排序算法,希望能为大家带来一些启发。

包括以下三部分:

  • 爱奇艺效果广告算法 - 背景&架构

  • 点击&转化率预估 - 核心问题

  • 智能出价 - 博弈&共赢

爱奇艺效果广告算法-背景&架构

1. 广告资源位

如上图所示,爱奇艺主要的资源位可以用双引擎来概括,即信息流和框内:

  • 信息流:信息流广告位由准信息流和纯信息流共同构成的。其中,打开 App 显示的推荐页,由于是非原生信息,但是以信息流形式推送,所以我们称之为准信息流广告位。同时,爱奇艺平台提供了很多原生频道,比如热点频道,在这些频道下插入的广告称为纯信息流。

  • 框内:对于框内资源,效果广告主要投放在框内中插的位置上,同时也会做一些前贴和后贴的框内广告投放。

  • 其他:除上述两大引擎,还有猜你喜欢和视频关联位等资源位。

2. 计费方式

oCPX ( optimized CPX ) 业务是 oCPC ( optimized Cost Per Click ) 和 oCPM ( optimized Cost Per Mille ) 两种计费方式的统称,是从 CPX 业务演进而来,这里的 CPX 代表的是以点击计费和真实观看计费。

CPX 时代广告主投放广告是以点击作为计费方式,但广告主的真实诉求是点击后的转化行为。例如上图,一个 App 的广告,用户点击后的下载、安装、付费,这些转化行为才是广告主真正关注的。广告主为了提升从点击到转化的概率,会做很多离线优化,例如定向20-30岁女性或定向喜欢《亲爱的热爱的》电视剧的用户。但这样做可能会产生很多问题,比如定向粒度过细,目标人群少,导致广告放量效果不佳。

为解决上述问题,oCPX 的业务诞生了,优化目标从点击变成了后续的转化行为,广告主只需在投放广告时设置转化目标以及这个目标下的出价,其他的事情由算法模型来解决。

3. 算法难点

oCPX 业务对算法挑战难题主要为上图三点:

  • 转化样本非常高维稀疏,样本维度高且正样本量极少。

  • oCPX 业务复杂,比如需要支持安装转化、付费转化、关注公众号转化等类型。

  • 平台流量大,对计算规模时效要求高。

4. 个性化广告推荐流程

  • 召回:对候选广告进行召回,比如人群定向等。

  • 粗排:使用轻量级但保证精度的模型对广告做初选,避免精排阶段服务压力过大。粗排阶段还有冷启动和随机探索等功能模块,主要用于解决 E&E 问题,避免马太效应 ( 投放好广告越来越好,差的越来越差 )

  • 精排:使用高精度模型对点击率、转化率和智能出价进行预估。另外精排阶段还支持预算平滑功能。还有预算平摊到全时段等。

5. 排序逻辑

粗、精排的排序逻辑依照 eCPM ( effective Cost Per Mille ),也就是千次展示平台的预期收益来排序,其计算公式如上图所示,eCPM=点击率×转化率×出价×智能出价因子。

6. 线上训练推理流程

如上图自下而上:

1. 现场特征,相较离线特征,现场特征能真实还原线上环境。

2. 第二步进入模型训练,会有 FM 分天模型、FM 在线学习、深度学习和强化学习等。

3. 完成模型离线训练后推送至线上,结合离线、实时特征进行在线推理。

点击&转化率预估-核心问题

1. 特征工程

从周期来划分特征可分为实时、短期和长期。

  • 实时特征主要考虑场景特征,即上下文特征,比如用户在看到广告之前看了哪些视频;时间信息也是非常重要的实时特征,比如周末和工作日分时段的点击转化率表现就有很大差异;此外还有反馈特征,包括正反馈及负反馈,主要针对用户看过哪些行业的广告及后续转化行为。

  • 短期特征包含用户观影兴趣、搜索行为、社交行为和商业兴趣等。其中短期观影兴趣可能会发生变化,比如上图,如果有位女性用户怀孕了,她的观影兴趣可能会从长期的仙侠类视频短期切换到母婴类视频。

  • 长期特征有人口基础属性(性别年龄等)、观影兴趣、商业兴趣、广告基础属性(所处行业等)和素材质量等。这里的观影兴趣,依然举上图例子,这位女性用户可能喜欢参与仙侠类的讨论,喜欢出现在仙侠剧中的偶像等等,所以针对这位用户打得长期观影兴趣的标签是仙侠。

2. 在线学习

天下武功唯快不破,时效性对模型来说是非常重要的。当前线上使用的基于 FTRL 的 FM 模型,实时消费线上 Kafka 流的数据,分钟级进行模型更新。由于线上模型是分钟级更新,线上要有一套监控体系,一旦线上指标出现异动,比如上图举例的 AUC 低于离线分天训练的备用的模型,会进行线上模型与备用离线模型自动切换。

3. 深度学习

为了提高模型准确率和泛化能力,上线了深度学习,当前采用的是 Wide&Deep 的模型,并进行了离线模型调优和线上性能优化,以满足广告场景下对高 QPS 以及高稳定性需求。

4. 高维稀疏

在转化率预估场景下,会遇到数据高维稀疏问题。举个例子,在做偏差校准的时候,会出现很多分桶里面一个正样本都没有,进而导致这些分桶最终的预估转化率结果为零。为解决这个问题,采用的方法是动态分桶大小,根据当前广告下历史正样本数量,动态决定分桶宽度以及分布。

同时,转化率预估场景有滞后性问题,例如以 APP 作为推广目标的广告主设置转化目标为付费,但从用户点击广告到最终付费可能会经历很长的时间。传统的做法是设立时间窗口对这条样本进行跟踪,窗口内完成转化目标即打上正样本标签,反之则当作负样本看待,但很明显这么做有很多问题。为解决这个问题采用了一种替代方案,当点击产生时,我们将样本当作负样本来看,当转化行为完成后,这个样本就视为正样本,当然这里会进行适当的权重调整。

此外,还有转化率阶跃的问题,即转化数据集中到来,正样本突然增多,转化率预估可能从万分之几直接到百分之几。这样就会造成转化数据到来前广告放量不足,到来后爆量问题。为了解决这个问题引入非目标的转化数据作为正样本使用,比如转化目标是付费,我们可以引入下载、激活等也作为加权降权后的正样本来消费。

智能出价-博弈&共赢

1. 成本控制

智能出价的基本功能是进行成本控制,保证广告的实际成本在目标成本附近。并在此基础上尽可能多拓量。所以这里存在成本和放量的博弈。所使用的方法是在 eCPM 上乘一个智能出价因子,这个因子是实际成本与目标成本的函数输出,比如上图实际成本大于目标成本时,因子小于1,用更廉价的流量来拉低成本,反之大于1,提高竞争能力获取更多流量。

2. 流量优选

上面介绍了基础版本的智能出价方案,但这样会产生一些问题,比如放量过程中的订单,可能以高价格获得了低质的流量而导致效果不佳,反之可能错过高质量流量。解决方法是做流量粒度下的智能出价 ,即考虑成本的同时也考虑流量质量,就是上图g函数,考虑成本参数的同时也加入流量质量参数。

特别推荐一个分享架构+算法的优质内容,还没关注的小伙伴,可以长按关注一下:长按订阅更多精彩▼如有收获,点个在看,诚挚感谢

爱奇艺效果广告的个性化探索与实践相关推荐

  1. i技术会 | 爱奇艺效果广告探索与实践

    今天分享的主要内容分为以下四块内容:爱奇艺效果广告产品介绍,主要是介绍爱奇艺效果广告的主要资源位以及对应的售卖形式:二是效果广告排序算法实践介绍,这里主要介绍在排序算法过程中使用的精排模型和粗排模型: ...

  2. AI 在爱奇艺视频广告中的探索

    嘉宾介绍 刘祁跃,爱奇艺科学家. 从事视频分析相关算法和业务落地,其中将 AI 应用于广告是重要工作方向. 导读:本次分享的主题为 AI 在爱奇艺视频广告中的探索.AI 可以对视频内容.广告素材进行理 ...

  3. 爱奇艺------AI在爱奇艺视频广告中的探索

    分享嘉宾:刘祁跃 爱奇艺科学家 导读:本次分享的主题为 AI 在爱奇艺视频广告中的探索.AI 可以对视频内容.广告素材进行理解和加工,并应用于视频广告,尤其在广告的点位挖掘和生成.点位分析.素材创作等 ...

  4. 爱奇艺数据质量监控的探索和实践

    01 问题和目标:为什么要进行数据质量监控? 数据质量监控其实跟当前疫情的防控工作有些类似,核酸检测能尽早去发现病毒,溯源则会更了解病毒会在哪些场景,或者对哪些人有比较大的影响,方便进行跟踪,这和数据 ...

  5. 爱奇艺全链路压测探索与实践

    背 景 爱奇艺除了每天都为数以亿计的用户提供优质的视频服务,同时还有体育.直播.文学等业务服务于更多的圈层用户,海量的业务几乎每天都在进行营销活动,由此带来的流量随时可能会给我们的服务引入不确定性.爱 ...

  6. 爱奇艺攻防演练平台的探索实践(文末有直播福利)

    在程序员的江湖里,流传着一些经典的老梗: 编程第一法则:如果代码莫名运行成功了,那就别动了~ 架构第一法则:稳定运行多年的老系统,千万不要碰~ 图片来自网络 初入行的程序员们接受前辈的洗礼,将如上的法 ...

  7. 爱奇艺视频版权保护技术与维权实践

    随着海量多媒体应用内容的产生,对内容的安全性要求也相应提高.爱奇艺技术产品中心高级经理 陈赫从多个方面介绍了爱奇艺在版权保护上的技术探索与维权实践.本文来自陈赫在LiveVideoStack线上交流分 ...

  8. 爱奇艺HomeAI智能语音交互系统的技术实践

    「免费学习 60+ 节公开课:投票页面,点击讲师头像」 作者 | 爱奇艺研究员 ShaneWang 出品 | AI科技大本营(ID:rgznai100) 本期爱奇艺技术沙龙<语音和语言技术在自然 ...

  9. 爱奇艺逗芽表情搜索分析与实践

    随着互联网时代的发展,表情包成为现在大家网上交流的必备工具,针对表情搜索的产品需求,爱奇艺逗芽技术团队经历了从ElasticSearch到Lucene再到结合语义的搜索实践之路.不同阶段的技术选型可能 ...

最新文章

  1. 顶级项目管理工具 Top 10
  2. 人脸识别 轻量级高精度网络推荐
  3. XP系统,在文件或文件夹属性里找不到安全选项卡
  4. Redis: 跳跃表
  5. 【笔记】docker核心概念和使用 docker命令
  6. LLVM4更新--简化对象定义
  7. Java 9 特性与示例
  8. 推荐系统实战第一部分 协同过滤
  9. 新书预告<******笔记>快赏
  10. 【java】DecimalFormat与JTextArea的区别
  11. IOException: Broken pipe
  12. nessus下载后更新插件问题新的解决方法2020
  13. 介绍几个巨佬给大家认识
  14. dwz导出excel java_完美解决dataset导出excel问题
  15. 显卡的优化以提高计算机性能作用,显卡优化,教您如何设置NVIDIA(英伟达)显卡玩游戏性能更高...
  16. 从普通回溯到三色标记法法
  17. Wireshark数据包分析——Teardrop泪滴攻击
  18. 联想小新310-14isk笔记本内存条的等等事
  19. 跳高女神oracle,她是跳高新星,颜值与实力并存,现被称为“最美跳高女神”!...
  20. java堆栈总结、JVM

热门文章

  1. java 路径 工具类,java 绝对路径工具类
  2. 华为存储iscsi配置_网络+存储+虚拟化:三大要素构建新网络
  3. POJ 2482-Stars in Your Window(扫描线)
  4. (2)神经网络编程基础
  5. 经典问题——进程和线程区别
  6. linux 下camera调试笔记【转】
  7. Nibiru Open Day,OZO 遇见 DigiArtist 国际数字艺术展
  8. 关于浮点数的json解析
  9. Owncloud-X安装配置
  10. Dictionary解析json,里面的数组放进list,并绑定到DataGridView指定列