个性化系统框架

计算广告是根据个体用户信息投送个性化内容的典型系统之一。在介绍计算广告系统的架构之前,先看看一般的个性化系统是如何构成的。

由4个主题部分构成:

  1. 用于实时响应请求,完成决策的在线投放引擎
  2. 离线的分布式计算数据处理平台;
  3. 用于在线实时反馈的流计算平台
  4. 连接和运转以上3部分数据流的数据高速公路

协作流程是:在线投放系统的日志接入数据高速公路,再由数据高速公路快速转运到离线数据处理平台和在线流计算平台;离线数据处理平台周期性地以批处理方式加工过去一段时间的数据,得到人群标签和其他模型参数,存放在缓存中,供在线投放系统决策时使用;与此相对应,在线流计算平台则负责处理最近一小段时间的数据,得到准实时的用户标签和其他模型参数,也放到缓存中,供在线投放系统决策时使用,这些是对离线处理结果的即时补充和调整

各种个性化系统之间有共性,但由于其数据来源、产品形态、优化目标的不同,系统架构的细节也会呈现很大的区别。在Web规模问题上的区别是决定系统架构不同的关键原因。

各类广告系统优化目标

广告系统的优化目标是提高广告产品的利润

任何一个具体的计算广告系统,都是为了优化上面的目标而设计的。对应于个性化系统一般框架,在广告系统中,每次展示的r是由在线的投放引擎来决策的,离线数据处理平台和流计算平台所做的,都是为了准备ai,ui,cia_i,u_i,c_iai​,ui​,ci​这3个变量或其组合的一些特征

不同的广告产品,优化目标有不同的表现形式,有时会有额外的约束。

在展示量合约的GD系统中,只要各合约达成,系统的收益就是确定的,主要优化目标是在满足各合约带来的约束,成本是媒体静态产生,与广告优化过程无关,认为是常数;ADN需要估计点击率μ(a,u,c)\mu(a,u,c)μ(a,u,c),并与广告主出的点击单价bidCPC(a)bid_{CPC}(a)bidCPC​(a)相乘得到期望收入,成本是与收入成正比的媒体分成;ADX直接用广告主出的展示单价bidCPM(a)bid_{CPM}(a)bidCPM​(a)作为期望收入,成本也是与收入成正比的媒体分成;在DSP中,点击率、点击价值和成本q都可能是需要预估和优化的,算法挑战较大。

计算广告系统架构

在一个完整的广告系统架构中数据的记录、交易、流转、建模和使用,这些是广澳系统最核心的驱动力,也从本质上决定了广告产品的变现能力和利润空间

广告投放引擎

一般来说,广告系统的投放引擎采用类搜索的架构,即检索加排序的两阶段决策过程。广告投放引擎还有一个独特模块–从全局优化的角度对整体收益进行管理。广告投放引擎的主要模块有以下几个:

  1. 广告投放机。接受广告前端Web服务器发来的请求,完成广告投放决策并返回最后页面片段的主逻辑。最重要的指标是每秒数(QPS)以及广告决策的延迟(latency);
  2. 广告检索。在线时根据用户标签与页面标签从广告索引中查找符合条件的广告候选。广告检索的候选将被送入广告排序模块。
  3. 广告排序。在线高效地计算广告的eCPM,并进行排序的模块。eCPM的计算主要依赖于点击率估计,需要用到离线计算得到的CTR模型和特征,可能用到实时点击率特征。
  4. 收益管理。代表那些在各种广告系统中将局部广告排序的广告进行进一步调整,以全局收益最优为目的做调整的功能。
  5. 广告请求接口。
  6. 定制化用户划分。

数据高速公路

将在线投放的数据准实时传输到离线分布式计算平台与流式计算平台,供后续处理和建模使用。由于在进行受众定向建模时需要用到广告系统以外的其他用户产品日志,或者第三方提供的数据,数据高速公路也担负着收集这些数据源的任务。

离线数据处理

离线数据处理有两个输出目标:一是统计日志得到报表、仪表盘等,供人进行决策时作为参考;二是利用数据挖掘、机器学习技术进行受众定向、点击率预估、分配策略规划等,为在线的机器决策提供支持。离线数据处理的主要模块有下面几个:

  1. 用户会话日志生成。从各个渠道收集来的日志,先整理成以用户ID为键的统一存储格式,把这样的日志称为用户会话日志。
  2. 行为定向。完成挖掘用户日志,根据日志中的行为给用户打上结构化标签库中的某些标签,并将结果存储在用户标签的在线缓存中,供广告投放机使用。
  3. 上下文定向。这部分包括半在线页面抓取和页面标签的缓存,这部分与行为定向互相配合,负责给上下文页面打上标签,用于在线的广告投放中。
  4. 点击率建模。在分布式计算平台上训练得到点击率的模型参数和相应特征,加载到缓存中供线上投放系统决策时使用
  5. 分配规划。为在线的收益管理模块提供服务,它根据广告系统全局优化的具体需求,利用离线日志数据进行规划,得到适合线上执行的分配方案。
  6. 商业智能系统。包括ETL过程、仪表盘和Cube。这些是所有以人为最终接口的数据处理和分析流程额总括,担负着对外信息交流的任务。
  7. 广告管理系统。广告操作者,即客户执行(AE)与广告系统的接口。AE通过广告管理系统定制和调整广告投放,并且与数据仓库交互,获得投放统计数据以支持决策。

在线数据处理

在线数据处理可以认为是离线数据处理的镜像功能,它是为了满足广告系统对实时数据反馈的要求,解决那些离线分布式计算平台无法快速响应的计算问题。包含的主要模块有:

  1. 在线反作弊。实时判断流量来源中是否有作弊流量,并将这部分流量从后续的计价和统计中去除掉,是广告业务非常重要的部分,是所有后续在线数据处理必须经过的前置模块
  2. 计费。
  3. 在线行为反馈。包括实时受众定向和实时点击反馈等部分。这部分是将短时内发生的用户行为和广告日志及时地加工成用户标签,以及实时的点击率模型特征
  4. 实时索引。实时接受广告投放数据,建立倒排索引。

计算广告系统主要技术

  1. 受众定向问题:特征提取,即对a,u,c打标签以方便后续建模和市场售卖的问题;
  2. 如果不考虑全局最优,计算广告系统主要靠eCPM估计,特别是点击率预测来完成每一次展示时的局部优化。
  3. 如果考虑到量的约束和投放时即使决策的要求,则产生了在线分配问题;
  4. 为了在多方博弈的市场中达到动态平衡时的收益最大化,需要对市场的机制设计做深入研究,进而确定合理的定价策略。
  5. 为了更全面地采样整个(a,u,c)的空间以便更准确地估计点击率,需要用到强化学习中的探索与利用方法
  6. 个性化推荐技术也被广泛使用在效果类DSP的个性化重定向中。

计算广告笔记-计算广告技术概览相关推荐

  1. 计算广告笔记-计算广告综述

    互联网关键的思维模式之一: 正面的免费服务是为了获得流量和数据. 背面的广告业务则是将这些流量和数据变成金钱. 在能够获得充分的流量或高价值数据以后,所有能够传播信息的商品,其售价都会趋向其边际成本. ...

  2. 计算广告学学习笔记---计算过广告基本概念

    学刘鹏老师的<计算广告学>笔记,课程是免费的,课程地址 一.广告的目的和效果是什么? 广告 Advertisng:广告是由已确定的出资人通过各种媒介进行的有关产品(商品.服务和观点)的,通 ...

  3. 计算广告笔记04-合约广告

    广告位合约 广告位合约是最早产生的在线广告售卖方式.它指媒体和广告主约定在某一时间段内某些广告位上固定投放该广告主的广告,相应的结算方式为CPT.这是一种典型的线下广告投放模式,在互联网广告早期被采用 ...

  4. 【计算广告】计算广告阅读笔记

    一.基本概念 广告市场的参与者 出资人.媒体和受众这三者的利益博弈关系构成了广告活动永远的主线. 广告活动的两个主动的参与方是需求方和供给方,被动的参与方是受众. 需求方:这里的需求方包括广告主,代表 ...

  5. 品牌广告与效果广告的差异-计算广告读书笔记1

    最近在读计算广告这本书,书中概念非常多,对于广告小白来说,很是需要时间理解一下.第一篇笔记呢,首先科普品牌广告和效果广告的不同点,其次简要介绍一下在线广告的发展历程. 本节目录 在线广告发展历程 主线 ...

  6. 计算广告笔记05-搜索广告与竞价广告

    与合约广告相比,竞价交易模式的本质是将量的约束从交易过程中去除,仅仅采用"价高者得"的简单决策方案来投放广告.竞价符合广告精细化发展的趋势,为无法用合约售卖的剩余流量找到了可能的变 ...

  7. 计算广告笔记06-程序化交易广告

    RTB的产生使得广告市场向着开放的竞价平台的方向发展,这样的平台就是广告交易平台,ADX,其主要特征是用RTB的方式实时得到广告候选,并按竞价逻辑完成投放决策.与广告交易平台对应的采买方为需求方平台即 ...

  8. 计算广告笔记01-在线广告综述

    在线广告,也称网络广告.互联网广告,指的是在线媒体上投放的广告.与传统广告不同,在线广告已经形成了以人群为投放目标.以产品为导向的技术性投放模式.它不仅为广告主带来了以准确接触目标受众为方法论的全新营 ...

  9. 计算广告 读书笔记 计算广告的核心问题

    1. 计算广告的核心问题 Andrei Broder给出了计算广告这个课题的核心研究挑战: "Find the best match between a given user in a gi ...

最新文章

  1. 艰难万苦配置postfix+ldap+extmail+.......
  2. XMPP 扎金花各种网络传送之音频发送
  3. LwIP之网络接口管理
  4. esx4.0 tpm模块初始化失败
  5. 【Kafka】Kafka 增量 Rebalancing: Support and Policies
  6. JavaScript进阶之路——认识和使用Promise,重构你的Js代码
  7. 中国抗生素骨水泥行业市场供需与战略研究报告
  8. 基于R-Net、QA-Net和BiDAF实现中文观点型问题机器阅读理解
  9. Celery使用数据库代替rabbitmq
  10. noapic和acpi=off能帮我做到什么?
  11. npm i --legacy-peer-deps
  12. 苹果雪豹操作系统正式版_苹果放出iOS 13andiPadOS beta 2:加入SMB网络共享、APFS硬盘支持...
  13. ZABBIX 3.0 使用详解
  14. 练T25- focus必看!所有成功截图汇总
  15. 有趣的表情包购物网站
  16. PC浏览器无法浏览网页的解决教程
  17. 解决pycharm调用plt.show()后无图片显示问题
  18. 最新尚硅谷Java MyBatisPlus教程(完整)
  19. WIFI热点——bat文件创建笔记本快捷wifi技术
  20. WEB安全之:SQL Injection--DVWA环境测试

热门文章

  1. Layui富文本框插件拓展
  2. wordpress网站重定向次数过多
  3. Fragment总结(一)
  4. 如何将jpg图片做成gif?教你简单三步快速做gif
  5. 2022-3-31 Leetcode 415.字符串相加
  6. 2021.03 编程题 36【Python二级题目解析】
  7. Android解决AS工具View不显示布局的问题
  8. 四旋翼动力学、仿真和控制
  9. 神雕侠侣2暂无服务器信息,神雕侠侣2手游
  10. 现货黄金交易入门知识