作者·黄崇远

『数据虫巢』

全文共3600

题图ssyer.com

 从推荐系统的演化过程中洞见计算广告的核心要素,但两者又存在着本质的差异,这也是计算广告自身差异的源点。

我们在第2章开篇时有提到过,从第2章开始,我们的重心将从广告主与广告平台的博弈关系转移到广告与用户的匹配维度上,分析和探索用户和广告如何进行精准匹配,并且从技术和数据算法的角度来观测这一过程,以及技术、数据、算法是如何推进整个计算广告往前发展和衍化的。

并且,我们将通过对推荐系统的简单了解,来观测推荐系统在人与物的匹配逻辑上是如何演化的,并从这些演化逻辑中寻找计算广告对应的可借鉴逻辑。所以,这个章节我们将分析哪些逻辑是可以从推荐系统的演化过程中是可以借鉴,可以延续人与物匹配逻辑思考的,而哪些是计算广告所独有的。

但是,不管怎么样,可以明确的是,在第2章之后,我们的重点都会过渡到计算广告所独有的技术以及对应的数据价值挖掘逻辑上,也就是算法模型在计算广告各个环节对应的实际应用上。

回到本章节的内容,我们从章节2.1到章节2.2,讲述最多的内容在于推荐系统的推荐逻辑是如何演进的,如何从人肉配置时代,逐步的过渡到深度推荐时代。而其中最核心的思路一直都没有变,那就是解决人和物的匹配问题,这也是推荐系统和计算广告最本质的关联之处。

所谓人和物的匹配问题,换成技术术语,其实就是整个从召回到最终模型预估排序的过程,用建模术语来说就是召回和排序的建模问题,而这也是不管推荐系统还是计算广告,最“值钱”的部分,也是最具有通性的部分。

不管是推荐系统还是计算广告,其整体逻辑的触发点都是用户在某个浏览动作场景中,触发了物品推荐或者广告播放,从而有了图2.2.4.5中一系列的计算动作,包括如何从海里候选中召回,然后经过粗排,再到精排,甚至重排的过程,最终呈现给用户的是一个或者是Top若干个物品。相当于推荐系统来说,计算广告的物比较固定,即候选广告,最终呈现的也只有Top1的广告,而非推荐系统中若干个Top结果,但整体的候选缩减思路,召回的一些算法模型,预估的一些算法模型其实很多都是一样的。

所以,很多时候计算广告又可以看作是一种特殊的推荐系统,或者说广告推荐。这也是整个第2章节存在的意义,从推荐系统的简单演化逻辑中,理解人和物的匹配逻辑的“进化”,有助于我们对计算广告的深入理解。

在基本思路理解的基础上,我们再来看下推荐系统的整体逻辑图,继续了解还有哪些组成部分是可以借鉴的,这样可以进一步前置理解后续我们可能将要持续讨论的内容。

图2.3.1 推荐系统整体逻辑图

如图2.3.1所示,这是一个推荐系统的整体逻辑图,基本上是围绕数据的流向闭环绘制的逻辑,我们沿着数据的流转,来观测一下推荐系统中主要包含的不同产品模块,并且在讲解产品模块时,进一步明确计算广告与推荐系统的相通之处与差异之处。

从图2.3.1可以看到,整个中间部分就是主线逻辑,也就是人与物匹配的核心计算建模逻辑,通过召回逻辑从海量的候选集中进行有限集合的召回,然后经过排序的服务,当然,如图2.2.4.5所示,在很多的排序逻辑中,又会拆分为从更大候选集进行量级缩减的粗排,以及对有限ITEM进行精确排序的精排逻,最后可能会通过一些规则也好或者业务逻辑的也好,进行重排序微调,最终输出推荐结果。

整个主线逻辑,推荐系统与计算广告思路是一致的,都面临了需要从海量候选中一步一步缩减候选,然后通过追求性能的粗排模型进一步缩小量级,再将有限个数,通常是数十个或者数百个,输入到精排模型中,最终结合业务诉求对精排之后的序进行微调,从而得到了最终的推荐序列。

在主线逻辑中,除了核心思路是一致的,在部分子阶段中的实现以及场景考量还是有不少差异之处的。

首先,推荐系统的召回非常丰富多样,如图2.3.1所示,综合了相似逻辑、协同过滤、基于物品相关、热点物品等等多种逻辑进行多路的召回,而计算广告的召回则相对简单一些,会多一些广告主人为可控的一些召回逻辑在里头,即召回的内容受到了参与方的人为干预。

对于排序部分,其技术逻辑大体上具有高度的相似之处,最重要的包括排序所采用的主流模型,建模逻辑等等。但同样还是具有差异之处,对于推荐来说,其CTR的预估是最为主要的,辅助于推荐逻辑的其他一些建模目标,例如视频中的观看时长,电商中的购买率或者购买金额等,但CTR依然是直接首先需要达成的目标。但在计算广告中,如同在章节1.1.2所说,随着广告主与广告平台的平衡天平不断的往广告主倾斜,导致了广告平台需要更多为广告主的效果买单,这就导致了计算广告的排序逻辑中需要更多考虑CVR的预估,即转化率的预估,CTR点击率的预估反倒成了辅助指标。

在序的最终输出阶段,对于推荐系统来说,基本上只会在精排结果上做基于业务的微调,但对于计算广告来说,还需要结合不同广告的出价,结合出价再进行排序。这也就意味着广告的出价对序的影响是非常大的。这也是在整个主线逻辑中,计算广告与推荐系统最大的差异,推荐系统偏重于人和物的匹配,而计算广告在计算完人和物的匹配基础上,还需要考虑商业逻辑,即广告中所谓的“价高者者得”,当然并非说是纯粹的出价高的广告主直接获得流量,而是说出价在广告的排序上起着重要的作用。

关于计算广告的整个主线逻辑,也将是我们后续章节的重要内容,也是本书最重要的内容,所以在这里我们更多是从推荐系统中看计算广告的延续思路,顺带引申出我们后续章节的重要内容方向。

除了上述所受的主线部分的逻辑,整体逻辑的数据流转,推荐系统与计算广告基本上一致,包括数据流转到实时和离线的两种通路中,并且不断的转换为离线的一些反馈样本,或者离线以及实时的特征等等,中间过程中使用到的一些常用的大数据组件框架等,大多大同小异,并且有较强的可借鉴之处。

在最上端的实验系统部分,基本实验的逻辑是一致的,即对流量进行打标,并且根据流量的不同标记,进行分层分流实验,相互不影响,并通过标记,最终回流到分析体系中,进行效果的差异追踪,从而对不同阶段的策略、模型版本等进行快速实验、快速迭代。

对于推荐系统和计算广告,除了相同的逻辑之外,对于主线部分较大的差异之处,我们可以从参与方的角度以及系统核心的目的进行分析。

推荐系统的核心参与方只有用户和平台,且用户对于整个逻辑是没有任何干预的,所以其核心目标是平台需要为用户提供更好的内容输出逻辑,从而让用户在其平台上停留时间更长,或者说更进一步的目的是在平台上进行深层次的转化,例如游戏的付费、电商的购买等等。所以,可以看到,推荐系统的核心目标是用户体验,其次才是深层转化。这也就是之前所说的,其模型核心指标是CTR的预估,辅助于其他“五花八门”的深层转化。

而计算广告的参与方则有三方,见章节1.1.4章节,实际的参与方是广告主(或者代理)、用户、广告平台、流量媒体,其中广告主要ROI、用户要体验、广告平台要流量效率、媒体流量要广告收益分成。这其中的利益复杂度会远高于推荐系统,不会像推荐系统那样目的相对“纯粹”。而正是这种复杂的利益逻辑关系,造成了主线技术逻辑的差异性,最大的差异性在于价格对于序的干涉影响。换句话说,如果只是单纯的考虑CTR以及CVR,不考虑出价,则很难达到四方利益的平衡。

所以,出价纳入到序的计算中,最终寻求的是一个体验、流量价值最大化、以及深度转化效果三者指标的平衡的过程,而其中的细节也恰巧是计算广告领域中最“迷人”的部分。

除此之外,推荐系统的场景大多应对的是相同物品领域的推荐,而计算广告的核心逻辑是在媒体流量上插入广告,这也是在场景上的巨大差异。从体验感的角度来说,对于同质物品的浏览过程中,被异质的广告所打断,还需要做到尽量让用户点击并深度转化,在其中还得考虑到广告主与自身的利益平衡,这本身就是一个非常具有挑战的事。

因此,计算广告不管从业务上,还是从商业逻辑,甚至是数据建模维度上,都是非常值得去分析和研究的,“吃透”计算广告的业务和技术逻辑,对于读者朋友们去理解其他的一些商业场景以及技术算法逻辑,将会事半功倍。

至于未来,推荐系统与计算广告的关系,笔者觉得可能会逐步趋于统一,这不单纯是技术和算法模型上的高度一致,而是整个业务逻辑上也会逐步趋同。随着物联网推进的万物互融大趋势,广告与推荐的边界可能会逐步的交叉,人与物总是不断的在交叉,至于是什么物,是不是同类反倒是其次的,最终在数据合法合规、信息足够安全的前提下,追求人与物的高效匹配,依然是最重要的事。

推荐系统与计算广告,在未来可能会殊途同归。

文章都看完了,还不点个赞来个赏~

做一个有思想的程序猿,推荐你关注夏虫的另一个非技术公众号【夏虫悟冰】,坚持一篇专业领域文章,一篇对不同事务的思考文章,与你一同持续进步,欢迎关注。

参考文章:

个人管理类思考逻辑:《其实我也是一个时间管理大师》

对于社会现象的思考逻辑:《1946年的土地改革与2021年的互联网反垄断》

读书笔记与思考:《读书:找到锚点,然后把自己给钉死》

数据与广告系列二十九:推荐系统与计算广告的和而不同相关推荐

  1. 数据与广告系列二十八:IAA游戏广告,广告界的庞氏骗局

    作者·黄崇远 『数据虫巢』 全文共4056字 题图ssyer.com " IAA游戏广告,本质是中间商赚差价,以及流量的击鼓传花,层层套娃,总有一层绷不住成本与营收的ROI,然后死亡,一批死 ...

  2. 数据与广告系列二十二:智能化投放中扩量场景的技术实现策略

    作者·黄崇远 公众号 『数据虫巢』 全文8968字 题图ssyer.com " 人不够,系统给你凑." 这个系列上一篇<数据与广告系列二十一:关于品牌广告,奔涌吧后浪> ...

  3. 数据与广告系列二十四:效果广告后定向时代如何逆流而上

    作者·黄崇远 『数据虫巢』 全文共4338字 题图ssyer.com " 在效果广告的发展历程中,当前已经处于后定向时代,或者说是弱定向时代,我们是应该顺应潮流还是应该逆流而上?" ...

  4. 数据与广告系列二十六:知识迁移的Embedding应用,智能化定向的解药

    作者·黄崇远 『数据虫巢』 全文共4348字 题图ssyer.com " 效果广告后定向时代,虽有千般万难,我们一样还得解决定向智能的问题." 需要提前说明的是,这一篇会涉及到本系 ...

  5. 数据与广告系列二十:oCPX大势下标签定向的发展演化

    作者·黄崇远 公众号『数据虫巢』 全文共3681字 题图ssyer.com " 人口买卖的时代终究会过去的." 这个系列上一篇是<数据与广告系列十九:推荐召回与广告LookA ...

  6. SSE图像算法优化系列二十九:基础的拉普拉斯金字塔融合用于改善图像增强中易出现的过增强问题(一)...

    拉普拉斯金字塔融合是多图融合相关算法里最简单和最容易实现的一种,我们在看网络上大部分的文章都是在拿那个苹果和橙子融合在一起,变成一个果橙的效果作为例子说明.在这方面确实融合的比较好.但是本文我们主要讲 ...

  7. 【Python学习系列二十九】scikit-learn库实现天池平台智慧交通预测赛

    1.背景:https://tianchi.aliyun.com/competition/introduction.htm?spm=5176.100066.0.0.3f6e7d83RQgWEL& ...

  8. BizTalk开发系列(二十九) 宏的使用

    更多内容请查看:BizTalk动手实验系列目录                       BizTalk 开发系列 在BizTalk中可以使用宏集合动态的让BizTalk发送处理程序使用单独的值来替 ...

  9. 网络安全系列-二十九: 读《透视APT 赛博空间的高级威胁》笔记

    最近读了奇安信威胁情报中心 于2019年出版 的<透视APT 赛博空间的高级威胁>,针对APT终于有了一个清晰的理解. APT攻击是网络空间存在的威胁隐患,是全球各国面临的重要风险. AP ...

最新文章

  1. 安装VMware vSphere 5.0(使用自带SQL2008Express)
  2. tcp/ip详解--ttl
  3. BJUI怎样对input添加自定义验证规则
  4. java封装264成flv,将H.264封装为FLV格式-Go语言中文社区
  5. 好书荐读:阿里达摩院算法专家领衔《深度学习与图像识别:原理与实践》
  6. 移动开发-语音识别-调用讯飞平台提供的API
  7. antd树型选择控件选择父级_element的tree树形菜单回显、父级半勾选
  8. C# 与 C 和 C++ 比较
  9. HTB相关TC命令以及内核实现介绍
  10. 信息系统项目管理师学习笔记
  11. matlab图像去毛刺_MATLAB数字图像处理
  12. An End-to-End Steel Surface Defect Detection Approach via Fusing Multiple Hierarchical Features-阅读笔记
  13. 【GCC】Linux GCC 常用命令和EFF文件格式
  14. idear开发工具创建maven的相关配置
  15. 【数据分析实战】淘宝用户行为模式分析
  16. html链接怎么恢复,Word文档中目录的超链接取消后怎么样恢复?
  17. OpenGL /GLES 使用Pyqt5 + glad
  18. Snovio软件怎么用?请看这篇邮件群发平台使用指南
  19. open edx_Open edX和OpenStack用于复杂的学习环境
  20. 与黑客讨价还价,勒索攻击企业数据是关键

热门文章

  1. 【NOIOL】【数论 / 数值】正反切函数的应用
  2. GIScloud,一个基于网络的地理信息系统云计算方案 (专题一)
  3. 虚拟机创建和配置的详细步骤
  4. j2me图片缩放方法
  5. sqlserver新增主键自增_SQLserver 自增主键
  6. 重庆大学 c++2022级第七次作业——类 7-2 国际贸易统计
  7. Java程序设计 北京大学 Week2互评作业
  8. (转)MS Exchange揭开拨号音还原法的神秘面纱
  9. JVM学习(四):垃圾回收器
  10. mysql和oracle课程,Oracle MySQL 管理实战应用培训