《广告流量分析之评价指标的选择(一)》和《广告流量分析之评价指标的选择(二)》主要介绍了cvr、ocpa、ctr等评价指标的选择方式。今天想和大家聊聊广告智能定向之lookalike技术。

0.什么是lookalike?

一句话简单来说:广告主给定高质量的种子用户,系统需要自动发现类似的人群做投放。举个栗子,如果广告主提供的种子人群是持有某种信用卡的客户,那么相似人群就是在某些方面和种子人群相似。如果相似人员没有持有卡,那么他们也是有极大的可能去开卡的。

1.为什么要做lookalike?

目前存在的问题:人群标签组合无法覆盖全面,人群标签的挖掘成本太高了,无法支持人群分级定价等,lookalike可以简单、直接、漂亮地解决这些问题。

2.怎么做lookalike?

(1). 基于User-Feature的矩阵分解法

通过对user-feature矩阵分解,我们可以得到user-topic矩阵,如下图所示:

用户u和种子S的相似度定义如下(其中u是用户的的topic分布,Si是种子用户i的topic分布):

其中,

即为种子用户的平均topic分布。因此遍历全部人群,计算出每个用户与种子集合的相似度,取排序较高的作为扩展人群。

(2). 基于有监督的LR模型

我们将种子用户作为正例,随机用户进行下采样后作为负例,每一个种子单独训练一个LR模型。然后用这个模型对全部用户进行预测,我们认为预测值越大,和种子用户越相似。用户u和种子S的相似度定义如下(其中u是用户特征向量,w和b是LR模型的参数):

遍历全部人群,计算出所有用户的相似度,取top n即是扩展人群。在工程上实现的时候需要借助倒排索引,而随着广告主的增加,系统弊端逐渐暴露出来:倒排索引占用空间不断上涨,导致索引更新周期过长,每个用户身上的lookalike ID 也不得不按照相似度截断,而这种截断会加剧马太效应,对广告主扩展新用户是非常不利的。同时,离线模型训练和预测的机器也在不断增加。

(3). Online lookalike模型

在(2)的基础上,抛弃了原有的每个种子单独一个模型的思路,对所有的种子用户进行联合建模,具体网络结构如下:

在线召回广告的过程如下:首先从正排索引取到user embedding,接着用user embedding 向量和lookalike embedding 矩阵做乘法,得到 user 和每个广告的相似度,然后根据每个广告扩展倍数的阈值截断随机保留 n 个lookalike ID,将它们对应的广告召回。

3.小结

本文主要给出了广告智能定向中lookalike技术的定义、解决的问题以及具体的工程上的实现方式。希望能给大家带来一些新的思考。

欢迎大家关注计算广告那些事儿哈,除了原创文章之外,也会不定期和大家分享业内大牛的文章哈!

广告智能定向技术lookalike相关推荐

  1. 阿里定向广告智能投放技术体系

    导读:随着经济数字化地快速发展,互联网广告在赋能商家营销.帮助消费者高效了解商品和服务.以及商业平台的变现等方面扮演着越来越重要的角色.互联网广告生态中,广告主通过付费在媒体上对目标用户进行营销信息传 ...

  2. 互联网精准广告定向技术

    来源:http://www.williamlong.info/archives/3125.html 月光博客 互联网精准广告定向技术,指的是依托于搜索引擎庞大的网民行为数据库,对网民几乎所有上网行为进 ...

  3. 基于Cookie信息的互联网精准广告定向技术研究

    在今年的315晚会上,有一个词再次引起了广大网友的关注,那就是Cookie,其实关于个人在网络上的信息安全问题,IT界的几位巨头也曾为此争论了好久,最终也是不了了之.那么Cookie究竟是什么呢?Co ...

  4. 数据与广告系列二十七:智能定向独特业务的独有炼丹配方

    作者·黄崇远 『数据虫巢』 全文共4534字 题图ssyer.com " 没点独特的东西,怎么好意思说自己在炼仙丹." 本文强接上文<数据与广告系列二十六:知识迁移的Embe ...

  5. 互联网精准广告定向技术: 一切你该了解的知识总结与整理

    互动中国编者前言:本文来自于读者的投稿(牛国柱博客),原文作者为资深互联网广告行业从业者,经过一段长时间的积累,从基础知识.技术应用以及在线广告作弊手段整理和反作弊方法三大角度,共计15篇系列专文,对 ...

  6. 数据与广告系列二十四:效果广告后定向时代如何逆流而上

    作者·黄崇远 『数据虫巢』 全文共4338字 题图ssyer.com " 在效果广告的发展历程中,当前已经处于后定向时代,或者说是弱定向时代,我们是应该顺应潮流还是应该逆流而上?" ...

  7. 2012智能管道技术创新与应用实践论…

    2012智能管道技术创新与应用实践论坛(2012年5月)       IT\CT产业的结合ICT,产生了许多新应用及应用提供商(苹果.google,腾讯)及终端厂商(HTC),它们是ICT产业链中的中 ...

  8. 美团智能问答技术探索与实践

    分享嘉宾:美团 江会星 博士 编辑整理:韩佳 出品平台:DataFunTalk 导读:本文主要介绍在美团业务中智能问答技术的相关落地与实践.通常问答系统需要提前构建好问答对知识库,这种方式对高频问题能 ...

  9. Deep GSP : 面向多目标优化的工业界广告智能拍卖机制

    丨目录: · 背景 · 问题定义 ·  Deep GSP · 实验 · 与现有学术界和工业界类似方案的差异 · 展望 · 关于我们 · 参考文献 ▐ 背景 广告拍卖机制是对竞争性资源的一种高效的市场化 ...

最新文章

  1. qt android 对话框,Qt自定义Dialog
  2. 温控窗帘系统制作文档
  3. 【转载】PHP的(EOT)在PHP中添加html
  4. SearchRecentsuggestionsProvider
  5. 网络基础知识_你家的网络是这么布线的吗?家庭网络布线基础知识普及!
  6. 避免缓冲区溢出的方法
  7. ORA-00600 [4194] 故障处理
  8. php读取excel显示,PHP读取Excel并展示实现代码
  9. 园林景观cad_1000个CAD平面设计素材模板图,绘图任意用,全部打包带走
  10. 细说大话西游中的经典元素
  11. HTTP的options方法作用
  12. 企业公众号运营见效难,如何突围?
  13. C语言中 .h文件和.c文件的区别 (转)
  14. 5G QoS控制原理专题详解-基础概念
  15. Ja进av阶书籍推荐
  16. c、c++的getchar()函数
  17. 我喜欢的郭敬明的文字
  18. SDCC教程(树莓派 Debian11 bullseye 使用官方下载源)
  19. Nginx对代理HTTP资源的限制访问
  20. Eclipse中显示空格符、制表符和换行符

热门文章

  1. Selenium的定位元素
  2. JVM----类的加载机制
  3. swfupload添加上传进度条(转)
  4. 解决 GDI 贴图的闪烁
  5. activiti官网实例项目activiti-explorer之扩展流程节点属性
  6. 《半吊子全栈系列:Boostrap3》
  7. Linux LVM简明教程
  8. Vissim 中动态交通路径选择
  9. LeetCode OJ - Surrounded Regions
  10. 【转】Android中Dalvik(DVM)的详解