广告智能定向技术lookalike
《广告流量分析之评价指标的选择(一)》和《广告流量分析之评价指标的选择(二)》主要介绍了cvr、ocpa、ctr等评价指标的选择方式。今天想和大家聊聊广告智能定向之lookalike技术。
0.什么是lookalike?
一句话简单来说:广告主给定高质量的种子用户,系统需要自动发现类似的人群做投放。举个栗子,如果广告主提供的种子人群是持有某种信用卡的客户,那么相似人群就是在某些方面和种子人群相似。如果相似人员没有持有卡,那么他们也是有极大的可能去开卡的。
1.为什么要做lookalike?
目前存在的问题:人群标签组合无法覆盖全面,人群标签的挖掘成本太高了,无法支持人群分级定价等,lookalike可以简单、直接、漂亮地解决这些问题。
2.怎么做lookalike?
(1). 基于User-Feature的矩阵分解法
通过对user-feature矩阵分解,我们可以得到user-topic矩阵,如下图所示:
用户u和种子S的相似度定义如下(其中u是用户的的topic分布,Si是种子用户i的topic分布):
其中,
即为种子用户的平均topic分布。因此遍历全部人群,计算出每个用户与种子集合的相似度,取排序较高的作为扩展人群。
(2). 基于有监督的LR模型
我们将种子用户作为正例,随机用户进行下采样后作为负例,每一个种子单独训练一个LR模型。然后用这个模型对全部用户进行预测,我们认为预测值越大,和种子用户越相似。用户u和种子S的相似度定义如下(其中u是用户特征向量,w和b是LR模型的参数):
遍历全部人群,计算出所有用户的相似度,取top n即是扩展人群。在工程上实现的时候需要借助倒排索引,而随着广告主的增加,系统弊端逐渐暴露出来:倒排索引占用空间不断上涨,导致索引更新周期过长,每个用户身上的lookalike ID 也不得不按照相似度截断,而这种截断会加剧马太效应,对广告主扩展新用户是非常不利的。同时,离线模型训练和预测的机器也在不断增加。
(3). Online lookalike模型
在(2)的基础上,抛弃了原有的每个种子单独一个模型的思路,对所有的种子用户进行联合建模,具体网络结构如下:
在线召回广告的过程如下:首先从正排索引取到user embedding,接着用user embedding 向量和lookalike embedding 矩阵做乘法,得到 user 和每个广告的相似度,然后根据每个广告扩展倍数的阈值截断随机保留 n 个lookalike ID,将它们对应的广告召回。
3.小结
本文主要给出了广告智能定向中lookalike技术的定义、解决的问题以及具体的工程上的实现方式。希望能给大家带来一些新的思考。
欢迎大家关注计算广告那些事儿哈,除了原创文章之外,也会不定期和大家分享业内大牛的文章哈!
广告智能定向技术lookalike相关推荐
- 阿里定向广告智能投放技术体系
导读:随着经济数字化地快速发展,互联网广告在赋能商家营销.帮助消费者高效了解商品和服务.以及商业平台的变现等方面扮演着越来越重要的角色.互联网广告生态中,广告主通过付费在媒体上对目标用户进行营销信息传 ...
- 互联网精准广告定向技术
来源:http://www.williamlong.info/archives/3125.html 月光博客 互联网精准广告定向技术,指的是依托于搜索引擎庞大的网民行为数据库,对网民几乎所有上网行为进 ...
- 基于Cookie信息的互联网精准广告定向技术研究
在今年的315晚会上,有一个词再次引起了广大网友的关注,那就是Cookie,其实关于个人在网络上的信息安全问题,IT界的几位巨头也曾为此争论了好久,最终也是不了了之.那么Cookie究竟是什么呢?Co ...
- 数据与广告系列二十七:智能定向独特业务的独有炼丹配方
作者·黄崇远 『数据虫巢』 全文共4534字 题图ssyer.com " 没点独特的东西,怎么好意思说自己在炼仙丹." 本文强接上文<数据与广告系列二十六:知识迁移的Embe ...
- 互联网精准广告定向技术: 一切你该了解的知识总结与整理
互动中国编者前言:本文来自于读者的投稿(牛国柱博客),原文作者为资深互联网广告行业从业者,经过一段长时间的积累,从基础知识.技术应用以及在线广告作弊手段整理和反作弊方法三大角度,共计15篇系列专文,对 ...
- 数据与广告系列二十四:效果广告后定向时代如何逆流而上
作者·黄崇远 『数据虫巢』 全文共4338字 题图ssyer.com " 在效果广告的发展历程中,当前已经处于后定向时代,或者说是弱定向时代,我们是应该顺应潮流还是应该逆流而上?" ...
- 2012智能管道技术创新与应用实践论…
2012智能管道技术创新与应用实践论坛(2012年5月) IT\CT产业的结合ICT,产生了许多新应用及应用提供商(苹果.google,腾讯)及终端厂商(HTC),它们是ICT产业链中的中 ...
- 美团智能问答技术探索与实践
分享嘉宾:美团 江会星 博士 编辑整理:韩佳 出品平台:DataFunTalk 导读:本文主要介绍在美团业务中智能问答技术的相关落地与实践.通常问答系统需要提前构建好问答对知识库,这种方式对高频问题能 ...
- Deep GSP : 面向多目标优化的工业界广告智能拍卖机制
丨目录: · 背景 · 问题定义 · Deep GSP · 实验 · 与现有学术界和工业界类似方案的差异 · 展望 · 关于我们 · 参考文献 ▐ 背景 广告拍卖机制是对竞争性资源的一种高效的市场化 ...
最新文章
- qt android 对话框,Qt自定义Dialog
- 温控窗帘系统制作文档
- 【转载】PHP的(EOT)在PHP中添加html
- SearchRecentsuggestionsProvider
- 网络基础知识_你家的网络是这么布线的吗?家庭网络布线基础知识普及!
- 避免缓冲区溢出的方法
- ORA-00600 [4194] 故障处理
- php读取excel显示,PHP读取Excel并展示实现代码
- 园林景观cad_1000个CAD平面设计素材模板图,绘图任意用,全部打包带走
- 细说大话西游中的经典元素
- HTTP的options方法作用
- 企业公众号运营见效难,如何突围?
- C语言中 .h文件和.c文件的区别 (转)
- 5G QoS控制原理专题详解-基础概念
- Ja进av阶书籍推荐
- c、c++的getchar()函数
- 我喜欢的郭敬明的文字
- SDCC教程(树莓派 Debian11 bullseye 使用官方下载源)
- Nginx对代理HTTP资源的限制访问
- Eclipse中显示空格符、制表符和换行符