【干货】从点击率预估的视角看腾讯社交广告算法大赛

大赛简介

腾讯社交广告算法大赛以广告领域常见的转化率预估问题作为出题思路,从用户历史一个月的行为数据中采样竞赛数据,数据规模达几十GB。比赛题目足够诚意的同时,资金投入也显得诚意满满。比赛单奖金及奖品投入就近百万元人民币,一等奖奖金高达30万,指导老师的奖励也颇为丰厚。

笔者在腾讯主要从事广告与上下文画像,点击率预估相关的工作。在大多数人眼中,点击率预估与转化率预估除了优化目标上的不同,其他差异并不明显。两者的解题套路以及使用的工具也颇为相似。但事实真的是这样吗?我将从点击率预估的视角来谈谈我对此次竞赛题目——转化率预估的看法。

转化率预估与点击率预估的异同

点击率预估和转化率预估都是广告领域的典型问题,它们之间有很多的相似之处,例如都是典型的二分类,点击率预估的工具和方法也常常应用于转化率预估问题上,但是它们又有着各自的特点。

相同点

无论是点击率预估还是转化率预估,都是一个典型的二分类问题,可以描述成下面统一的形式:

除掉建模对象需要考虑的信息不尽相同外,两者解决的问题极为相似。因此,用于点击率预估的常用方法、手段和工具,也常常应用于转化率预估问题上。

不同点

虽然两者从问题的定义上看是一致的,也确实共用了不少算法、工具和方法论,但是两者面对的问题和挑战存在差异,从某些方面来说,转化率预估要做好比点击率预估更难。

转化率预估效果采集更困难

点击率预估预测的是用户的点击行为,用户的点击行为可以通过在广告位上埋点进行上报,由于用户点击数据影响流量主的收益,因此通常流量主会尽可能保证点击效果回流的质量和数量。而转化率预估的是用户跳转到广告主推广页面的转化行为,数据采集依赖于广告主的配合。即使在广告主配合的情况下,也存在转化数据链路的工程稳定性问题。

转化率预估在效果数据采集上的困难是广告系统采用CPA[1]计费的一个主要难点。转化数据采集的能力,是腾讯社交效果广告的一大优势,在APP类广告中这种优势体现得尤为突出。

此次比赛数据中,转化效果数据是否存在漏报、误报的情况,也需要选手们自己去探索。

转化预估效果回流时间更长

广告曝光后,用户的点击行为往往随之触发,除掉部分特殊广告位外,点击效果回流时间多在分钟级。而用户的转化行为则发生在广告点击之后,部分转化动作发生周期比较长,例如,电商的下单转化、APP的激活转化。从点击到发生转化,这个时间可能达到小时级,甚至天级,当然,对于不同商品类型的广告,转化回流时间差异也很大。

不同类型商品的转化效果差异大

点击率预估在不同广告位上的点击率差异往往比较大,而转化率预估在不同商品类型上的转化效果差异更加明显。拿电商和APP的转化数据来说,两者的转化指标差异能达数倍之多。因此,如何考虑不同商品类型广告间天然的转化bias差异也是转化率预估的一个难点。分商品类型来优化是一个常见思路。

不过此次赛题只涉及一种商品类型广告的转化率预估,使问题难度降低了不少,也可以让选手更专注于其中一种类型商品的转化分析。

转化预估的效果定义更加丰富

点击率预估的效果就是用户的点击行为,而转化率预估的用户转化行为的定义则多种多样。常见的包括,用户的下单行为、APP的激活转化、微信上微信公众号的关注行为,也有在社交广告上新兴的赞点评转化。

现在还比较少涉及多目标优化,此次赛题也只以用户的APP激活转化作为转化率预估的目标。

转化预估的数据更加稀疏

点击率预估的训练数据是用户的曝光、点击日志,数据规模极大,多数情况下不需要考虑样本充分度的问题。而转化率预估预测的是用户点击行为后的转化,训练数据的规模与点击日志的规模相当,数据量减少了几个数量级。因此,不少在点击率预估问题上行之有效的方法和特征,在转化率预估问题上可能需要重新审视,比如模型复杂的时候训练样本是否充分,是否需要调大正则化系数等等。

[1] CPA计费:按广告的实际转化效果扣费

总结

笔者从点击率预估的视角对腾讯社交广告大数据竞赛的赛题做了点评,主要对比了广告点击率预估与转化率预估的异同点,突出比较了两者的差异性。选手在采用常见的点击率预估方案来解决此次的转化率预估问题的过程中,也可以参考上面提到的两个问题间的差异,求同存异,设计更合适的解决方案。

作者简介

汤斌,2015年硕士毕业于哈尔滨工业大学深圳研究生院,研究自然语言处理相关的课题。毕业后就职于腾讯社交与效果广告部,负责过广告的线上排序策略,目前主要从事与广告、上下文画像,点击率预估相关的工作。

【干货】从点击率预估的视角看腾讯社交广告算法大赛相关推荐

  1. criteo 点击率预估_预处理criteo数据集以预测广告的点击率

    criteo 点击率预估 Amany Abdelhalim阿曼尼·阿卜杜勒哈林 Follow跟随 Sep 18 九月18 Preprocessing Criteo Dataset for Predic ...

  2. 微信公众号广告点击率预估效果优化

    [转载]微信公众号广告点击率预估效果优化_腾讯大数据 http://data.qq.com/article?id=2914 1.背景 点击率预估(pCTR)是广告投放过程中的一个重要环节,精准的点击率 ...

  3. 计算广告(一)【Ad Click Prediction: a View from the Trenches】工程实践视角下的广告点击率预估

    计算广告(一)Ad Click Prediction: a View from the Trenches --工程实践视角下的广告点击率预估 这是谷歌发表于KDD2013的一篇文章,从年份来看,已经有 ...

  4. CTR点击率预估干货分享

    1.指标 广告点击率预估是程序化广告交易框架的非常重要的组件,点击率预估主要有两个层次的指标:  1.排序指标.排序指标是最基本的指标,它决定了我们有没有能力把最合适的广告找出来去呈现给最合适的用户. ...

  5. 效果广告点击率预估实践:在线学习

    效果广告点击率预估实践:在线学习 原创 2016-03-24 腾讯大数据 腾讯大数据 1.引言 技术钻研如逆水行舟,不进则退.公司的广告业务发展非常迅猛,有目共睹,激烈的外部竞争和客户越来越高的期望, ...

  6. 阿里最新论文解读:考虑时空域影响的点击率预估模型DSTN

    作者 | 石晓文 转载自小小挖掘机(ID: wAIsjwj) [导语]:在本文中,阿里的算法人员同时考虑空间域信息和时间域信息,来进行广告的点击率预估. 什么是时空域?我们可以分解为空间域(spati ...

  7. 点击率预估模型汇总_CIKM20MiNet:阿里|跨域点击率预估混合兴趣模型

    " 本文介绍了阿里提出的一种利用跨域信息的CTR预估模型,基于UC头条的应用场景,将新闻feed流作为源域,广告作为目标域.跨域点击率预估的最大优势在于通过使用跨域数据,目标域中的数据稀疏和 ...

  8. 推荐搜索炼丹笔记:SIM 用户行为序列点击率预估模型

    作者:十方,公众号:炼丹笔记 Search-based User Interest Modeling with Lifelong Sequential Behavior Data for Click- ...

  9. 漫谈深度学习时代点击率预估技术进展

    漫谈深度学习时代点击率预估技术进展(2019-1) 本文来源:[镶嵌在互联网技术上的明珠] (https://zhuanlan.zhihu.com/p/54822778) 下文是阅读后的一些笔记 在D ...

最新文章

  1. 国内丨中国人工智能标准化体系建设提速
  2. 怎么安装python3-Ubuntu16.04怎样安装Python3.6
  3. leetcode 978. Longest Turbulent Subarray | 978. 最长湍流子数组(Java)
  4. Android开发笔记(一百五十九)Android7.0的分屏模式
  5. 常见的几种网络故障案例分析与解决
  6. VMware安装Fedora 35 Workstation及使用体验
  7. java 2 sdk下载_Java 2 SDK Standard Edition官方版
  8. 《百家讲坛》之战国七雄
  9. 制作u盘winpe启动盘_U盘启动盘如何制作?图文教程详解!
  10. 往事如烟 - 老钟14
  11. The coordinates or measures are out of bounds.
  12. 第9章第18节:制作商业计划书的商业模式幻灯片 [PowerPoint精美幻灯片实战教程]
  13. WebStorm中TODO的作用
  14. 程序员跳槽一次到底能涨多少?今天带你见识下跳槽天花板
  15. 安全测试(三) 服务器安全 渗透测试 常规服务器安全漏洞 高危端口暴露、弱口令密码、暴力破解、服务器提权、Mysql数据库提权等 浅谈《社会工程学》实战案例
  16. 数据中台当前与未来-数字化架构设计(1)
  17. 不同试验设计遗传力的计算方法
  18. 17-1-数据处理思想和程序架构: 单片机stm32的flash保存数据优化方案(让擦写次数达到上百万至上千万次)
  19. Linux CFS中的进程调度
  20. 阿里云服务器安装WordPress,搭建自己的博客网站

热门文章

  1. SAP License:别闹了,这些都不是数字化转型
  2. 模型审查的4个核心要点
  3. flutter - fluro
  4. c语言是如何实现泛型链表
  5. 关于提高网站性能的几点建议(二)
  6. 付忠庆的练习小笔记-Codeforces #276 Div2 C
  7. c语言学习之结构篇代码演示样例-输入n个同学的姓名,数学英语成绩,依照平均分从低到高排序并输出...
  8. LeetCode: Word Search
  9. GDB调试多进程程序或同时调试多个程序
  10. img默认图片的问题