原文:hhttp://www.flickering.cn/ads/2014/06/%E8%BD%AC%E5%8C%96%E7%8E%87%E9%A2%84%E4%BC%B0%E2%80%94%E2%80%94%E5%BC%95%E8%A8%80/

最近几年,“计算广告学”的概念风生水起,让我们这些从事在线广告匹配技术的程序猿着实荣耀了一把。这在参加校园招聘时最有所体会,前几年学生经常问面试官的问题是“你们做网页搜索吗?”,这些年学生更经常问“你们做广告吗,你们做大数据挖掘吗?”。每当这个时候,我的心中就会油然而生满满的幸福感,还要装着没什么的样子回答“当然了”。

不过,这里我们不会聊“计算广告学”,因为这个概念已经被很多前辈讲的系统且详尽,如最早提出“Computational Advertising”的Andrei Broder和前Yahoo!高级科学家刘鹏。这里我们只会聊“计算广告学”中的一个子集——转化率预估(Conversion Modeling),我们选择它不是因为它简单而是因为它很难,这样才会聊的津津有味。

要理解转化率预估,先得理解互联网广告的商业模式,业内常见的商业模式有四种(图1):1) CPM,按展现付费;2)CPC,按点击付费;3)CPA,按转化付费;4)CPS,按销售分成。容易理解,广告主最欢迎CPA模式,因为这种模式的广告投放效率最高,广告主不必为无效的展现和点击买单。然而,业内做CPA的广告网络(Ad Network)并不多,主要原因是转化数据难以收集,腾讯的广告系统广点通有天然的优势:植根于电商平台和开放平台,我们可以获取到电商类广告和应用类广告的转化数据。以数据为基础,再结合大规模机器学习算法,我们就可以实现广告转化率的实时预估——这对于CPA模式的广告匹配是很重要的,因为它是广告排序和计费的基础。如图2所示,广告平台会按期望收益对广告进行排序,而广告的期望收益等于广告主出价(Bid)和广告预估转化率(pConversion,广告展现时发生转化行为的概率)的乘积:

图1

图2

也许读者要说了,计算pConversion很容易啊——统计每个广告的展现次数Impressions和转化次数Conversions,并令pConversion=ConversionsImpressions不就可以了?这种方法是把pConversion当做服从二项分布的变量,通过ConversionsImpressions计算pConversion的点估计。乍一看这种方法没什么问题,但仔细想想问题还真不少:

1)  不是每个广告都有展现的,比如对于新广告Impressions = 0;

2)  即便广告有展现,但当ImpressionsConversions不充分时,点估计就会有问题,比如Conversions = 1,Impressions = 1,我们显然不能轻易得到结论pConversion = 1。这就好比我们通过抽样去得到计算产品的废品率,不能因为只抽取了一个产品是废品,我们就说这批次产品的废品率是100%。从统计学上去理解,虽然ConversionsImpressions是pConversion的无偏估计,但当ImpressionsConversions不充分时,点估计的置信区间会很大,此时用ConversionsImpressions作为pConversion的估计值就有问题;

3)  引入一些平滑(Smoothing)技术能否解决2)中的问题呢?答案是肯定的,不过要知道,影响广告转化的因素很多,只考虑广告的展现和转化次数,而忽略其他特征的做法会影响预估的准确率。比如一个卖女装的广告,展现给男性和女性时的转化率是不同的,不能一概用ConversionsImpressions去做估计。

此时,就要祭出我们的法宝——大规模机器学习技术了。接下来的几章,我们会介绍:

第二章     逻辑回归技术

第三章     并行逻辑回归技术

第四章     特征选择

第五章     在线学习技术

第六章     深度学习

转载于:https://www.cnblogs.com/zhizhan/p/5007500.html

[转化率预估-1]引言相关推荐

  1. 腾讯社交广告转化率预估初探

    腾讯社交广告转化率预估初探 著名广告大师约翰•沃纳梅克提出:"我知道我的广告费有一半浪费了,但遗憾的是,我不知道是哪一半被浪费了".相比传统广告,互联网广告最大的优势之一:效果可测 ...

  2. 多任务学习(MTL)在转化率预估上的应用

    今天主要和大家聊聊多任务学习在转化率预估上的应用. 多任务学习(Multi-task learning,MTL)是机器学习中的一个重要领域,其目标是利用多个学习任务中所包含的有用信息来帮助每个任务学习 ...

  3. 贝壳CVR转化率预估模型实践

    分享嘉宾:王志勇 贝壳 架构师 编辑整理:戴稚晖 陆金所 出品平台:DataFunTalk 导读:贝壳从房产领域的产业互联网角度介绍智能广告投放的挑战.实践和思考.房产互联网是典型的高价值.长周期转化 ...

  4. 雅虎联合阿里提出转化率预估实用框架并用于在线展示广告

    A Practical Framework of Conversion Rate Prediction for Online Display Advertising Quan Lu, Shengjun ...

  5. SIGIR'22 | 阿里 ESCM^2: 升级版全空间多任务转化率预估

    大家好,我是蘑菇先生. 今天分享阿里巴巴-蚂蚁发表在SIGIR2022的论文:ESCM^2 : Entire Space Counterfactual Multi-Task Model for Pos ...

  6. 从FM推演各深度学习CTR预估模型

    本文的PDF版本.代码实现和数据可以在我的github取到. 1.引言 点击率(click-through rate, CTR)是互联网公司进行流量分配的核心依据之一.比如互联网广告平台,为了精细化权 ...

  7. 从FM推演各深度CTR预估模型(附代码)

    作者: 龙心尘 && 寒小阳 时间:2018年7月 出处:https://blog.csdn.net/longxinchen_ml/article/details/81031736 h ...

  8. Ctr点击率预估理论基础及项目实战

    1.机器学习推荐算法模型回顾 召回(粗排) 利用业务规则结合机器学习推荐算法得到初始推荐结果,得到部分商品召回集 ALS\UserCF\ItemCF\FP-Growth\规则等方式召回 排序(精排) ...

  9. CIKM 2021 | AutoHERI: 基于层次表示自动聚合的 CVR 预估模型

    本文主要介绍阿里妈妈大外投广告算法团队在 CVR 预估模型与多任务学习方法上的一些探索.我们提出了一种基于层次表示自动聚合的 AutoHERI 模型(Automated Hierarchical Re ...

最新文章

  1. Maven最佳实践:划分模块
  2. 数字孪生等前沿技术,将如何解码未来交通?
  3. 二叉搜索树(BST)?平衡二叉树(AVL)?
  4. OpenCV霍夫线圆HoughLinesCircles的实例(附完整代码)
  5. [转]收集android上开源的酷炫的交互动画和视觉效果:Interactive-animation
  6. docker部署flask_使用Docker,GCP Cloud Run和Flask部署Scikit-Learn NLP模型
  7. 在centos7环境下建立MariaDB多实例
  8. 微信公众号开发--微信JS-SDK扫一扫功能
  9. VMWare 复制虚拟机系统后,模块“Disk”启动失败
  10. android byte转string_Dig101 - Go之string那些事
  11. js 基础 -- 循环、函数调用 、全局和局部变量、异常捕获、事件
  12. 使用FastReport 3.0及以上版本创建动态报表的几个技巧(转)
  13. 关系抽取之PCNN(Piece-Wise-CNN)
  14. 简单工厂模式、工厂模式以及抽象工厂模式(具体)
  15. 给大家分享一个QQ资料查询接口(等级,活跃,年龄,性别,身份卡)
  16. 用Node.js实现一个HTTP服务器程序(文件服务器)
  17. java实现网上招标系统
  18. python练习-句子逆序2
  19. 从搜狗网站爬取微信公众号文章
  20. 黑客攻防从入门到精通(第一篇:认识黑客)

热门文章

  1. bug诞生记——信号(signal)处理导致死锁
  2. C++11中std::packaged_task的使用
  3. 提高C++性能的编程技术笔记:设计优化/可扩展性/系统体系结构相关+测试代码
  4. 【Android】adb命令总结
  5. php 接口使用场景,接口使用场景、trait基本功能
  6. 一致性hash算法虚拟节点_一致性哈希算法——虚拟节点
  7. Java学习总结:56(Stack子类)
  8. Java项目:旅游网站管理系统设计和实现(java+springboot+jsp+mysql+spring)
  9. oracle存储空间管理,Oracle存储空间管理
  10. react select默认选项_reactjs – 如何为Picker提供默认的“Please select …”选项?