上一篇文章点击率预估与冷启动(一)咱们说到了键值储存网络,今天我们接着往下说。

键值储存网络实现了字典特征到向量的转换,而我们希望得到的是连续值特征到向量的转换。我们其实只需要再实现连续值到字典特征的转化就大功告成了。虽然连续值特征到向量很难,但是连续值特征到字典特征的实现方式却有很多。

假定有了连续值特征到字典特征的转化,那么总体架构和键值记忆网络基本一致,如下图所示:

连续值特征到字典特征的转化即图中的Key-Value Memory,如何实现这部分应当结合具体业务场景的数据分布。这里先介绍下郭佬的做法吧:

(1).将连续值特征缩放至区间[0,1]

(2).在[0,1]区间找n等分点,比如n=6时,就是(0, 0.2, 0.4, 0.6, 0.8, 1)

(3).依次计算连续值特征x与n等分点的距离,比如x=0.3,n=6,就是(0.3, 0.1, 0.1, 0.3, 0.5, 0.7),之后构造字典特征{0:0.3, 1:0.1, 2:0.1, 3:0.3, 4:0.5, 5:0.7}

(4).对字典特征的value部分取倒数后接softmax,具体相似度公式如下:

公式当中分母上加10-15是为了防止当q正好等于某个等分点时分母为0的情况。郭佬的方法将字典特征的key定义为[0,1]区间的等分点,之后对浮点数与各等分点的距离做取倒数和softmax变换。取倒数是为了保证浮点数越接近等分点,权重越大。softmax变换是为了保证所有权重之和为1。

实践中发现,当q与某个等分点较接近时,value中除了该等分点对应的值外,其它值都非常接近0。这主要是因为softmax函数会指数级加大距离间的差异。为了缓解这种情况,我们对上述公式做了改进:

该公式取距离平方反比为权值,之后将权值缩放至总和为1。用该公式得到的权值比较“分散”,可以让模型更好的学习那些冷门分位数的embedding表示。

截至目前,我们已经讲了点击率特征的贝叶斯平滑,以及如何在不损失精度的情况下把浮点数特征(比如点击率特征)输入神经网络。

如果把点击率看成一个普通浮点数,问题已经解决。但是点击率并不普通,点击率可以被认为是用户是否点击广告这个随机变量的期望值。

用户是否点击广告实际上是一个随机变量,点击率就是用这个随机变量的期望值作为特征,去描述它。这样做实际上是用一个值去代表一个复杂的分布,必然会带来信息损失。举个例子,A用户浏览20次,点击10次。B用户浏览100次,点击50次。A和B的点击率都是50%,但是他们是否点击广告的概率分布却大不一样,虽然AB两用户点击率都是50%,但是B用户点击次数更多,所以B用户的点击率置信度更高,B用户的概率分布也更集中。这就体现出点击率特征的弊端,它只能描述概率分布的期望,而无法完整描述概率分布。

我们希望完整描述概率分布给到模型,我们希望精确区分出点击率很相似但总浏览数差异很大的那群人。这个问题可以被定义为如何向模型描述一个概率分布。用户是否点击广告的概率分布是连续的,可以用概率密度函数表示。我们对概率密度函数进行分段近似,分别统计它在[0,0.1),[0.1,0.2),[0.2,0.3),[0.3,0.4)...区间的平均值,用这些平均值来表示这个分布。形式如下:

{[0,0.1):0.1,[0.1,0.2):0.2,[0.2,0.3):0.4,[0.3,0.4):0.4,...}

该形式其实也是字典特征,它的key表示的是一个区间,value是点击率这个随机变量落在各区间的概率。如此一来,可以直接将这个字典特征输入键值储存网络。这种方式利用随机变量的概率分布,跳过了连续值特征转到字典特征这一步,直接做随机变量值到字典特征,避免了上文中的人工设计的相似度公式所带来的信息损失。如果构造的特征可以被看做是随机变量,那么就可以利用数学工具得到它的概率分布,概率分布分段近似得到字典特征,最后将字典特征输入键值储存网络。

到此为止,我们讲完了点击率预估与冷启动,具体方法概括如下:首先利用贝叶斯平滑对点击率这种连续值特征进行修正,使其更接近用户真实点击的概率,接着将修正后的特征值转换成字典特征,最构建整个键值存储网络。

下一篇咱们讲讲oCPC中的成本控制。

欢迎关注微信公众号:计算广告那些事儿

点击率预估与冷启动(二)相关推荐

  1. 点击率预估与冷启动(一)

    点击率预估与冷启动(一) 之前一篇文章和大家聊了下<转化率模型与校准>,今天咱们来聊聊点击率预估以及冷启动的问题.有些读者在看完之后可能会发现这两者之间的微妙的联系.废话不多说,开启今天的 ...

  2. 京东最新点击率预估模型论文学习和分享

    最近看了京东算法团队最新发表的一篇点击率预估模型的paper Telepath: Understanding Users from a Human Vision Perspective in Larg ...

  3. 关于点击率模型,你知道这三点就够了 点击率预估的几个经典模型简介

    关于点击率模型,你知道这三点就够了 德川 2015年11月24日 阅读 2091 快速评论 说到广告,或者运营,关注的最多的就是点击率了.我们经常能听说某某科学家通过建立更好的点击率预测模型,为公司带 ...

  4. 点击率预估模型汇总_CIKM20MiNet:阿里|跨域点击率预估混合兴趣模型

    " 本文介绍了阿里提出的一种利用跨域信息的CTR预估模型,基于UC头条的应用场景,将新闻feed流作为源域,广告作为目标域.跨域点击率预估的最大优势在于通过使用跨域数据,目标域中的数据稀疏和 ...

  5. 点击率预估的几个经典模型简介

     点击率预估的几个经典模型简介 2016-02-22 00:32 点击率预估是大数据技术应用的最经典问题之一,在计算广告,推荐系统,金融征信等等很多领域拥有广泛的应用.本文不打算对这个话题做个全面 ...

  6. 程序化广告交易中的点击率预估

    程序化广告交易中的点击率预估 指标 广告点击率预估是程序化广告交易框架的非常重要的组件,点击率预估主要有两个层次的指标: 1. 排序指标.排序指标是最基本的指标,它决定了我们有没有能力把最合适的广告找 ...

  7. 【论文解读】CIKM20-MiNet:阿里|跨域点击率预估混合兴趣模型

    " 本文介绍了阿里提出的一种利用跨域信息的CTR预估模型,基于UC头条的应用场景,将新闻feed流作为源域,广告作为目标域.跨域点击率预估的最大优势在于通过使用跨域数据,目标域中的数据稀疏和 ...

  8. 一文总结排序模型CTR点击率预估

    ​CTR点击率预估系列家谱 炼丹之前,先放一张CTR预估系列的家谱,让脉络更加清晰. (一)FiBiNET:结合特征重要性和双线性特征交互进行CTR预估 1.1 背景 本文发表在RecSys 2019 ...

  9. 推荐算法炼丹笔记:排序模型CTR点击率预估系列

    微信公众号:炼丹笔记 ​CTR点击率预估系列家谱 炼丹之前,先放一张CTR预估系列的家谱,让脉络更加清晰. (一)FiBiNET:结合特征重要性和双线性特征交互进行CTR预估 1.1 背景 本文发表在 ...

最新文章

  1. 物理化学 界面现象
  2. CG CTF WEB 变量覆盖
  3. pytorch 之 分开安装 torch 和 torchvision
  4. java生产者与消费者问题_java生产者与消费者问题
  5. 常用JS正则匹配函数
  6. java 中Double类型转换为百分比格式
  7. CCF NOI1032 菱形
  8. thinkphp3.2独立分组的建立
  9. 文本生成系列之预训练模型
  10. Spark 概念学习系列之从物理执行的角度透视spark Job(十七)
  11. 十二款世界顶级杀毒软件下载---有序列号全可免费升级
  12. 空间直线同球体交点求解
  13. windows UWP 应用使用系统代理
  14. FieldTrip toolbox教程系列(1)-预处理-读取连续的EEG和MEG数据
  15. uniapp实现公众号H5、小程序和App微信授权登录功能
  16. 分辨率自动调节html,如何让网页自适应手机屏幕分辨率_html/css_WEB-ITnose
  17. 做抖音为什么需要海外抖音服务器?如何自建海外抖音服务器站点?
  18. 如何在服务器上编辑配置文件
  19. 什么是ARPU与ARPPU ?
  20. 贴片电阻电容的封装形式及尺寸

热门文章

  1. pythonのdjango 缓存
  2. Android版数据结构与算法(五):LinkedHashMap核心源码彻底分析
  3. 如何评价一个RPC框架的性能
  4. python 查找IP地址归属地
  5. NAnt 与 MS Build
  6. hdu 1002 A+B problem II
  7. pytrhon画图matplolib
  8. DSAPI.网络.网卡信息属性表
  9. js根据数组对象中某属性进行排序
  10. 用一道面试题考察对闭包的理解