说到点击率模型这个“古老”的话题,大家第一时间想到的是wide&deep,DeepFM,DCN等。但是说到GNN预估点击率,大家又能想到几个呢?《Explicit Semantic Cross Feature Learning via Pre-trained Graph Neural Networks for CTR Prediction》这篇论文告诉我们GNN搭配预训练和显式交叉特征,可以"吊打"现有的点击率模型,那接下来看看这模型有什么特别之处吧。

现存模型有哪些问题?

论文指出,现存模型都是"隐式"挖掘交叉特征的,就像一般的DNN,所有特征embedding后输入到全连接层,每一个bit的特征都会交叉,但是我们也不清楚最后到底哪些特征之间的交叉特征真正被被模型所利用。当然有种常用添加显式交叉特征的做法,就是通过统计两个特征出现的count等历史统计特征,添加到模型。这样存在的问题也很明显,主要有以下两个大问题:

  • 泛化能力不强:比较容易理解,基于统计提取交叉特征,我们只能提取到历史出现过的pair对,对于没处出现过的pair,我们只能给予个默认值,这样就影响了模型的泛化能力。
  • 极其占用资源:统计特征实际使用时,需要一张很大的此表,key是统计的pair,value是统计值,而且随着时间变化,这张巨大的此表也需要频繁更新,由此引起了很多计算和维护成本。

所以本文提出了Pre-trained Cross Feature Graph Neural Networks(PCF-GNN)把丰富的交互特征建模成图上的边,每个节点都是一个特征,采用自监督的预估任务的GNN模型能学到显式交互特征并推断出新的边信息。

PCF-GNN

既然是pretrain模型,第一步当然是做预训练,然后再进行下游任务也就是点击率预估。

关于图构建(如下图所示),首先用历史交互行为构建图,图中用户,item,Shop都是节点,边就是节点直接交互的概率。如u1和i1曝光过3次,点击过一次,所以边的值为1/3。

接下来就可以进行预训练了,我们知道边的值本质上就是显式的交互特征,我们通过自监督学习,预估边的值,预估任务被定义为mse(pu,v - au,v),pu,v是PCF-GNN的输出。

GNN非常重要的环节就是每个node理解邻居的信息,学到自己的embedding。这篇论文提出了一个基于multi-relation的聚合函数,如下图所示:

这个公式表达的非常清楚且简洁,k就是第几层(需要多次聚合),r是节点间是何种关系,不同关系会通过AGGREGATE函数聚合成|r|个向量,最后再通过COMBINATION函数把|r|个关系的向量聚合起来最后最终i节点的输出。AGGREGATE和COMBINATION可以参考GraphSAGE。当计算出hi后我们通过CrossNet求得最终预估值,如下式所示:

论文提到,损失函数不能简单的定义为mse,因为不同边,对预估ctr的权重是不一样的,为了预训练模型能够更好的区分交互特征的重要性论文提出了weghted square loss,定义如下所示,所以共现次数越高,重要性越强:

在完成预训练后,我们就可以进行下游任务了,如下图所示:

将不同node的embedding和p作为特征,再加上其他特征输入到最终的全连接网络,预估最终的点击率。

实验

用预训练GNN预估点击率有奇效?

用预训练GNN预估点击率有奇效?相关推荐

  1. 怎样预训练GNN能实现更好的迁移效果?

    视学算法报道 作者:小舟.陈萍 预训练与微调之间的差异能否缓解?来自北京邮电大学.腾讯.新加坡管理大学和鹏城实验室的研究者进行了分析研究,并提出了一种针对 GNN 的自监督预训练策略. 图神经网络(G ...

  2. 分享Spark MLlib训练的广告点击率预测模型

    2015年,全球互联网广告营收接近600亿美元,比2014年增长了近20%.多家互联网巨头都依赖于广告营收,如谷歌,百度,Facebook,互联网新贵们也都开始试水广告业,如Snapchat, Pin ...

  3. 推荐搜索炼丹笔记:SIM 用户行为序列点击率预估模型

    作者:十方,公众号:炼丹笔记 Search-based User Interest Modeling with Lifelong Sequential Behavior Data for Click- ...

  4. 精准营销:剖析广告点击率预估系统

    引文 点击率预估系统最早是由谷歌实现,并应用在其搜索广告系统.在看到这一大杀器为谷歌带来滚滚财源之后,其他公司也纷纷效仿.直到今日,大大小小的"互联网广告公司",都宣称自己掌握了基 ...

  5. Make GNN Great Again:图神经网络上的预训练和自监督学习

    来源:RUC AI Box本文约6500字,建议阅读13分钟本文梳理近年来 GNN预训练和自监督学习/对比学习的相关工作. 1 引言 近些年来,对图神经网络(GNN)的研究如火如荼.通过设计基于 GN ...

  6. 图神经网络GNN预训练技术进展概述

    来源:图与推荐本文约2800字,建议阅读5分钟本文为大家推荐四篇有关于GNN预训练的文章. 论文推荐 /introduction/ 机器学习的成功很大程度上取决于数据.但是,高质量的标记数据通常很昂贵 ...

  7. Make GNN Great Again: GNN 上的预训练和自监督学习

    © 作者|侯宇蓬 机构|中国人民大学高瓴人工智能学院硕士一年级 导师|赵鑫教授 研究方向 | 图机器学习和推荐系统 1 引言 近些年来,对图神经网络(GNN)的研究如火如荼.通过设计基于 GNN 的模 ...

  8. MGSSLMotif-based Graph Self-Supervised Learning for Molecular Property Prediction|分子性质预测|GNN|自监督|预训练

    近期刚刚在NeurlPS-21上发表了一篇文章,用于分子性质预测的图预训练策略. 本文亮点在于①提出一套分子破裂的方法:②提出构建官能团树的方法:②同时在节点级和官能团级进行预训练,自动分配不同的权重 ...

  9. KDD 2020 开源论文 | GPT-GNN:图神经网络的生成式预训练

    论文标题:GPT-GNN: Generative Pre-Training of Graph Neural Networks 论文链接:https://arxiv.org/abs/2006.15437 ...

最新文章

  1. LINQ的Union方法
  2. C#基础—不完整类型(局部类型)
  3. 三星玄龙MR头显评测:将成 Vive Pro 最大竞争对手?
  4. WordPress的varnish内存缓存方案
  5. 教 Chatbot 生成更有营养的对话
  6. “注册编辑已被管理员停用”之解决办法
  7. 从阿里云七代云服务器,谈云计算四大趋势
  8. 第一次打开Lightroom时的基本设置
  9. rxjs的一个例子:什么是rxjs的OperatorFunction?
  10. vue 生命周期_Vue生命周期小白看了都会的
  11. html扇形调节角度,CSS如何实现任意角度的扇形(代码示例)
  12. 【漫画】AI小猪的一生---阿里云ET农业大脑如何与特驱集团养出“200公里猪”
  13. Spring MVC访问页面拦截js和css文件解决方法( No mapping found for HTTP request with URI [/Recruit/js/popper1.15.0.)
  14. 苹果支付2500万美元和解专利侵权诉讼 获技术授权
  15. Microsoft PowerToys
  16. 使用Python自动生成带有图表文字的PDF(附带万字完整代码)
  17. 不到最后,你永远不知道会发生什么
  18. Web开发实用浏览器(工具)插件
  19. 2011 10.1 GHOST XP SP3 快速装机纯净国庆版 V1.0
  20. 高通与安卓水火不容 Android音频系统缺陷测评

热门文章

  1. eclipse版本详解以及下载安装步骤及启动eclispe报错整理
  2. bzoj1854 [Scoi2010]游戏——匈牙利算法
  3. mysql DbProviderFactories.GetFactory失败,解决方法
  4. Hibernate中常用对象、方法、属性的理解
  5. 项目管理13禁忌[转]
  6. CSS技巧(含色卡)
  7. pojo java,什么是java pojo类,java bean,普通类?
  8. Python-Opencv学习-实验-1:工具安装
  9. 神经网络 | DeepVO:Towards End-to-End Visual Odometry
  10. 计算机文化基础操作考试,(计算机文化基础上机考试操作指南.doc