作者关于论文发的一些想法
https://zhuanlan.zhihu.com/p/287898562

ABSTRACT

受深度学习成功的启发,最近的工业点击率(CTR)预测模型已经从传统的浅层方法过渡到深度方法。深度神经网络(DNNs)具有从原始特征中自动学习非线性交互作用的能力,然而,非线性特征交互作用是以隐式方式学习的。这种非线性的交互作用可能很难捕捉并显式建模,原始特征的交互作用有利于CTR预测,协同作用指的是特征对最终预测的集体影响。在这篇文章中,我们认为目前的CTR模型没有充分挖掘特征共同作用的潜力。我们进行了实验,结果表明特征协同作用的效果被严重低估。基于我们的观察,我们提出了特征协同作用网络(CAN)来挖掘特征协同作用的潜力。该模型能够高效、有效地捕捉特征间的相互作用,在降低存储和计算消耗的同时,提高了模型的性能。在公共和工业数据集上的实验结果表明,该算法的性能明显优于最先进的CTR模型。到目前为止,CAN已经部署在阿里巴巴展示广告系统中,在CTR和RPM上分别获得了12%和8%的平均提升

1 INTRODUCTION

随着机器学习模型的日益复杂,尤其是推荐系统中的模型,如何有效、高效地处理丰富的输入特征成为一个关键问题。对于工业环境下的在线推荐,模型经常被训练成亿级规模的二值化稀疏特征,并使用一次热编码[3,22]。每个特征也可以看作一个唯一的ID,它首先映射到一个低维嵌入,然后再输入到模型中。处理大规模输入的一种简单方法是将每个特征视为独立的。在此假设下,特征之间不存在连接,从而可以直接训练广义线性模型以基于特征的组合(例如,串联)来估计点击率。
然而,推荐系统中的“推荐项目”和“用户点击历史”等特征是高度相关的[21,22],即对最终预测目标存在特征集合效应,如点击率,即特征动作。例如,在点击历史中有“泳衣”的女性用户很可能会因为“泳衣”和“护目镜”的共同作用而点击推荐的“护目镜”。特征共同作用可以被认为是对一组原始特征的子图进行建模。如果子图仅由两个特征组成,则对特征共同作用建模相当于对两个ID之间的边进行建模。共同作用的效果解释了一组功能如何与优化目标相关。如图1所示,功能部件协同操作显式地将功能部件对[A,B]连接到目标标签。
近年来,许多研究都致力于模型特征协同作用的研究。这些方法可以分为三类。基于聚集的方法[5,10,11,21,22]侧重于学习如何聚集用户的历史行为序列,以获得CTR预测的区别性表示。这些方法利用特征协同作用对历史行为序列中每个用户动作的权重进行建模。然后对加权的用户行为序列求和以表示用户兴趣。基于图的方法[6,9,15]把特征看作节点,这些节点以有向图或无向图的形式连接起来。在这种情况下,特征共同作用用作沿边缘传播信息的边缘权重。与基于聚集和基于图的方法将特征协同作用建模为权重不同,组合嵌入方法[12,14,19]通过显式组合特征嵌入来建模特征协同作用。
虽然以前的方法在不同程度上改善了CTR预测,但它们仍有一些不足之处。基于聚集的方法和基于图的方法仅通过边的权重来模拟特征的协同作用,但是边只用于信息聚集而不用于信息增强。另一方面,组合嵌入方法结合两个特征的嵌入来模拟特征的共同作用。例如,PNN[12]执行两个特征的内积或外积来增加输入。组合嵌入方法的一个主要缺点是嵌入同时负责表示学习和协同动作建模。表征学习和协同行为建模可能会相互冲突,从而限制性能

在本文中,我们强调了特征协作模型的重要性,并认为最先进的方法严重低估了协作的重要性。 由于有限的表达能力,这些方法无法捕获特征协作。 捕获特征协作以增加输入的重要性在于,它可以减少模型学习和捕获协作的难度。 假设存在一个对特征A和特征B的相互作用建模的最佳函数

CAN: Revisiting Feature Co-Action for Click-Through Rate Prediction相关推荐

  1. 创建与SharePoint 2010风格一致的下拉菜单 (续) 整合Feature Custom Action框架

    在上一篇"创建与SharePoint 2010风格一致的下拉菜单"文章中,演示了如何添加一个额外的菜单到页面顶端,并使其的样式风格与SharePoint 2010内置的菜单保持一致 ...

  2. 推荐系统(四)Field-aware Factorization Machines(FFM)

    推荐系统(四)Field-aware Factorization Machines(FFM) 推荐系统系列博客: 推荐系统(一)推荐系统整体概览 推荐系统(二)GBDT+LR模型 推荐系统(三)Fac ...

  3. 800 篇顶会论文纵览推荐系统的前沿进展

    © 作者|张君杰 机构|中国人民大学高瓴人工智能学院 引言:推荐系统作为人工智能领域最具有应用前景的方向之一,在学术界和工业界一直占据着重要地位.本文聚焦于推荐系统在学术研究方面的前沿进展,在之前整理 ...

  4. 跟我读论文系列之XGBoost

    文章目录 理论 TITLE 标题 AUTHOR 作者 ABSTRACT 摘要 INTRODUCTION 介绍 TREE BOOSTING IN A NUTSHELL 简单介绍一下树提升 Regular ...

  5. 行为识别Action Detection概述及资源合集(持续更新...)

    随着深度学习技术的发展,以及计算能力的进步(GPU等),现在基于视频的研究领域越来越受到重视.视频与图片最大的不同在于视频还包含了时序上的信息,此外需要的计算量通常也大很多. 这篇主要介绍Action ...

  6. 命令行神器 Click 简明笔记

    Click Click 是用 Python 写的一个第三方模块,用于快速创建命令行.我们知道,Python 内置了一个 Argparse 的标准库用于创建命令行,但使用起来有些繁琐,Click 相比于 ...

  7. Python命令行神器 Click 入门笔记

    高级教学参考: https://zhuanlan.zhihu.com/p/93738095 Click Click(https://github.com/pallets/click) 是用 Pytho ...

  8. 在OperaMasks中使用ELite和JRuby动态语言的秘笈

    如何在OperaMasks中使用动态语言 1. 前言 2. 在OperaMasks中使用ELite 2.1. ELite的介绍 2.2. 在OperaMasks中使用ELite 3. 在JSF中使用R ...

  9. AAAI2020录用论文汇总(一)

    本文汇总了截至2月23日arxiv上上传的所有AAAI2020录用论文,共计629篇,因篇幅过长,分为三部分,分享给大家.    AAAI2020论文汇总(part 1) [1] MA-DST: Mu ...

最新文章

  1. pythonのgevent同步异步区别
  2. 集合的势也称集合的基数(cardinal number)
  3. Lua 读表代码,自动生成字段名字
  4. fetch用英语解释_初中英语重点知识点,初中三年必须掌握!
  5. Gmail邮箱添加域名解析
  6. 重写(覆盖)重载与多态
  7. 外媒:现代和起亚计划在新一代电动汽车上使用碳纳米管加热器
  8. linux pxe安装视频,Linux—图解PXE实现全自动安装系统(1)
  9. linux中df和ls区别,linux系统文件大小ls、df、du命令的区别
  10. 【原创】搭建spark环境中的坑及解决办法
  11. Git仓库完整迁移,包括分支和标签和日志
  12. 理顺 JavaScript (7) - 数字相关问题
  13. mysql_affected_rows mysqli_关于mysqli_affected_rows()函数的详细介绍
  14. nginx的源码编译及相关文件配置
  15. 网工界的TFBOYS——netmikotextfsmntc-templates快速入门
  16. 电脑有网络,但所有浏览器网页都打不开,是怎么回事?
  17. 极化码自适应CA-SCL译码(极化码译码)
  18. roundcube邮箱手机端_企业邮箱申请后如何登录
  19. 查理·芒格:分享12个顶级思维模型
  20. 如何解决“应用程序无法启动,因为应用程序的并行配置不正确“问题

热门文章

  1. 刹那芳华,犹如指尖流砂
  2. 进来看新手该怎么选择自己的第一个平台——shopee、lazada、速卖通版
  3. JavaSE阶段笔记
  4. echarts.js 官网
  5. java jdk15.0.1环境配置(图文教程)
  6. 最全的硬盘修复专题帖1(转贴)
  7. python制作搜索工具,深挖电脑里的小九九
  8. A类博士后年薪30万起!北邮人工智能学院郭军教授实验室招聘博士后研究人员...
  9. 初中数学抽象教学的案例_新课标下初中数学问题情景教学案例和思考
  10. 南京大学计算机实验教程,南京大学 计算机系统基础 课程实验 2018(PA0-1)