作者:一元
公众号:炼丹笔记  

Deep Feedback Network for Recommendation(IJCAI20)

背景

做数据挖掘相关的朋友,大多数都听说过特征工程这个艺术的词汇,却鲜有人知道标签工程这个伟大的词汇,诶,为什么很少有人知道呢?因为这个是我们自己造出来的,轻喷......但是这个词却真的非常契合本篇文章的核心思路,大家都知道标签脏或者模糊的问题,这个是所有数据里面不可避免的,那么如何解决或者缓解此类的问题呢?让标签更加置信,这个就是本文探讨的一个重点。具体细节,大家可以阅读下文慢慢品味.......

无论是显性反馈还是隐性反馈都能反映用户对商品的意见,这对于学习推荐中的用户偏好至关重要。然而,目前大多数推荐算法只关注隐式的正反馈(如点击),而忽略了其他信息丰富的用户行为。在这篇文章中,我们的目的是联合考虑显式/隐式和正/负反馈,以了解用户的无偏偏好。具体地说,我们提出了一种新的深度反馈网络(DFN)来建模点击、未点击和不喜欢行为。DFN有一个内部反馈交互组件,该组件捕获单个行为之间的细粒度交互,以及一个外部反馈交互组件,该组件使用精确但相对较少的反馈(单击/不喜欢)从丰富但非常嘈杂(unclick)的反馈中提取有用的信息。

基础概念

显示和隐式反馈

在推荐系统中,显式和隐式的反馈都是有价值的,许多工作使用特征mapping以及迁移学习的方式来构建显示和隐式反馈的关系,目前大多数算法使用多任务学习方式将显式和隐式反馈结合来联合处理ranking和rating的任务。在DFN中,我们使用高质量的但是相对稀有的显式反馈来指导学习。

负反馈

在平时,我们将缺失的或者未点击的样本作为负反馈,但是这么做会引入大量的噪音,因为未点击并不代表不喜欢,为了提取隐式反馈中的真实负信号,一些模型使用曝光变量或popularity。Zhao等人以点击和取消点击序列作为特征进行强化学习。相比之下,明确的负面反馈可以直接反映用户的负面意见,而其稀缺性限制了其在深层次模型中的使用。据我们所知,我们是第一个将点击、不点击、不喜欢的行为及其相互作用编码到深层神经推荐中,同时考虑到隐性和显性反馈中的负面信号的。

方法

三种反馈

DFN希望可以同时考虑大量的明显的和隐性的以及正负反馈来学习用户的无偏喜好,此处有三种不同的反馈:

  • 隐式正反馈:隐式正反馈在数量和质量上面是最容易满足的,在大多数传统模型,我们考虑点击行为序列{C1,...,Cn}作为隐式的正反馈;
  • 显式负反馈:显式反馈是高质量的,但是在现实世界中确是稀有的。此处我们在每个商品后面附加dislike按钮来收集现实的负反馈序列{d1,...,dn};
  • 隐式负反馈:我们将impressed但是没有点击的行为序列作为隐式负反馈,未点击的序列是所有反馈中最多的,但是它需要和大量的噪音以及false-negative信号斗争。

整体框架

1. 深度反馈交互模块

内部反馈交互组件:该模块关注目标商品和特定类型反馈中个人行为之间的交互作用。我们在item embedding和position embedding上进行multi-head self-attention,并投射到一个联合语义空间,形成行为嵌入。以点击行为为例,将目标商品t与点击序列的行为embedding相结合,形成输入矩阵,

我们还在特定type的超参数上使用相同的Transformer来生成明显的负反馈embedding, 以及从dislike和unclick的隐式反馈embedding,内部反馈交互成份很好地捕获了目标商品和每种反馈序列中行为之间的交互。它可以为用户提供与目标商品相关的积极和消极偏好。

外部反馈交互组件: 隐式的负反馈是充分的但也是noisy的,未点击的行为看上去是负的信号,但是曝光给用户的商品是被特定策略筛选过的,所以也可能包含粗粒度方面的用户兴趣。外部反馈交互组件旨在根据点击和不喜欢行为中的强烈反馈,区分用户在不点击行为中真正喜欢和不喜欢什么。

2. 特征交互模块

我们将稀疏的特征分为m个域,{x1,x2,...,xm} ,里面也包含连续域,例如年龄等,所有的field被表示为one-hot的embedding,lookup table被用来生成所有filed的dense特征{f1,...,fn},此处我们实现了Wide,FM以及Deep的成份来做特征交叉。

2.1 Wide部分

2.2 FM部分

2.3 深度部分

此处,我们使用一个二层的MLP来学习高阶的特征交叉,输入是dense特征和反馈特征的拼接形式,

3. 目标优化

最终我们的损失函数为:

实验

1. 效果比较

  • DFN在所有的baseline上的效果远超过了Baseline;
  • DFN的又是主要来源于它的深度反馈交叉模块。内部反馈交互组件通过transformer成功地捕获了目标项和个体行为之间的细粒度交互。它可以从不同类型反馈中的行为层交互中提取用户偏好。第二,外部反馈交互组件使用精确但相对较少的反馈来消除丰富但嘈杂的不点击的行为。因此,DFN可以解决数量与质量的两难问题。

2. Dislike预测

  • DFN取得了最好的效果;
  • 主要的改进来自两点:(1)DFN在损失函数中考虑了显式的负反馈,直接优化了不喜欢预测。(二)深度反馈交互模块引入了内部和外部反馈交互,更好地提取了信息丰富的用户无偏见的推荐偏好;
  • 对于公平模型的比较,我们进一步将DFN中的不喜欢损失添加到一些强基线中(DIN+);它的结果和DFN相比还是差了很远。

3. 解耦分析

  • DFN(click)效果优于DFN(w/o feedbacks),这证实了单击行为的重要性。
  • 从DFN(click)到DFN(internal)的显著改进也验证了unclick和dislike行为可以提供补充信息,帮助学习用户无偏见的偏好。
  • 与DFN(内部)和DFN(All)相比,外部反馈交互仍然有显著的改进,这证实了外部反馈交互组件在DFN中是有益的;

4. 在线效果

  • 与DIN相比,DFN在CTR和LCTR指标上实现了一致的改进,这证实了DFN在实际CTR预测中表现良好。
  • AUT的改进也意味着用户愿意花更多的时间使用我们的系统,因为DFN可以提供更好的推荐商品。
  • DTR的显著改进表明,DFN能够对推荐中的用户负偏好进行建模,这对于提高用户的实际体验至关重要。

结论

在本文中,我们提出一个深度反馈网路(DFN),它同时考虑显式/隐式和正/负回馈来学习使用者的无偏喜好。DFN在多个反馈中使用内部行为和外部反馈交互。离线和在线的显著改进验证了DFN的有效性和鲁棒性。在未来,我们将使用更复杂的排名模型进行功能交互。

参考文献

  1. Deep Feedback Network for Recommendation:ijcai.org/Proceedings/2

weixin.qq.com/r/XSjP1zr (二维码自动识别)

推荐算法炼丹笔记:标签工程相关推荐

  1. 推荐算法炼丹笔记:排序模型CTR点击率预估系列

    微信公众号:炼丹笔记 ​CTR点击率预估系列家谱 炼丹之前,先放一张CTR预估系列的家谱,让脉络更加清晰. (一)FiBiNET:结合特征重要性和双线性特征交互进行CTR预估 1.1 背景 本文发表在 ...

  2. 推荐算法炼丹笔记:CTR点击率预估系列入门手册

    ​CTR点击率预估系列家谱 炼丹之前,先放一张CTR预估系列的家谱,让脉络更加清晰. (一)FiBiNET:结合特征重要性和双线性特征交互进行CTR预估 1.1 背景 本文发表在RecSys 2019 ...

  3. 推荐算法炼丹笔记:序列化推荐系统

    作者:一元 公众号:炼丹笔记 特约审稿:杰少 背景 序列推荐系统(SRS)不同于传统推荐系统(RSs)包括协同过滤和基于内容的过滤,SRSs试图理解和建模用户的连续行为.用户与物品之间的交互作用以及用 ...

  4. 推荐算法炼丹笔记:推荐系统采样评估指标及线上线下一致性问题

    本文对于推荐系统中的采样评估指标进行了讨论,内容略多, 还有一些数学推导, 有兴趣的可以去阅读文末给出的原始论文链接, 此处直接列出核心观点: 在评估推荐算法的效果时,能不采样就不采样! 除了AUC, ...

  5. 推荐算法炼丹笔记:如何让你的推荐系统具有可解释性?

    作者:一元, 公众号:炼丹笔记 可解释性和有效性是构建推荐系统的两大关键成份,之前的工作主要关注通过引入辅助信息来获得更好的推荐效果.但这些方法会存在下面的两个问题: 基于神经网络的embedding ...

  6. 推荐算法炼丹笔记:科学调参在模型优化中的意义

    作者:九羽 ,公众号:炼丹笔记 基于Embedding的推荐算法模型一直是近几年研究的热门,在各大国际会议期刊都能看到来自工业界研究与实践的成果.MF(Matrix Factorization)作为传 ...

  7. 分级加权打分算法 java_推荐算法炼丹笔记:令人着迷的时间动态CF算法

    作 者:一元 公众号:炼丹笔记 背景 本文是一篇较老的文章,是Yahoo的研究员关于协同过滤中时间动态建模的最为细致的讨论. 顾客对产品的偏好随着时间的推移而变化.随着新选择的出现,产品的认知和受欢迎 ...

  8. 推荐算法炼丹笔记:非采样的负样本

    作者:一元,公众号:炼丹笔记 最近推荐相关的研究主要集中在探索神经网络的结构等,然后采用负采样对模型进行高效的学习.然而,这么做会导致有两方面的问题没有被考虑仔细: 负采样会带来较大的波动:基于采样的 ...

  9. 推荐算法炼丹笔记:序列化推荐算法Bert4Rec

    作者:一元 公众号:炼丹笔记 之前和海归博士朋友聊天,他说,这篇文章是他所有的复现算法中,处理序列最好的算法之一.原本以为Bert只常见于NLP中,本文我们一起详细地阅读学习一下如何使用Bert来做推 ...

最新文章

  1. ACMNO.2 输入一个华氏温度,要求输出摄氏温度。公式为 c=5(F-32)/9 输出要求有文字说明,取位2小数。 输入 一个华氏温度,浮点数 输出 摄氏温度,浮点两位小数
  2. window.requestAnimationFrame
  3. echarts格式化tooltip数据
  4. php无刷新跳转,用#号实现web页面的无刷新跳转
  5. Lenovo 媽媽咪啊,坑爹麼?(Win 7 整合 USB3 NVME )驅動
  6. windows系统下,在iis管理器(无W3SVC/WAS服务)或网站IIS功能不全(无默认文档、模块、各种规则设置等)
  7. rxbus 源码_Rxbus事件交互
  8. 【集训队互测 2012】Middle
  9. BGP基本配置和路由聚合
  10. 服务器都是sas硬盘吗,服务器硬盘SAS与SATA区别介绍
  11. mysql分列查询,SQL计算符合条件行数量,并分列显示,怎么做
  12. sklearn入门——逻辑回归
  13. 微信小程序做一个调查问卷(二)
  14. 软工网络15团队作业8——Beta阶段敏捷冲刺
  15. icloud有linux客户端吗,icloud
  16. 谷歌眼镜开发Mirror API之Java开发
  17. graalvm22.3.1打包exe和linux
  18. 新加坡国际学校年年IB成绩领先,到底有何优势?
  19. 初等数学复习之方程和方程组(多项式的待定系数法)
  20. 【华为云】用VNC远程连接Ubuntu20.04图形界面

热门文章

  1. webpack对icon-font图片的处理
  2. angularjs $watch
  3. linux fork, system, exec()
  4. 3.2 矩阵和图像类型
  5. 习惯 积累 沉淀
  6. 苹果 App Store 申请和管理相关知识
  7. 使用System.Transactions
  8. 基于visual graph开发实时线损管理系统
  9. New beginning
  10. python phpstudy_Java、python及phpstudy的环境配置