MRIF: Multi-resolution Interest Fusion for Recommendation(SIGIR2020)

作者:一元,公众号:炼丹笔记

背景

本文分享阿里的最新的工作,该工作中的aggregator很简单而且在我这还略有提效,希望能对大家也能带来帮助,提前完成年终KPI!

个性化推荐的主要任务是根据用户的历史行为来获取用户的兴趣。推荐系统的最新进展主要集中在使用基于深度学习的方法精确地建模用户的偏好。用户兴趣有两个重要的属性,

  • 用户兴趣是动态的,并且随着时间的推移而演变;
  • 用户的兴趣有不同的分辨率,或者精确地说是时间范围,比如长期偏好和短期偏好。

现有的方法要么使用递归神经网络(RNNs)来解决用户兴趣的漂移,而不考虑不同的时间范围,要么设计两个不同的网络分别对长期和短期偏好进行建模。本文提出了一种综合考虑用户兴趣的多resolution兴趣融合模型。该模型能够捕捉用户兴趣在不同时间范围内的动态变化,为组合多resolution用户兴趣进行预测提供了有效途径。

提出的方案

Interest Extraction Layer

用户在每一步的兴趣可以被建模为一个隐藏变量,这个变量不能直接观察到,通过历史行为来估计。以往的研究使用隐马尔可夫模型(HMM)来预测用户的潜在兴趣,通过最大化隐藏用户兴趣下行为序列的概率。然而,HMM模型的状态非常有限,不能有效地表达用户的兴趣空间。DIEN选择基于GRU的RNN作为用户兴趣抽取器,这对于长序列是非常耗时的。有些文章提出的Transformer网络依赖于self-attention而不是recurrence,这是一种更快,更有效的方法。

此处我们使用transformer进行兴趣的收取,预训练的transformer网络来对下一步的商品进行预测。我们先用Multi-head attenion将输入序列投影到h的子空间中,然后使用scaled dot product attenion函数,我们使用两个纺射转化函数以及RELU函数来增加非线性能力。

Transformer网络建立在Multihead Attention和FFN的基础上,增加了dropout、layer normalization和residual链接。Transformer层方程如下:

为了准确捕捉用户在每一步的即时兴趣,我们预先训练Transformer网络来预测用户在每一步的下一个行为。

本文我们使用三种aggregator。

1. Mean aggregator

2. Max aggregator

3. Attentional aggregator

其中a是和embedding位置相关的attention参数。

  • POP方法在所有度量方面表现最差,因为它只考虑项目的流行性,而不考虑用户端信息。
  • BPR和NCF的性能优于POP,这是因为这两个模型使用基于协同过滤的方法来合并用户信息。
  • 在所有指标上,DIN都比BPR和NCF获得更好的结果,因为DIN依赖于注意力机制,并且使用目标项目关注用户的历史行为。
  • GRU4Rec、LSTM4Rec、CASER和SASRec都是顺序推荐方法,它们不仅使用了用户交互过的项目,而且还使用了顺序中项目的相对位置。由于考虑了项目的顺序,顺序方法的性能优于DIN。
  • SASRec在使用自我注意块方面优于其他三种顺序方法。本文的方法优于SASRec,在所有方法中取得了最好的结果。MRIF-attn在电影数据集上除AUC和GAUC指标外,其他指标均达到最佳,说明注意聚合器是最有效的。MRIF-avg的性能比MRIF-attn稍差,因为权重在平均聚合器中是常数。MRIF-max在所提出的三种方法中表现最差,这可能是因为max聚合器执行困难,同时因为我们只选择一个商品从而很多辅助信息都丢失了。

本文提出了由兴趣提取层、兴趣聚集层和注意融合结构组成的多分辨率兴趣融合模型,解决了不同时间范围内用户偏好的提取和组合问题。兴趣提取层在每一步都依赖于变换块来提取用户的即时兴趣。兴趣聚合层的重点是找到一组不同分辨率的用户兴趣。提出了三种不同的聚合器:平均聚合器、最大聚合器和注意聚合器。兴趣融合结构采用注意机制,整合多分辨率兴趣进行预测。在七个评价指标下对两个数据集进行了实验,证明了该模型的优越性。

  1. MRIF: Multi-resolution Interest Fusion for Recommendation:arxiv.org/pdf/2007.0708
更多干货,请关注“炼丹笔记”

推荐算法炼丹笔记:阿里序列化推荐算法MRIF相关推荐

  1. 推荐算法炼丹笔记:序列化推荐算法Bert4Rec

    作者:一元 公众号:炼丹笔记 之前和海归博士朋友聊天,他说,这篇文章是他所有的复现算法中,处理序列最好的算法之一.原本以为Bert只常见于NLP中,本文我们一起详细地阅读学习一下如何使用Bert来做推 ...

  2. 推荐算法炼丹笔记:序列化推荐算法SASRec

    作者:一元 ,公众号:炼丹笔记 背景 本文介绍一篇较早使用Self-Attention进行序列化推荐的文章,也是目前大多数序列化推荐算法非常重要的Baseline,最典型的场景可以参见标题,该篇文章的 ...

  3. 推荐算法炼丹笔记:序列化推荐系统

    作者:一元 公众号:炼丹笔记 特约审稿:杰少 背景 序列推荐系统(SRS)不同于传统推荐系统(RSs)包括协同过滤和基于内容的过滤,SRSs试图理解和建模用户的连续行为.用户与物品之间的交互作用以及用 ...

  4. 推荐算法炼丹笔记:推荐系统采样评估指标及线上线下一致性问题

    本文对于推荐系统中的采样评估指标进行了讨论,内容略多, 还有一些数学推导, 有兴趣的可以去阅读文末给出的原始论文链接, 此处直接列出核心观点: 在评估推荐算法的效果时,能不采样就不采样! 除了AUC, ...

  5. 推荐算法炼丹笔记:如何让你的推荐系统具有可解释性?

    作者:一元, 公众号:炼丹笔记 可解释性和有效性是构建推荐系统的两大关键成份,之前的工作主要关注通过引入辅助信息来获得更好的推荐效果.但这些方法会存在下面的两个问题: 基于神经网络的embedding ...

  6. 推荐算法炼丹笔记:科学调参在模型优化中的意义

    作者:九羽 ,公众号:炼丹笔记 基于Embedding的推荐算法模型一直是近几年研究的热门,在各大国际会议期刊都能看到来自工业界研究与实践的成果.MF(Matrix Factorization)作为传 ...

  7. 推荐算法炼丹笔记:排序模型CTR点击率预估系列

    微信公众号:炼丹笔记 ​CTR点击率预估系列家谱 炼丹之前,先放一张CTR预估系列的家谱,让脉络更加清晰. (一)FiBiNET:结合特征重要性和双线性特征交互进行CTR预估 1.1 背景 本文发表在 ...

  8. 推荐算法炼丹笔记:CTR点击率预估系列入门手册

    ​CTR点击率预估系列家谱 炼丹之前,先放一张CTR预估系列的家谱,让脉络更加清晰. (一)FiBiNET:结合特征重要性和双线性特征交互进行CTR预估 1.1 背景 本文发表在RecSys 2019 ...

  9. 推荐算法炼丹笔记:阿里序列化推荐算法ComiRec

    作者:十方 公众号:炼丹笔记 Controllable Multi-Interest Framework for Recommendation 1.ComiRec与众不同之处 该论文是阿里在2020年 ...

最新文章

  1. 赠书 | 元宇宙:开启未来世界的六大趋势
  2. SAP MRKO Error - For document type RE, an entry is required in field Reference -
  3. python3 文件读写 r 和 rb 区别
  4. nginx+keepalived 高可用
  5. netstat和lsof端口结果不一致
  6. KaleidoscopeGame
  7. 从零开始搭建spring-cloud(4) ----Hystrix
  8. ScrollView 分割屏幕效果
  9. sample等价是什么错误_一个复制粘贴引发的有趣小错误及思考
  10. 在virtualenv中安装NumPy、 SciPy、 scikit-learn、 matplotlib
  11. 如何使用视频转换器将ogg格式转换为MP3格式
  12. 同济大学计算机保研名单,同济大学2021届保研率27.8%,主要保研本校、复交清国...
  13. Hash和Bloom Filter
  14. 一秒钟世界上会发生多少事_再多涂改,人性也总会醒来,也总会主动去追寻那一秒钟...
  15. live2d模型二次开发
  16. 怎么计算机械需要的电机,步进电机力矩的怎么计算?
  17. 常用RGB颜色查询对照表及感情色
  18. FluxWeakening_MTPA_FOC
  19. 网页抽奖程序(年会,开幕式等)
  20. 研究生看论文的看的是什么

热门文章

  1. 熟悉sublime text3
  2. Inherits、CodeFile、CodeBehind
  3. weevely-------linux中的菜刀(转载)
  4. JavaScript版几种常见排序算法
  5. spring核心:bean工厂的装配 1
  6. 上海广电电气集团选用Ultimus 提升企业管理
  7. 第22天学习Java的笔记-继承
  8. 视觉SLAM找工作面试问题集锦(转自网络)
  9. keyshot详细安装教程
  10. 北斗导航 | 学习PPP和PPP-RTK