推荐系统炼丹笔记:阿里DMIN多重兴趣网络
作 者:一元
公众号:炼丹笔记
背景
许多现有的建模开始基于用户的历史行为序列进行建模并且取得了相当不错的效果,为了捕获用户动态和变化的兴趣, 我们观测到用户经常在某个时间点拥有大量的兴趣, 与此同时, 潜在的主导兴趣是通过行为表现出来的。潜在主导兴趣的切换会导致最终的行为变化。因此,建模和跟踪潜在的多重兴趣将是有益的。本篇文章,我们提出了一种新的方法DMIN(Deep Multi-Interest Network),通过建模用户潜在的对于CTR任务的多兴趣,来提升模型的效果。
模型
本文的核心框架如下:
和其它文章不一样的地方在于,DMIN有两大核心的组成成份, Behavior Refiner Layer以及Multi-Interest Extractor Layer。
Embedding Layer
此处共存在四组特征:用户的Profile信息,用户的历史行为,上下文信息以及目标商品信息。
- 用户Profile信息:例如用户的id, 国家等信息;
- 目标商品(Target Item):带有特定特征的候选商品,例如item id,类别id,统计的ctr等信息;
- 用户历史行为: 用户历史点击/加购/购买的商品;
- 上下文信息: 包括时间,匹配类型,trigger id等;
Behavior Refiner Layer
我们对用户的行为序列使用multi-head self-attention来微调商品的表示。
1. 辅助Loss
在获得提炼的商品表示之后,我们需要从提炼的商品表示中抽取大量的兴趣。我们使用另外一个multi-head self-attention来获取这些兴趣。
最后我们使用attention单元来捕捉每个输出的head和目标商品的相关性,此外,我们加入位置的embedding来引入位置信息,因为,第h个用户的兴趣可以被表示为:
最终的Loss
实验
- Wide & Deep和手工设计的特征表现不佳。
- PNN是一个自动学习特征间交互的表,它比Wide & Deep要好。
- DIN表示用户对目标项的兴趣,结果优于Wide&Deep和PNN。
- DIEN使用一个特别设计的GRU结构来捕捉用户兴趣的变化,这有助于获得比DIN更好的兴趣表示。
- DMIN在三个数据集中的AUC得分最高,显示了对用户潜在的多重兴趣进行建模和跟踪的有效性。
- 辅助损失函数和位置嵌入的使用带来了非常大的增益
小结
针对CTR预测任务,本文提出了一种新的用户潜在多重兴趣网络(DMIN)建模方法。具体地说,我们设计了一个行为提炼(Refined)层,使用多头自我注意来捕捉更好的用户历史商品表示。然后应用多兴趣提取层提取多用户兴趣。实验结果也验证该方案的优势。
参考文献
- Deep Multi-Interest Network for Click-through Rate Prediction:https://dl.acm.org/doi/pdf/10.1145/3340531.3412092
推荐系统炼丹笔记:阿里DMIN多重兴趣网络相关推荐
- [论文阅读]阿里DIN深度兴趣网络之总体解读
[论文阅读]阿里DIN深度兴趣网络之总体解读 文章目录 [论文阅读]阿里DIN深度兴趣网络之总体解读 0x00 摘要 0x01 论文概要 1.1 概括 1.2 文章信息 1.3 核心观点 1.4 名词 ...
- 推荐系统炼丹笔记:EdgeRec阿里边缘计算推荐系统
作者:一元 公众号:炼丹笔记 背景 推荐系统(RS)已经成为大多数web应用程序的关键模块.最近,大多数RSs都是基于云到边缘框架的瀑布式的,其中推荐的结果通过在云服务器中预先计算传送到edge(例如 ...
- 推荐系统炼丹笔记:阿里边缘计算+奉送20个推荐系统强特
作者:一元 公众号:炼丹笔记 背景 推荐系统(RS)已经成为大多数web应用程序的关键模块.最近,大多数RSs都是基于云到边缘框架的瀑布式的,其中推荐的结果通过在云服务器中预先计算传送到edge(例如 ...
- 推荐系统炼丹笔记:阿里推荐算法特征交叉新方式CAN
作 者:一元 公众号:炼丹笔记 昨天看非常多的群友在讨论该篇文章,很是好奇,今天就读了一下,个人感觉本文的co-action操作还是第一次碰到,但该方案在amazu等数据集上对比的方案还是较为弱的,所 ...
- 推荐系统炼丹笔记:边缘计算+奉送20个推荐系统强特
作者:一元 公众号:炼丹笔记 背景 推荐系统(RS)已经成为大多数web应用程序的关键模块.最近,大多数RSs都是基于云到边缘框架的瀑布式的,其中推荐的结果通过在云服务器中预先计算传送到edge(例如 ...
- 推荐系统炼丹笔记:推荐系统Bias/Debias大全
作者:一元 公众号:炼丹笔记 背景 在实践中,做推荐系统的很多朋友思考的问题是如何对数据进行挖掘,大多数论文致力于开发机器学习模型来更好地拟合用户行为数据.然而,用户行为数据是观察性的,而不是实验性的 ...
- 推荐系统炼丹笔记:多模态推荐之用户评论篇
作者:一元 公众号:炼丹笔记 目前非常多的推荐系统主要使用用户的一些基础反馈信息来作为最终的标签进行模型的训练,例如点击/购买等,但是却鲜有文章去进一步挖掘用户的其它反馈,例如用户对于该产品的评论,很 ...
- 推荐系统炼丹笔记:用户评论在推荐中的应用
作者:一元 公众号:炼丹笔记 目前非常多的推荐系统主要使用用户的一些基础反馈信息来作为最终的标签进行模型的训练,例如点击/购买等,但是却鲜有文章去进一步挖掘用户的其它反馈,例如用户对于该产品的评论,很 ...
- 推荐系统炼丹笔记:Embedding在内存问题上的一种解法
作 者:一元 公众号:炼丹笔记 很多朋友都会发现,修改embedding的大小能对深度模型带来非常大的影响,往往越大的embedding能带来更佳的效果,但是却因为Embedding内存的问题,没法直 ...
最新文章
- 排队接水pascal程序
- JAVA培训—线程同步--卖票问题
- web前端知识(04html的表单)
- 中国联通4G携号转网业务支撑的架构实践
- tslib-1.4.tar.gz安装和配置
- 《.NET应用架构设计:原则、模式与实践》新书博客-2.1.1-设计原则简述
- Apache配置问题
- 生产环境 xfs filesystem 上安装Mariadb
- Android开发者如何删除手机自带应用
- c语言倒序输出英文字母表音标,28个英文字母表
- 计算机信函 教案模板,一年级信息技术课教案模板三篇
- github fork PR 的简单使用
- leetcode刷题技巧
- 编写一个程序,计算学生的总分和平均成绩(一)
- 【多校训练】2021牛客多校第一场
- 深度学习 lr_scheduler 简易的warmup装饰器
- AAA企业信用等级证书
- ArcGIS创建矢量
- 遗传算法(GA)附Matlab代码(copy能用)寻优算法
- 将链表中的所有元素为奇数的节点移到元素为偶数节点的前面,并使奇数之间顺序反转,偶数之间顺序反转(创新工厂涂鸦移动面试题)