TDM阅读笔记,在推荐系统的应用
《Learning Tree-based Deep Model for Recommender Systems》
问题
每个商品的 向量表示/embedding 随机初始化。
每个用户的历史信息的 向量表示/embedding 随机初始化。
我们输入深度模型这两个embedding,输出他们关联程度的得分。
也就是如果我们要得到 一个用户对所有商品 的每个得分,然后排序,取出得分最高几个。要遍历所有的商品算一遍,可能数百万个。
思路
将所有商品放到一颗树结构里。
树结构的举例:比如父节点是手机,则子节点就是苹果,华为,小米等。
检索阶段,从树根开始打分,以完全二叉树为例,如果取top1的商品的话,先计算根节点的左右节点,左边得分大则走左边,然后计算这个左子节点的两个子节点。
树的构建
以原始的商品关系为初始化。
有了每个商品的embedding之后,以完全二叉树为例,用kmeans聚类算法,将商品(embedding)先分成两堆,然后再把这两堆分成四堆。
深度模型训练
输入一个用户信息的embedding和一个 节点/商品 的embedding,输出是0或1对应负例和正例,对树的每个节点训练。
0代表该用户对这个 商品/节点 不感兴趣,1代表该用户对这个 商品/节点 感兴趣。也就是,0代表用户的历史信息和该商品关联程度低,1代表用户的历史信息和该商品关联程度高。
训练一个epoch感觉应该是个双重循环,即遍历一遍用户,每个用户遍历一遍树上的所有 节点/商品和虚拟非叶子节点
细节
leaf node即真实商品,非lead node是虚拟节点。
只用leaf node做kmeans成树,非lead node全部抛弃。
非leaf node在成树之后和lead node一起deep model训练,非leaf node的deep model训练纯为了检索用。(beam search,从上部往下检索,还是需要用中间节点的emb来计算当前层的topk的)
因为deep model训练非leaf node的时候会影响leaf node的embedding,所以需要迭代多次直至树结构不变。
TDM阅读笔记,在推荐系统的应用相关推荐
- 推荐算法炼丹笔记:推荐系统采样评估指标及线上线下一致性问题
本文对于推荐系统中的采样评估指标进行了讨论,内容略多, 还有一些数学推导, 有兴趣的可以去阅读文末给出的原始论文链接, 此处直接列出核心观点: 在评估推荐算法的效果时,能不采样就不采样! 除了AUC, ...
- POI推荐文献阅读笔记3:Predicting Human Mobility via Graph Convolutional Dual-attentive Networks
POI推荐文献阅读笔记3: Predicting Human Mobility via Graph Convolutional Dual-attentive Networks 1.摘要 2.贡献 3. ...
- Self-Attentive Sequential Recommendation论文阅读笔记
SASRec论文阅读笔记 论文标题:Self-Attentive Sequential Recommendation 发表于:2018 ICDM 作者:Wang-Cheng Kang, Julian ...
- 计算机网络阅读笔记——第二章物理层
文章目录 思维导图 阅读笔记 1.物理层的基本概念 2.数据通信的基础知识 3.物理层下面的传输媒体 4.信道复用技术 5.数字传输系统 6.宽带接入技术 习题解答 1.常见问题与解答 2.习题与解答 ...
- 基于深度学习的性格探测综述 阅读笔记
Recent trends in deep learning based personality detection 目录 Recent trends in deep learning based p ...
- Personalized Bundle Recommendation in Online Games 阅读笔记
Personalized Bundle Recommendation in Online Games 阅读笔记 CIKM 2020 Qilin Deng, Kai Wang, Minghao Zhao ...
- 【知识图谱】 | 《知识图谱——方法、实践与应用》阅读笔记
<知识图谱--方法.实践与应用>的阅读笔记 知识图谱--方法.实践与应用 第1章 知识图谱概述 1.1 什么是知识图谱 1.2 知识图谱的发展历史 1.3 知识图谱的价值 1.4 国内外典 ...
- trainer setup_Detectron2源码阅读笔记-(一)Configamp;Trainer
一.代码结构概览 1.核心部分 configs:储存各种网络的yaml配置文件 datasets:存放数据集的地方 detectron2:运行代码的核心组件 tools:提供了运行代码的入口以及一切可 ...
- VoxelNet阅读笔记
作者:Tom Hardy Date:2020-02-11 来源:VoxelNet阅读笔记
最新文章
- java语言程序设计考点_计算机二级考试Java语言程序设计考点:关键字
- SOA改变的企业软件生态
- python下载安装教程图解-一招解决:各种版本的Python下载安装教程
- Python基础教程:使用dict和set
- 菜鸟,下一代分布式体系架构的设计理念
- 《学习Opencv》第五章 习题6
- windows2003添加普通用户的远程桌面权限
- 平面设计师必读的十本书
- linux文件符数据,linux – 如何监视文件描述符以获得新数据的可用性?
- linux perl占用大量资源_Monitorix:一款面向Linux/Unix系统的网络监测工具
- 明解C语言第七章习题
- 通用商业计划书PPT模板
- 搜狗拼音、QQ拼音输入法、2345拼音输入法、百度输入法 、手心输入法对比。(个人体会)...
- 《东周列国志》第二十回 晋献公违卜立骊姬 楚成王平乱相子文
- 数据分析篇 Microsoft Excel 2016阻止激活silverlight控件-03
- 计算机室内设计cad实践报告,cad室内设计实习报告
- Element-UI中打开本地文件
- Java如何从键盘中进行输入
- 让人头秃的理论:什么是“奥卡姆剃刀”原理?
- 1. 考研常见问题总结 从择校到复试