《Learning Tree-based Deep Model for Recommender Systems》

问题


每个商品的 向量表示/embedding 随机初始化。

每个用户的历史信息的 向量表示/embedding 随机初始化。

我们输入深度模型这两个embedding,输出他们关联程度的得分。

也就是如果我们要得到 一个用户对所有商品 的每个得分,然后排序,取出得分最高几个。要遍历所有的商品算一遍,可能数百万个。

思路


将所有商品放到一颗树结构里。

树结构的举例:比如父节点是手机,则子节点就是苹果,华为,小米等。

检索阶段,从树根开始打分,以完全二叉树为例,如果取top1的商品的话,先计算根节点的左右节点,左边得分大则走左边,然后计算这个左子节点的两个子节点。

树的构建

以原始的商品关系为初始化。

有了每个商品的embedding之后,以完全二叉树为例,用kmeans聚类算法,将商品(embedding)先分成两堆,然后再把这两堆分成四堆。

深度模型训练

输入一个用户信息的embedding和一个 节点/商品 的embedding,输出是0或1对应负例和正例,对树的每个节点训练。

0代表该用户对这个 商品/节点 不感兴趣,1代表该用户对这个 商品/节点 感兴趣。也就是,0代表用户的历史信息和该商品关联程度低,1代表用户的历史信息和该商品关联程度高。

训练一个epoch感觉应该是个双重循环,即遍历一遍用户,每个用户遍历一遍树上的所有 节点/商品和虚拟非叶子节点

细节

leaf node即真实商品,非lead node是虚拟节点。

只用leaf node做kmeans成树,非lead node全部抛弃。

非leaf node在成树之后和lead node一起deep model训练,非leaf node的deep model训练纯为了检索用。(beam search,从上部往下检索,还是需要用中间节点的emb来计算当前层的topk的)

因为deep model训练非leaf node的时候会影响leaf node的embedding,所以需要迭代多次直至树结构不变。

TDM阅读笔记,在推荐系统的应用相关推荐

  1. 推荐算法炼丹笔记:推荐系统采样评估指标及线上线下一致性问题

    本文对于推荐系统中的采样评估指标进行了讨论,内容略多, 还有一些数学推导, 有兴趣的可以去阅读文末给出的原始论文链接, 此处直接列出核心观点: 在评估推荐算法的效果时,能不采样就不采样! 除了AUC, ...

  2. POI推荐文献阅读笔记3:Predicting Human Mobility via Graph Convolutional Dual-attentive Networks

    POI推荐文献阅读笔记3: Predicting Human Mobility via Graph Convolutional Dual-attentive Networks 1.摘要 2.贡献 3. ...

  3. Self-Attentive Sequential Recommendation论文阅读笔记

    SASRec论文阅读笔记 论文标题:Self-Attentive Sequential Recommendation 发表于:2018 ICDM 作者:Wang-Cheng Kang, Julian ...

  4. 计算机网络阅读笔记——第二章物理层

    文章目录 思维导图 阅读笔记 1.物理层的基本概念 2.数据通信的基础知识 3.物理层下面的传输媒体 4.信道复用技术 5.数字传输系统 6.宽带接入技术 习题解答 1.常见问题与解答 2.习题与解答 ...

  5. 基于深度学习的性格探测综述 阅读笔记

    Recent trends in deep learning based personality detection 目录 Recent trends in deep learning based p ...

  6. Personalized Bundle Recommendation in Online Games 阅读笔记

    Personalized Bundle Recommendation in Online Games 阅读笔记 CIKM 2020 Qilin Deng, Kai Wang, Minghao Zhao ...

  7. 【知识图谱】 | 《知识图谱——方法、实践与应用》阅读笔记

    <知识图谱--方法.实践与应用>的阅读笔记 知识图谱--方法.实践与应用 第1章 知识图谱概述 1.1 什么是知识图谱 1.2 知识图谱的发展历史 1.3 知识图谱的价值 1.4 国内外典 ...

  8. trainer setup_Detectron2源码阅读笔记-(一)Configamp;Trainer

    一.代码结构概览 1.核心部分 configs:储存各种网络的yaml配置文件 datasets:存放数据集的地方 detectron2:运行代码的核心组件 tools:提供了运行代码的入口以及一切可 ...

  9. VoxelNet阅读笔记

    作者:Tom Hardy Date:2020-02-11 来源:VoxelNet阅读笔记

最新文章

  1. java语言程序设计考点_计算机二级考试Java语言程序设计考点:关键字
  2. SOA改变的企业软件生态
  3. python下载安装教程图解-一招解决:各种版本的Python下载安装教程
  4. Python基础教程:使用dict和set
  5. 菜鸟,下一代分布式体系架构的设计理念
  6. 《学习Opencv》第五章 习题6
  7. windows2003添加普通用户的远程桌面权限
  8. 平面设计师必读的十本书
  9. linux文件符数据,linux – 如何监视文件描述符以获得新数据的可用性?
  10. linux perl占用大量资源_Monitorix:一款面向Linux/Unix系统的网络监测工具
  11. 明解C语言第七章习题
  12. 通用商业计划书PPT模板
  13. 搜狗拼音、QQ拼音输入法、2345拼音输入法、百度输入法 、手心输入法对比。(个人体会)...
  14. 《东周列国志》第二十回 晋献公违卜立骊姬 楚成王平乱相子文
  15. 数据分析篇 Microsoft Excel 2016阻止激活silverlight控件-03
  16. 计算机室内设计cad实践报告,cad室内设计实习报告
  17. Element-UI中打开本地文件
  18. Java如何从键盘中进行输入
  19. 让人头秃的理论:什么是“奥卡姆剃刀”原理?
  20. 1. 考研常见问题总结 从择校到复试

热门文章

  1. Linux中阶—加密库OpenSSL(四)
  2. Nginx开启GZIP压缩,提升前端访问速度
  3. Swing批量重命名并导出excel
  4. java从入门到放弃段子_投稿014期 | 毕业设计从入门到放弃
  5. 这样的钓鱼邮件,你会中招吗?
  6. 教程:客制化您的输入法
  7. ∘(空心的点乘)的数学含义
  8. 带正电荷的脂质体-阳离子脂质体表面修饰
  9. Overleaf如何使用中文(亲测有效)
  10. 宏碁(Acer)蜂鸟Fun 2020新款 14英寸轻薄商务笔记本使用真实评测