传统推荐模型的发展主要经历了四个阶段:

  1. 协同过滤CF算法阶段:只需用户物品共现矩阵就可以构建推荐系统,根据相似度取值对象可分为itemCF和userCF两类,优势是简单易实现。CF的问题是泛化能力弱,无法应对稀疏矩阵,而矩阵分解作为协同过滤的进化版,克服了CF的缺点。
  2. 逻辑回归LR阶段:综合利用用户、物品、上下文等多种不同的特征,假设用户是否点击广告服从伯努利分布,将推荐问题转化为点击率预估(CTR)问题,预测正样本概率对物品进行排序。其数学形式是各个特征的加权和经过sigmoid函数,得到用户点击物品的概率。LR的优势是可解释性强、易于并行化、模型简单、训练开销小。其局限性在于表达能力不强,需要大量具有业务背景知识的人工特征筛选与交叉。
  3. 因子分解机FM阶段:为每个特征学习一个隐向量,在特征交叉时,使用两个特征隐向量的内积作为交叉特征的权重。虽然FM相比POLY2的完全交叉+单一权重记忆能力略弱,但解决了特征交叉过程中交叉特征对应的数据过于稀疏无法充分学习权重的问题。FFM引入特征域进一步增强了模型的表达能力,做特征交叉时,每个特征选择与对方域对应的隐向量的内积作为交叉特征的权重,但FFM的计算复杂度也由kn上升到kn*n。
  4. 组合模型阶段:这一阶段主要是为了进一步提高特征交叉的维度,同时融合多个模型的优点。GBDT+LR是组合模型的代表方案,GBDT自动进行特征筛选和组合得到新的离散特征向量输入LR模型。GBDT+LR的组合方式开启了特征工程模型化的趋势,真正实现端到端训练。

这一章的最后作者单独介绍了阿里巴巴曾经的主流推荐模型:大规模分段线性模型(LS-PLM),又称为MLR(Mixed Logistic Regression,混合逻辑回归)。该模型从淘宝的业务特性出发,对不同用户群体、不同使用场景下的样本单独进行CTR预估。具体方法是先对全量样本聚类,再对每个分类里的样本使用LR进行CTR预估。

LS-PLM模型大规模分段线性模型的一大优势是端到端的非线性学习能力,样本聚类的方式能够让模型学习出数据中蕴藏的非线性模式,这里个人理解是LS-PLM模型的非线性学习能力强度还依赖于根据自身业务特性调节的超参“分片数”。LS-PLM因建模时引入了L1 和L2 范数,其中L1 范数使得模型具有较高的稀疏度,这样一来,模型服务过程仅需使用非零权重,在线推断的效率很高。

作者认为LS-PLM在推荐系统模型发展的历史中起到了承上启下的作用。LS-PLM可以看做一个加入了注意力机制的三层神经网络模型,其中输入层是样本的特征向量,中间层是m个神经元组成的隐层,其中m是分片的个数,最后一层是单一神经元组成的输出层。其中注意力机制应用在隐层和输出层之间,神经元之间的权重是由分片函数输出的概率值即注意力得分确定的。

推荐系统回顾,FFM引入特征域进一步增强了模型的表达能力。大规模分段线性模型LS-PLM相关推荐

  1. RS笔记:传统推荐模型之FFM (引入特征域的概念) [2015 Criteo]

    FFM: Field-aware Factorization Machines 一.背景知识 1.1 什么是特征域 二.FFM模型 2.1 FFM模型数学公式和原理 2.2 FFM场景举例(Publi ...

  2. 2.2w字长文详解推荐系统之数据与特征工程,码起来慢慢看

    作者丨gongyouliu 编辑丨lily 来源 | 大数据与人工智能(ID:ai-big-data) [导读]推荐系统是机器学习的一个子领域,并且是一个偏工程化.在工业界有极大商业价值的方向.大量应 ...

  3. 「构建企业级推荐系统系列」推荐系统之数据与特征工程

    作者 | gongyouliu 编辑 | auroral-L 推荐系统是机器学习的一个子领域,并且是一个偏工程化.在工业界有极大商业价值的方向.大量应用于提供toC类产品的互联网企业服务中,通过推荐系 ...

  4. 推荐系统之数据与特征工程

    点击上方"大数据与人工智能","星标或置顶公众号" 第一时间获取好内容 作者丨gongyouliu 编辑丨lily 这是作者的第25篇文章,约2.2w字,阅读需 ...

  5. 【转】【重要】推荐系统之数据与特征工程

    原文链接: 推荐系统之数据与特征工程 原文作者丨gongyouliu  来自 大数据与人工智能 推荐系统是机器学习的一个子领域,并且是一个偏工程化.在工业界有极大商业价值的方向.大量应用于提供toC类 ...

  6. 推荐系统:数据与特征工程

    推荐系统是机器学习的一个子领域,并且是一个偏工程化.在工业界有极大商业价值的子方向. 目前绝大多数提供 toC 类产品或者服务的互联网企业,会通过推荐系统为用户提供精准的个性化服务. 推荐系统通过推荐 ...

  7. 短时主频点特征对声音表达能力探究1

    摘要 本次实验我选取了玻璃破碎声.汽车鸣笛声和汽车引擎声三类声音,分别选取时域特征:短时能量.短时过零率,频域特征:短时主频点和mfcc特征,来对每类声音进行分析,并分析其表达能力 实验数据说明 实验 ...

  8. 【推荐系统】深入理解推荐系统:无需人工特征工程的xDeepFM

    [推荐系统]专栏历史部分文章: 深入理解推荐系统:召回 深入理解推荐系统:排序 深入理解推荐系统:Fairness.Bias和Debias 深入理解推荐系统:推荐系统中的attention机制 深入理 ...

  9. 推荐系统中多值特征的八大处理技巧

    在诸多数据处理的问题中,存在着一类特殊的特征--多值特征,该类特征常见的情形有: 论文的关键字描述信息: 商品信息的描述: 网站关键词: 其它情况: 那么关于这些多值特征,该如何处理,都有哪些常见操作 ...

  10. Canvas引入跨域的图片导致toDataURL()报错的问题的解决

    本文介绍了Canvas引入跨域的图片导致toDataURL()报错的问题的解决,分享给大家,具体如下: [场景] 用户打开网页,则请求腾讯COS(图片服务器)上的图片js代码.使用canvas绘图. ...

最新文章

  1. HTML5编写船上航行,单体半滑行穿浪船船型与静水航行性能
  2. Angular和.NET Core Web API入门应用程序
  3. MVC3 Razor语法速查
  4. python数字和运算符空格_Python基础——运算符与数据结构(200315)
  5. C++进阶教程之动态内存
  6. HBase到MR再到HBase
  7. 初识视觉SLAM:用相机解决定位和建图问题
  8. 目录_视觉SLAM十四讲_0
  9. 花呗问答匹配(part3 各种模型运行)
  10. 小白学习meshlab(1)——基本的edit工具学习
  11. android orientation 代码,android常见错误之Wrong orientation? No orientation specified
  12. 在线旅游网站盈利模式
  13. 安装无人值守称重系统费用
  14. git版本回退命令_刘先生
  15. 线段树 HDU 4046 panda
  16. sql server远程连接时提示超时的解决办法
  17. 多模态分析数据集(Multimodal Dataset)整理
  18. 充电枪cp信号控制板_一种电动汽车交流充电系统的CP信号电压检测方法及装置与流程...
  19. java中Keytool生成证书
  20. 乐高大颗粒作品20:翼龙

热门文章

  1. JS中的slice和splice
  2. keepalived高可用LVS与Nginx
  3. SSH KEY免密码验证
  4. 基于数据库复制的技术架构讨论
  5. 命令行构建Unity项目
  6. 2.3Word2003段落设置1
  7. 正视苦难,民族的心灵史——1942
  8. linux下编译yacc命令,Lex/Yacc的学习——《编译原理及实践》附录B tiny编译器源码在linux下编译实现...
  9. 基于c语言的成绩管理系统,基于C语言实现学生成绩管理系统.docx
  10. 一个素数,如果将其反转后仍然是一个素数,我们称这样的素数为反转素数。 例如13是一个素数,反转之后得到的31也是一个素数,那么13和31都是反转素数。