讲到引擎大家想到的是不是V8、斯特林、马自达转子发动机,今天要讲的是排序引擎,其实两者有很多相似之处。油液引擎主要部件如下:
1.火花塞——点火装置                        2.油液雾化

3.油气混合腔                                      4.压缩装置

5.输出动力曲轴                                  6.刚启动时候打火装置

对应到排序引擎,火花塞就是用户请求过来,带上特征驱动排序服务器的反应装置;油液雾化对应的就是用户ID查询特征和item特征、场景特征混合拼接装置;油液混合腔对应的就是对把数据混合存放的线上即时响应数据库——Hbase、Redis...;点火后推送活塞运动对应的就是燃烧数据模型排序,影响排序结果输出过程,这个包括一般包括两冲程:召回、精排;动力输出对应就是排序结果,用户反馈又会返回再次驱动曲轴的往复运动;发动机刚启动时候需要手动启动过程对应就是冷启动,启动起来开始抽取油液自动运作过程,对应就是推荐系统冷启动后数据可以驱动模型自训练排序过程。

除了以上的核心部件,发动机还有很多辅助的系统,比如油液过滤装置把油液中铁屑过滤以防止渣滓伤害气缸;润滑系统减少机械件之间的相互摩擦;ECU结合油液燃烧特性为了达到输出动力平顺或强动力,调控点火时间、油液混合比。这些控制装置其实在排序引擎也有对应的体现,为了更好拟合序列分布脏数据过滤,防止过拟合正则工具,为了更好的响应不同工况增加各中策略比如疲劳度过滤、模型时间调权、场景调权、事件脱敏...如此看是否觉得汽车引擎的很多技术在更本质里和排序引擎时候相通的,在我们碰到问题没有思路时是否可以借鉴汽车引擎设计结构思考可能解决方案。

好了下面我们来具体介绍排序模型,这部分我们主要介绍推荐系统的发展历史,模型结构的演进历史背后原理是什么。这部分不会过多的讲解模型的数学推导和实现细节,但是会提供实现的简单版本。

协同过滤:itemBase userBase

1.利用用户在item上行为数据,建立共享矩阵

2.通过共线矩阵计算用户或item的相似用户或item

3.相似物品排序,过滤以有行为物品推荐

这个模型很好的利用了人、物共线特征可以比较好的发现统计规律共线行为。问题在于模型的泛化能力弱,模型对人、物、场特征利用率低。那是否有办法提高模型的泛化能力呢。

SVD&隐因子分解:利用人、item共线构建矩阵,把推荐问题看成是矩阵补全问题

1.构建item-人共线矩阵

2.把用户没有数据格子做矩阵补全

3.利用rsme最小来求解补全矩阵方程

从找相似做推荐到矩阵补全思路的演进,这是一个巨大进步。对信息的利用和提取是远大于相似推荐的,相似推荐是一个局部视野而矩阵补全需要考虑全局信息,所以模型的泛化能力比较强。然而仍然只能利用人、物共线数据,人、物共线数据信息量是否已经被萃取到极致了呢。

FFM模型:考虑item的域,不同的域特征和人共线的规律应该是有差别的;如果考虑域的差异在数据量预测效率是否会更好。

隐因子分解的原理其实就是用两个小矩阵来拟合一个大矩阵,直话讲就是希望用更少的因素来表征一个更大的矩阵。那如果我们要考虑item的域,是否可以把小矩阵看成每个元素都是有多个域组成的,前面用一个元素表示的事现在用一个向量表示不就好了;原理上事可以的,只是如何用数学方式表示,这个其实就是张量。用一组向量表示一个元素表达能力更强,但为了在表达能力和泛化力之间权衡,这组向量个数事要认真选择的。

FFM看起来是可以更好的萃取人、物共线数据的信息,但是item、人、场的特征时候一直是被忽略的,是否有种模型可以把这些特征给用起来呢。

基于内容推荐:基于内容的推荐是最直观想到推荐方法,基本思路就是考虑物和人的相似度,找出和人特征最相似的物品推给人;但其实背后涵盖了很牛逼的思路,item、用户特征用向量表示,然后计算item特征和用户特征相似度来做排序依据;那模型就可以很好的利用人、item各种特征,但是此时U2I特征似乎用不上、场景特征似乎也用不上,是否有个模型可以包打天下把各种数据特征都涵盖进来用起来呢。

LR模型:这个模型厉害的地方在于它一点也不厉害,

推荐系统引擎——模型(1)相关推荐

  1. 推荐系统笔记(模型融合)

    思维导图: 推荐系统在技术实现上一般划分三个阶段:挖掘.召回.排序. 模型融合: 挖掘的工作就是对用户和物品做非常深入的结构化分析,对各个角度的特征都被呈现出来,并且建好索引,供召回阶段使用,大部分挖 ...

  2. 【推荐实践】推荐系统中模型训练及使用流程的标准化

    文章作者:梁超 腾讯 高级工程师 编辑整理:Hoh Xil 内容来源:DataFun AI Talk 导读:本次分享的主题为推荐系统中模型训练及使用流程的标准化.在整个推荐系统中,点击率 ( CTR ...

  3. 快过HugeCTR:用OneFlow轻松实现大型推荐系统引擎

    Wide & Deep Learning Wide & Deep Learning (以下简称 WDL)是解决点击率预估(CTR Prediction)问题比较重要的模型.WDL 在训 ...

  4. 推荐系统XDeepFM模型--DeepFM和DCN升级版

    xDeepFM模型 目标: 引言: xDeepFM模型介绍: Compressed Interaction Network(CIN) xDeepFM 复杂度分析 Experiment 产出: Conc ...

  5. 机器学习从入门到精通150讲(一)-推荐系统经典模型Wide Deep(附部分代码)

    前言 在大规模特征的场景当中,我们通常(2016年之前)是使用将非线性特征应用在线性模型上的做法来实现的,使用这种方式,我们的输入会是一个非常稀疏的向量.虽然我们要实现这样的非线性特征,通过一些特征转 ...

  6. 推荐系统经典模型 Wide Deep 论文剖析

    作者 |  梁唐 来源 | TechFlow(id:TechFlow) 今天我们剖析的也是推荐领域的经典论文,叫做Wide & Deep Learning for Recommender Sy ...

  7. Taste/Thoth:开源的推荐系统引擎

    Taste 是非常棒的一个推荐系统核心引擎,sf 上可以下载到 Taste 的最新版本.Taste 同时也是 2007 Google Summer of Code 里的一个项目. 当初学习推荐系统开发 ...

  8. 推荐系统——召回模型

    YoutubeDNN 内容 YoutubeDNN是Youtube用于做视频推荐的落地模型,可谓推荐系统中的经典,其大体思路为召回阶段使用多个简单模型筛除大量相关度较低的样本,排序阶段使用较为复杂的模型 ...

  9. 推荐系统 - FM模型原理和实践

    本文收录在推荐系统专栏,专栏系统化的整理推荐系统相关的算法和框架,并记录了相关实践经验,所有代码都已整理至推荐算法实战集合(hub-recsys). 目录 一. FM概述 二. FM原理 2.1 模型 ...

最新文章

  1. goip技术原理图解_12式木人桩模块化技术定型训练 1小念头
  2. 【杂谈】三人行必有AI,你会在其一吗?
  3. Http的持久连接和管线化
  4. 面向对象基础-委托与事件
  5. 读书,上学,上名校!!!!!
  6. linux文件目录与管理
  7. 【LeetCode】【HOT】287. 寻找重复数(抽象环形链表)
  8. Redis中的数据结构与常用命令
  9. LYNC2013部署系列PART7:TMG部署
  10. python编写tftp服务器
  11. 运行不同版本libc
  12. 解决WIN10家庭版无法远程桌面连接的问题
  13. PHP存储微信昵称特殊符号过滤方法
  14. 懵逼树懵逼果 树下的你和猫警长
  15. PS——规定尺寸的证件照的制作
  16. 什么是PBR?pbr入门基础干货
  17. 在Oracle中,什么是物理读和逻辑读?
  18. 【牛客网笔试】:Python实现:将i am a student转换成 student. a am i
  19. 如何进入PE系统(请点击)
  20. poj 3084 最小割

热门文章

  1. java 递归习题训练,Java蓝桥杯——递归练习题:走台阶(偶数版)
  2. 交换安全----局域网安全简介
  3. 微信 {errcode:48001,errmsg:api unauthorized, hints: [ req_id: 1QoCla0699ns81 ]}
  4. 探访上汽通用武汉奥特能超级工厂
  5. 神经网络预测结果都一样,神经网络预测结果分析
  6. JavaSE02-JVM、JRE、JDK
  7. ubuntu多屏幕 / 高分屏的分辨率配置
  8. 对接华为存储iSCSI
  9. Web安全之文件上传漏洞
  10. html三角形坐标图怎么看,地理三角坐标图的简易判读方法