作者:livan

来源:数据python与算法

前言

上一篇我们讲解了FM模型:

推荐系统与深度学习(一)——FM模型原理

从FM的公式我们可以看出:

FM中每个特征所对应的向量是唯一的:

Vi是Xi的向量化表达,多个特征相乘的时候,只需要将Vi相乘,这一模型的优势在于考虑高维特征组合的情况下最小化运算量,但是问题也是有的:

这一模型没有考虑各个特征之间的关系,而不同特征之间的关系恰巧是不一样的。

例如:

Publisher与Advertisor可能是正相关/强相关,Publisher与Gender可能是负相关/弱相关;ESPN体育类型的网站上发布Nike商品点击量会很高,放其他商品就未必了。

FFM——场域

这样的思考引发大家对特征关系向量的研究,引出了“场域”的概念,每个特征都有一个场域f(场域f有k个维度),这个场域f代表两个特征之间的关系:

原则上每个特征与其他n-1个特征存在相互关系,即n-1个场域f,每个场域f是一个Vij向量:

从上图逻辑看,每个特征所对应的数据从FM中的一个k维向量变成了一个n-1*k维的矩阵,两个特征运算的时候,只需要从矩阵中找到与之对应的向量相乘就可以了,如下面FFM模型:

不同的特征组合会有不同的场域向量进行计算。

损失函数的计算,FM与FFM模型就一致了。

FM与FFM进行比较

两两特征组合的算法方面,FFM和FM则是完全相同的,区别就是每个特征对应的特征embedding个数不同;FM每个特征只有一个共享的embedding向量,而对于FFM的一个特征,则有(N-1)个特征embedding向量,用于和不同的特征域特征组合时使用。

FFM运算量非常大,需要计算的参数有nfk个,复杂度为O(k*n2);而FM中需要计算的参数有nk个,复杂度为O(k*n),在模型训练过程中n的数量非常大,所以,扩大f倍的情况下运算量指数型增加,而且容易过拟合,为减少运算量可以适当减少k的大小。

FM与FFM都可以用在推荐系统中,主要应用场景可以在召回排序方面,有兴趣可以查验知乎上的文章:https://zhuanlan.zhihu.com/p/59528983

FM/FFM主要应用场景为CTR预估,在计算广告领域非常有效,是对LR模型的升级。

◆ ◆ ◆  ◆ ◆

麟哥新书已经在京东上架了,我写了本书:《拿下Offer-数据分析师求职面试指南》,目前京东正在举行100-50活动,大家可以用相当于原价5折的预购价格购买,还是非常划算的:

点击下方小程序即可进入购买页面:


数据森麟公众号的交流群已经建立,许多小伙伴已经加入其中,感谢大家的支持。大家可以在群里交流关于数据分析&数据挖掘的相关内容,还没有加入的小伙伴可以扫描下方管理员二维码,进群前一定要关注公众号奥,关注后让管理员帮忙拉进群,期待大家的加入。

管理员二维码:

猜你喜欢

● 麟哥拼了!!!亲自出镜推荐自己新书《数据分析师求职面试指南》

● 厉害了!麟哥新书登顶京东销量排行榜!

● 笑死人不偿命的知乎沙雕问题排行榜

● 用Python扒出B站那些“惊为天人”的阿婆主!

● 你相信逛B站也能学编程吗

点击阅读原文即可参与京东100-50购书活动

推荐系统与深度学习(二)——FFM模型原理​相关推荐

  1. python 主语_前深度学习时代--FFM模型的原理与Python实现

    基于上一篇分析中协同过滤.逻辑回归及FM的比较,可以得出这样一个结论: 主流模型迭代的关键在于增强模型表达能力,而增强方式的主要脉络为: 引入其它可用特征信息(CF->LR). 将现有特征进行组 ...

  2. 推荐系统遇上深度学习(二)--FFM模型理论和实践

    全文共1979字,6张图,预计阅读时间12分钟. FFM理论 在CTR预估中,经常会遇到one-hot类型的变量,one-hot类型变量会导致严重的数据特征稀疏的情况,为了解决这一问题,在上一讲中,我 ...

  3. 知识图谱论文阅读(八)【转】推荐系统遇上深度学习(二十六)--知识图谱与推荐系统结合之DKN模型原理及实现

    学习的博客: 推荐系统遇上深度学习(二十六)–知识图谱与推荐系统结合之DKN模型原理及实现 知识图谱特征学习的模型分类汇总 知识图谱嵌入(KGE):方法和应用的综述 论文: Knowledge Gra ...

  4. Facebook 面向个性化推荐系统的深度学习推荐模型

    作者:王鸣辉 整理:Hoh Xil 来源:http://wd1900.github.io/#blog https://www.zhihu.com/people/wang-ming-hui-38/pos ...

  5. 推荐系统深度学习篇-NFM 模型介绍(1)

    一.推荐系统深度学习篇-NFM 模型介绍(1) NFM是2017年由新加披国立大学提出的一种模型,其主要优化点在于提出了Bi-Interaction,Bi-Interaction考虑到了二阶特征组合, ...

  6. 从FM推演各深度学习CTR预估模型

    本文的PDF版本.代码实现和数据可以在我的github取到. 1.引言 点击率(click-through rate, CTR)是互联网公司进行流量分配的核心依据之一.比如互联网广告平台,为了精细化权 ...

  7. 好书荐读:阿里达摩院算法专家领衔《深度学习与图像识别:原理与实践》

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 编辑:Sophia计算机视觉联盟  报道  | 公众号 CVLianMeng 这本书现在当当新书榜排名前三 既然为大 ...

  8. 当推荐系统邂逅深度学习

    前言 这是一篇关于讲述推荐系统邂逅深度学习故事的文章. 推荐系统之于用户的角色,有时更像是无微不至的男朋友,你口渴时递给你符合口味的饮料,你饥饿时还你以常吃的披萨,你无聊时帮你推荐有趣的音乐亦或带你欣 ...

  9. 深度学习CTR预估模型凭什么成为互联网增长的关键?

    本文是王喆在InfoQ开设的原创技术专栏"深度学习CTR预估模型实践"的第一篇文章(以下"深度学习CTR预估模型实践"简称"深度CTR模型" ...

最新文章

  1. R pdf大小_怎样给PDF添加批注并同步到手机里?
  2. ES5-2 语法、规范、错误、运算符、判断分支、注释
  3. 【Win10 应用开发】实现数据的增量加载
  4. 大数据之-Hadoop3.x_MapReduce_MapJoin案例需求分析---大数据之hadoop3.x工作笔记0133
  5. Professional C# 6 and .NET Core 1.0 - Chapter 43 WebHooks and SignalR
  6. 吴恩达神经网络和深度学习-学习笔记-13-Aadm优化算法(Momentum + RMSprop)
  7. 规则引擎--规则引擎构成重点
  8. 管理Kubernetes集群时需要关注的关键指标
  9. PowerBuilder9.0连接ORACLE数据库
  10. Android手游辅助开发从入门到精通
  11. react中使用less
  12. 区块链是大数据生态圈技术之一_ODC构建普惠金融生态圈|区块链+大数据
  13. 量化分析(一)数据采集、预处理SVM建模
  14. 在framework下新建系统api
  15. [HDU]1205 吃糖果 [抽屉原理]
  16. EOS DApp 已成黑客提款机
  17. 智慧公厕系统为管理方提供更丰富的管理手段
  18. ISCSLP 2022 | NPU-ASLP实验室8篇论文被录用
  19. VUE + Element-UI 表单校验input框数据已存在
  20. c语言实验植物与颜色,植物的光合作用曲线比较.doc

热门文章

  1. Cisco Packet Tracer交换机间相同VLAN通信
  2. 第一台鸿蒙手机是,华为够谨慎的,第1台预装鸿蒙系统的,是一台4G手机?
  3. Spring Boot 1.5.10项目引入knife4j接口文档
  4. 电路基础(3)电阻电路等效变换的经典例题
  5. 2022年中国新式茶饮行业发展现状及未来发展趋势分析:新式茶饮深受广大年轻消费群体的欢迎[图]
  6. 跟叶子学把妹——教程序猿把妹第二集
  7. 通信原理包络是什么意思_罗茨鼓风机工作原理是什么 罗茨鼓风机工作原理介绍【详解】...
  8. Stata实证:一键显著代码免费教程,拯救你的论文
  9. vk和uview表单图片上传
  10. python归一化后全部都是0咋办_python归一化处理