Weinan Zhang1 et al. “Deep Learning over Multi-field Categorical Data” in ECIR 2016

FNN模型是2016提出来的,当时各大公司都还在探索如何将深度学习技术应用于推荐系统,一些头部公司开始了初步的尝试,比如Google应用并发表了Wide&Deep模型,微软在Bing的搜索广告场景尝试了Deep Crossing模型,都是那个时代的代表模型,对业界发展起到了重要作用。不过即使是号称完全自动化特征工程的Deep Crossing模型,也没有做显式特征交叉。那深度学习时代,能否让模型既有像FM那样做显式特征交叉,又具备DNN的隐式高阶交叉和泛化能力呢?FNN就是这样的尝试,试图将FM和DNN结合起来,模型结构如图2所示。


模型的核心思想是采用FM训练得到的隐向量作为神经网络第一层权重的初始值,之后是隐藏层,最后是点击率预估的输出。其实是一个Embedding + MLP结构,特殊的是Embedding的初始值是FM模型已经预训练好的结果。FM与Embedding的初始化对应关系如图3所示。

FNN全称Factorisation Machine supported Neural Network,如果用一句简短的话概括FNN那就是:FM+MLP,如果再用一句稍显复杂的话概括FNN那就是:FNN是一个两阶段训练的模型,阶段一先训练一个FM模型得到每个field的embedding向量,阶段二,基于阶段一的embedding向量初始化MLP的embedding层,然后训练一个MLP(DNN)。

由于Embedding的初始值得到了FM的预训练,因此在训练DNN的时候,模型收敛速度更快;并且Embedding包含了组合特征的信息,可以不用做额外的特征工程;DNN在FM的基础上对特征组合做了进一步的高阶特征组合,模型能得到更好的效果。不过由于整个训练过程分成了两阶段,其实不是一个端到端的训练过程,而是一种基于参数的迁移学习。

FNN存在的问题有:

  1. Embedding参数受FM的影响,模型能力受限于FM表征能力的上限;

  2. 训练过程分两阶段进行,过程较复杂,效率不高;

  3. FNN只能学习高阶特征组合,没有对低阶特征建模,但很多特征的高阶交叉是无意义的。




参考资料:
神经网络中的几个FM家族模型(FNN、NFM、AFM、DeepFM)
神经网络中的几个FM家族模型(FNN、NFM、AFM、DeepFM)

推荐模型-上下文感知-2016:FNN模型【FM家族】【FM+MLP=FNN】相关推荐

  1. 推荐模型-上下文感知-2017:AFM模型【FM家族】【NFM的改进版】【引入Attention机制】

    AFM可以看作是对NFM功能的增强,实际上NFM的作者参与到了AFM的研究当中.AFM模型的最大贡献是将Attention机制引入到了特征交叉模块.在NFM的BI层,对交叉特征的向量进行Sum Poo ...

  2. AI同传效果媲美人类,百度翻译出品全球首个上下文感知机器同传模型

    鱼羊 发自 凹非寺  量子位 报道 | 公众号 QbitAI AI同传领域又有新进展,这次突破来自百度. 百度机器翻译团队创新性地提出了全球首个感知上下文的机器同传模型,并基于此发布了最新的语音到语音 ...

  3. 推荐系统(八)FNN模型(FM+MLP=FNN)

    推荐系统(八)FNN模型(FM+MLP=FNN) 推荐系统系列博客: 推荐系统(一)推荐系统整体概览 推荐系统(二)GBDT+LR模型 推荐系统(三)Factorization Machines(FM ...

  4. 用于文档上下文感知推荐的卷积矩阵分解

    论文:Kim D H, Park C, Oh J, et al. Convolutional Matrix Factorization for Document Context-Aware Recom ...

  5. CTR模型:FNN模型

    1. 简介 FNN 模型是2016年提出的,基于传统机器学习模型,如LR,FM等,的CTR预测方案被称为基于浅层模型的方案. 优点是模型简单,预测性能较好,可解释性强.缺点是,很难自动提取高阶组合特征 ...

  6. 推荐系统之CTR预估-FNN模型解析

    原论文:Deep learning over multi-field categorical data 地址:https://arxiv.org/pdf/1601.02376.pdf 一.问题由来 基 ...

  7. Multi-Armed Bandit--基于时变多臂老虎机的在线上下文感知推荐

    Online Context-Aware Recommendation with Time Varying Multi-Armed Bandit 基于时变多臂老虎机的在线上下文感知推荐 摘要 为了预测 ...

  8. 【推荐算法】点击率模型特征交叉方向的发展及CAN模型介绍

    猜你喜欢 0.2022年人才市场洞察及薪酬指南 1.[免费下载]2022年1月份热门报告 2.[实践]小红书推荐中台实践 3.微信视频号实时推荐技术架构分享 4.腾讯QQ看点推荐场景的多目标架构实践 ...

  9. 传统推荐算法Facebook的GBDT+LR模型深入理解

    目标: 深入理解Facebook 2014年提出的的GBDT+LR模型. CSDN上泛泛而谈的文章很多,真正讲解透彻的没几篇.争取我这篇能讲解透彻. 今晚又想了许久,想通了一些原理.也分享出来. 算法 ...

最新文章

  1. thinkPHP5.0 URL路由优化
  2. Redis进阶实战用法深剖析
  3. SQLServer内置函数
  4. LeetCode 601. Human Traffic of Stadium
  5. Android-----Resources
  6. SpringMVC经典系列-14自己定义SpringMVC的拦截器---【LinusZhu】
  7. java 配置文件 路径问题_java 配置文件的路径问题
  8. LeetCode之Ransom Note
  9. c if语句多个条件判断顺序_Java中的流程控制语句 (基础篇四)
  10. 数据结构拾遗(3) --红黑树的设计与实现(下)
  11. 一个好习惯可以让自己享受一辈子
  12. mongodb update操作
  13. Chia命令行P图工具
  14. AR/VR应用前景探讨
  15. 98城市联合发行全国旅游年票一卡通
  16. vue玩转移动端H5微信支付和支付宝支付
  17. 【每天听见吴晓波-2016-07-04】上海房价未来五年还会翻番
  18. vue3+element-plus 配套使用日期时间选择器默认英文修改为中文 完整引入和按需引入
  19. 地理学优质核心期刊汇总(论文投稿必备)
  20. web开发入门经典,96道前端面试题

热门文章

  1. c语言编程中的或逻辑的符号 符号如何输入,C语言中逻辑运算符(,||,!)和位运算符号(,|,^)...
  2. oracle 企业管理器网页打不开 解决https://localhost:1158/em问题
  3. 随着人工智能发展的少儿编程教育
  4. android获取imei兼容_Android如何获取双卡手机IMEI的方法示例
  5. 意大利或将立法 禁止中小学校园携带手机
  6. 华为2288XV5服务器配置RAID,安装ESXI虚拟机
  7. 微信小程序 登录与退出登录
  8. Python实践:使用Turtle模块绘制炫彩螺旋线
  9. python3 分句
  10. 执行celery -A tasks worker --loglevel=info报错