推荐算法-多目标学习总结

mutil-task learning,本质上是用一个模型完成多个任务的建模、在推荐系统中,多任务学习一般即指多目标学习(multi-label learning),不同目标输入相同的feature进行联合训练,是迁移学习的一种。他们之间的关系如图:

q1:为什么要用多目标学习?
1、很多业界推荐业务,天然就是多目标建模场景,需要多目标共同优化。
2、工程便利。一般推荐系统中排序模块延时需求在40ms左右,如果分别对每个任务单独训练一个模型,难以满足需求。
q2:为什么多任务学习有效?
当把业务独立建模变成多任务联合建模之后,有可能带来四种结果:

多任务学习的优势在于通过部分参数共享,联合训练,能在保证“还不错”的前提下,实现多目标共同提升。原因有以下几种:
● 任务互助:对于某个任务难学到的特征,可通过其他任务学习
● 隐式数据增强:不同任务有不同的噪声,一起学习可抵消部分噪声
● 学到通用表达,提高泛化能力:模型学到的是对所有任务都偏好的权重,有助于推广到未来的新任务
● 正则化:对于一个任务而言,其他任务的学习对该任务有正则化效果
多任务学习主要研究:网络结构设计(哪些参数共享、在什么位置共享、如何共享)、多loss优化策略(每个目标都对应一个loss,继而引起loss数值有大有小,学习速度有快有慢,更新方向时而相反)

多目标类别
1、loss 加权融合

优点:
● 模型简单,仅在训练时通过梯度乘以样本权重实现对其它目标的加权
● 模型上线简单,和base完全相同,不需要额外开销
缺点:
● 本质上并不是多目标建模,而是将不同的目标转化为同一个目标。样本的加权权重需要根据AB测试才能确定。
2、shared-bottom 底层共享结构

优点:
● 浅层参数共享,互相补充学习,任务相关性越高,模型loss优化效果越明显,也可以加速训练。
缺点:
● 任务不相关甚至优化目标相反时(例如新闻的点击与阅读时长),可能会带来负收益,多个任务性能一起下降。
3、多任务学习-MOE

4、多任务学习-MMOE(mutil gate mixture-of experts)

MMOE 是MOE的改进,相较于MOE的结构中所有任务共享一个门控网络,MMOE的结构优化为每个任务都单独使用一个门控网络。这样的改进使模型更容易捕捉到子任务间的相关性。

5、多任务学习-ESMM(Entire Space Multi-Task Model)
ESMM是针对任务依赖而提出,比如电商推荐中的多目标预估经常是ctr和cvr,其中转换这个行为只有在点击发生后才会发生。

优点与拓展:
1、ESMM首创了利用用户行为序列数据在完整样本空间建模,并提出利用学习CTR和CTCVR的辅助任务,迂回学习CVR,避免了传统CVR模型经常遭遇的样本选择偏差和训练数据稀疏的问题,取得了显著的效果。
2、论文中子任务的Tower网络是MLP,我们可以很容易将其替换为其他学习模型,方便拓展
3、可以在loss中引入动态加权的学习机制
4、也可以对更长的序列依赖进行建模

6、PLE
PLE(Progressive Layered Extraction)模型由腾讯PCG团队在2020年提出,主要为了解决跷跷板问题,该论文获得了RecSys’2020的最佳长论文(Best Lone Paper Award)。
PLE在网络设计上有两大改进:
1、CGC(Customized Gate Control) 定制门控

任务A有ma个expert,任务B有mb个expert,另外还有ms个任务A、B共享的Expert。这样对Expert做一个显式的分割,可以让task-specific expert只受自己任务梯度的影响,不会受到其他任务的干扰(每个任务保底有一个独立的网络模型),而只有task-shared expert才受多个任务的混合梯度影响。
2、PLE (progressive layered extraction) 分层萃取
PLE就是上述CGC网络的多层纵向叠加,以获得更加丰富的表征能力。在分层的机制下,Gate设计成两种类型,使得不同类型Expert信息融合交互。task-share gate融合所有Expert信息,task-specific gate只融合specific expert和share expert。模型结构如图:

参考:https://datawhalechina.github.io/fun-rec/#/ch02/ch2.2/ch2.2.5/2.2.5.0
https://zhuanlan.zhihu.com/p/291406172

推荐算法-多目标学习总结相关推荐

  1. 推荐系统(7)——推荐算法4(深度学习时代来临:模型结构上的突破)ACF、DIN、DIEN、DRN

    文章目录 1 ACF,DIN--注意力机制在推荐上的应用 1.1 AFM--NFM的交叉特征+Attention得分 1.2 DIN--淘系广告商品推荐的业务角度 1.3 注意力机制对于推荐系统的启发 ...

  2. 一石二鸟:推荐算法多目标建模技巧

    作者:DOTA 在做推荐系统时,在系统刚刚搭建时,针对业务目标我们可能只需要去优化CTR或者CVR即可,但是不同的推荐场景下的优化目标不同.同时,随着系统的不断迭代,我们希望推荐算法能够同时优化多个业 ...

  3. 【推荐算法】深度学习推荐算法综述 Deep Learning based Recommender System: A Survey and New Perspectives

    一.MLP based Recommender System 1. Deep Crossing模型 Deep Crossing模型完整的解决了从特征工程.稀疏向量稠密化.多层神经网络进行优化目标拟合等 ...

  4. 推荐常用的排序学习算法——BPR(贝叶斯个性化排序)

    文章目录 1. 排序学习 1.1 优势 1.2 排序学习在推荐领域的作用 1.3 排序学习设计思路 1.3.1 单点法(Pointwise) 1.3.2 配对法(Pairwise) 1.3.3 列表法 ...

  5. 阿里1688直播推荐算法实践

    分享嘉宾:王修充 阿里巴巴 算法专家 编辑整理:张文君 出品平台:DataFunTalk 导读:近年来,电商呈现内容化的趋势,以直播和短视频为首,内容化提升了用户体验,增加了平台收益.作为电商的重要流 ...

  6. 有粉丝想转行推荐算法,我觉得......

    最近公众号后台收到一个读者的留言,他在某手机厂商做CV开发工作,想转行推荐系统,让我拿拿主意. 从前途角度考虑,我是非常建议的. 1 大厂必备核心--推荐系统 从商业角度来讲,互联网主要起到平台作用, ...

  7. 推荐算法工程师必备!!!协同过滤推荐算法总结

    推荐算法具有非常多的应用场景和商业价值,因此对推荐算法值得好好研究.推荐算法种类很多,但是目前应用最广泛的应该是协同过滤类别的推荐算法,本文就对协同过滤类别的推荐算法做一个概括总结,后续也会对一些典型 ...

  8. 推荐算法(二)--算法总结

    转自:https://www.jianshu.com/p/1464eab67711 推荐算法分类 1 个性化推荐 1.1 基于用户推荐(Demographic-based Recommendation ...

  9. 业界分享 | 京东推荐算法精排技术实践

    作者 | 王冬月 京东 京东主站推荐的主要业务场景覆盖APP中用户购买前.购买中和购买后的全流程,日均千万级DAU.不同业务场景下用户需求不同,我们相应的优化目标也不同. 首页feeds和" ...

最新文章

  1. P2015 二叉苹果树
  2. java 年计算_JAVA计算年/周的问题
  3. 正则表达式 Mather类的使用
  4. 飞鸽传书2012 的网络通信代码
  5. 小菜的系统框架界面设计-小菜用户权限管理软件开源大放送
  6. 1月8日 官方ros.org太慢,配置中科院ros镜像源 关于解决Ubuntu 14.04安装ros提示校验错误解决
  7. atitit.TokenService v3 qb1 token服务模块的设计 新特性.docx
  8. C4D模型工具—恢复平滑着色(Phong)
  9. 数学建模——线性规划篇
  10. 获得每种调制方式中每个信噪比的准确度
  11. 怎样关闭计算机445端口,445端口怎么关闭 445端口关闭方法介绍
  12. 工作拾忆 一年C++经验小记
  13. 【LG-P1251】餐巾计划问题
  14. [转载]Geronimo 叛逆者,第 8 部分: 未来的 Apache Geronimo
  15. MATLAB App Designer入门实战(一)
  16. 初学makefile
  17. Java中的statis用法
  18. “一帮一学习小组”是中小学中常见的学习组织方式,老师把学习成绩靠前的学生跟学习成绩靠后的学生排在一组。本题就请你编写程序帮助老师自动完成这个分配工作,即在得到全班学生的排名后,在当前尚未分组的学生中,
  19. 看完它你就造了!为什么AR直播是淘宝造物节最火的黑科技
  20. 自建数据集系列:实例分割mask->语义分割mask->扩增mask

热门文章

  1. SpringBoot加email服务,你说有没有搞头?
  2. 重装系统过后的U盘不能用于车载播放音乐
  3. 安卓查看内存读写测试软件_苹果危机,iPhone 的流畅度被安卓超越?
  4. 用户终端浏览器的判断源代码写法示例
  5. Spring Security自定义登录验证及登录返回结果
  6. Echarts折线图部分区域标记
  7. 《新课程理念与教学改革》
  8. 01-说话人语音识别
  9. CSK与KCF算法推导(六)
  10. [人工智能AI]之推理