推荐算法-多目标学习总结
推荐算法-多目标学习总结
mutil-task learning,本质上是用一个模型完成多个任务的建模、在推荐系统中,多任务学习一般即指多目标学习(multi-label learning),不同目标输入相同的feature进行联合训练,是迁移学习的一种。他们之间的关系如图:
q1:为什么要用多目标学习?
1、很多业界推荐业务,天然就是多目标建模场景,需要多目标共同优化。
2、工程便利。一般推荐系统中排序模块延时需求在40ms左右,如果分别对每个任务单独训练一个模型,难以满足需求。
q2:为什么多任务学习有效?
当把业务独立建模变成多任务联合建模之后,有可能带来四种结果:
多任务学习的优势在于通过部分参数共享,联合训练,能在保证“还不错”的前提下,实现多目标共同提升。原因有以下几种:
● 任务互助:对于某个任务难学到的特征,可通过其他任务学习
● 隐式数据增强:不同任务有不同的噪声,一起学习可抵消部分噪声
● 学到通用表达,提高泛化能力:模型学到的是对所有任务都偏好的权重,有助于推广到未来的新任务
● 正则化:对于一个任务而言,其他任务的学习对该任务有正则化效果
多任务学习主要研究:网络结构设计(哪些参数共享、在什么位置共享、如何共享)、多loss优化策略(每个目标都对应一个loss,继而引起loss数值有大有小,学习速度有快有慢,更新方向时而相反)
多目标类别
1、loss 加权融合
优点:
● 模型简单,仅在训练时通过梯度乘以样本权重实现对其它目标的加权
● 模型上线简单,和base完全相同,不需要额外开销
缺点:
● 本质上并不是多目标建模,而是将不同的目标转化为同一个目标。样本的加权权重需要根据AB测试才能确定。
2、shared-bottom 底层共享结构
优点:
● 浅层参数共享,互相补充学习,任务相关性越高,模型loss优化效果越明显,也可以加速训练。
缺点:
● 任务不相关甚至优化目标相反时(例如新闻的点击与阅读时长),可能会带来负收益,多个任务性能一起下降。
3、多任务学习-MOE
4、多任务学习-MMOE(mutil gate mixture-of experts)
MMOE 是MOE的改进,相较于MOE的结构中所有任务共享一个门控网络,MMOE的结构优化为每个任务都单独使用一个门控网络。这样的改进使模型更容易捕捉到子任务间的相关性。
5、多任务学习-ESMM(Entire Space Multi-Task Model)
ESMM是针对任务依赖而提出,比如电商推荐中的多目标预估经常是ctr和cvr,其中转换这个行为只有在点击发生后才会发生。
优点与拓展:
1、ESMM首创了利用用户行为序列数据在完整样本空间建模,并提出利用学习CTR和CTCVR的辅助任务,迂回学习CVR,避免了传统CVR模型经常遭遇的样本选择偏差和训练数据稀疏的问题,取得了显著的效果。
2、论文中子任务的Tower网络是MLP,我们可以很容易将其替换为其他学习模型,方便拓展
3、可以在loss中引入动态加权的学习机制
4、也可以对更长的序列依赖进行建模
6、PLE
PLE(Progressive Layered Extraction)模型由腾讯PCG团队在2020年提出,主要为了解决跷跷板问题,该论文获得了RecSys’2020的最佳长论文(Best Lone Paper Award)。
PLE在网络设计上有两大改进:
1、CGC(Customized Gate Control) 定制门控
任务A有ma个expert,任务B有mb个expert,另外还有ms个任务A、B共享的Expert。这样对Expert做一个显式的分割,可以让task-specific expert只受自己任务梯度的影响,不会受到其他任务的干扰(每个任务保底有一个独立的网络模型),而只有task-shared expert才受多个任务的混合梯度影响。
2、PLE (progressive layered extraction) 分层萃取
PLE就是上述CGC网络的多层纵向叠加,以获得更加丰富的表征能力。在分层的机制下,Gate设计成两种类型,使得不同类型Expert信息融合交互。task-share gate融合所有Expert信息,task-specific gate只融合specific expert和share expert。模型结构如图:
参考:https://datawhalechina.github.io/fun-rec/#/ch02/ch2.2/ch2.2.5/2.2.5.0
https://zhuanlan.zhihu.com/p/291406172
推荐算法-多目标学习总结相关推荐
- 推荐系统(7)——推荐算法4(深度学习时代来临:模型结构上的突破)ACF、DIN、DIEN、DRN
文章目录 1 ACF,DIN--注意力机制在推荐上的应用 1.1 AFM--NFM的交叉特征+Attention得分 1.2 DIN--淘系广告商品推荐的业务角度 1.3 注意力机制对于推荐系统的启发 ...
- 一石二鸟:推荐算法多目标建模技巧
作者:DOTA 在做推荐系统时,在系统刚刚搭建时,针对业务目标我们可能只需要去优化CTR或者CVR即可,但是不同的推荐场景下的优化目标不同.同时,随着系统的不断迭代,我们希望推荐算法能够同时优化多个业 ...
- 【推荐算法】深度学习推荐算法综述 Deep Learning based Recommender System: A Survey and New Perspectives
一.MLP based Recommender System 1. Deep Crossing模型 Deep Crossing模型完整的解决了从特征工程.稀疏向量稠密化.多层神经网络进行优化目标拟合等 ...
- 推荐常用的排序学习算法——BPR(贝叶斯个性化排序)
文章目录 1. 排序学习 1.1 优势 1.2 排序学习在推荐领域的作用 1.3 排序学习设计思路 1.3.1 单点法(Pointwise) 1.3.2 配对法(Pairwise) 1.3.3 列表法 ...
- 阿里1688直播推荐算法实践
分享嘉宾:王修充 阿里巴巴 算法专家 编辑整理:张文君 出品平台:DataFunTalk 导读:近年来,电商呈现内容化的趋势,以直播和短视频为首,内容化提升了用户体验,增加了平台收益.作为电商的重要流 ...
- 有粉丝想转行推荐算法,我觉得......
最近公众号后台收到一个读者的留言,他在某手机厂商做CV开发工作,想转行推荐系统,让我拿拿主意. 从前途角度考虑,我是非常建议的. 1 大厂必备核心--推荐系统 从商业角度来讲,互联网主要起到平台作用, ...
- 推荐算法工程师必备!!!协同过滤推荐算法总结
推荐算法具有非常多的应用场景和商业价值,因此对推荐算法值得好好研究.推荐算法种类很多,但是目前应用最广泛的应该是协同过滤类别的推荐算法,本文就对协同过滤类别的推荐算法做一个概括总结,后续也会对一些典型 ...
- 推荐算法(二)--算法总结
转自:https://www.jianshu.com/p/1464eab67711 推荐算法分类 1 个性化推荐 1.1 基于用户推荐(Demographic-based Recommendation ...
- 业界分享 | 京东推荐算法精排技术实践
作者 | 王冬月 京东 京东主站推荐的主要业务场景覆盖APP中用户购买前.购买中和购买后的全流程,日均千万级DAU.不同业务场景下用户需求不同,我们相应的优化目标也不同. 首页feeds和" ...
最新文章
- P2015 二叉苹果树
- java 年计算_JAVA计算年/周的问题
- 正则表达式 Mather类的使用
- 飞鸽传书2012 的网络通信代码
- 小菜的系统框架界面设计-小菜用户权限管理软件开源大放送
- 1月8日 官方ros.org太慢,配置中科院ros镜像源 关于解决Ubuntu 14.04安装ros提示校验错误解决
- atitit.TokenService v3 qb1 token服务模块的设计 新特性.docx
- C4D模型工具—恢复平滑着色(Phong)
- 数学建模——线性规划篇
- 获得每种调制方式中每个信噪比的准确度
- 怎样关闭计算机445端口,445端口怎么关闭 445端口关闭方法介绍
- 工作拾忆 一年C++经验小记
- 【LG-P1251】餐巾计划问题
- [转载]Geronimo 叛逆者,第 8 部分: 未来的 Apache Geronimo
- MATLAB App Designer入门实战(一)
- 初学makefile
- Java中的statis用法
- “一帮一学习小组”是中小学中常见的学习组织方式,老师把学习成绩靠前的学生跟学习成绩靠后的学生排在一组。本题就请你编写程序帮助老师自动完成这个分配工作,即在得到全班学生的排名后,在当前尚未分组的学生中,
- 看完它你就造了!为什么AR直播是淘宝造物节最火的黑科技
- 自建数据集系列:实例分割mask->语义分割mask->扩增mask