MoSE: 多任务混合序列专家模型
上周我们在Youtube: 多任务目标推荐今天我们继续看多任务的知识点应用。
应用场景
在Gmail中搜索时,会去查询Google Drive中的文件,而且是per-key的,即每输入一个字符,都会触发查询操作。
这个功能看起来对很多用户来说用处没有那么大,因为用户在gmail的搜索框里搜索一般意图就是搜索email。而且给Google Drive带来了很大的访问压力。但也有不少用户会使用这个功能。因此,需要用模型来解决这个问题。
模型需要根据用户的的行为来预测两个目标:
Google Drive结果的点击数
用户在Gmail里搜索所输入的字符数
这两个目标都是以天为单位的。
得到这两个目标之后,当然,就会希望在那些点击数少且输入字符数多的用户上disable这个功能。需要在它们之间做平衡考虑。
之所以要预测这两个任务是出于商业和产品的考虑,例如,当Google Drive能够处理的request容量够大的时候,可以考虑放宽阈值,让更多的用户看到这个功能。
产品精细化的处理可以很细节,这个场景足够小了,但是依然可以用AI解决。
基于这个场景,可以发现问题的几个特点:
数据稀疏,搜索过程中Google Drive文件的结果点击次数很稀疏。
数据异构,除了用户在gmail中搜索的行为外,用户在Drive上的行为也很重要,因此,Gmail的search日志,浏览日志,Drive的活动日志数据都需要考虑进来。
目标复杂,用户如何点击和输入依赖于用户的意图。
MoSE
MoSE,是Mixture of Sequential Experts的缩写。相对于我们之前介绍的MoE: 稀疏门控制的专家混合层
首先看模型整体结构如下,可以看到,每个Expert都是Sequential模型而不是FC模型。
多对多序列模型直接用LSTM就好:
模型公式如下,核心就是g(x)门限函数,就是对expert加权用的。
其他的baseline
论文用了多种变种作为baseline。如下图:
实验
实验结果如下,可以看到,在两个目标的预测上,MoSE都能达到很好的效果,除此之外,sequential的模型比非Sequential的模型也要好。
一起交流
想和你一起学习进步!『NewBeeNLP』目前已经建立了多个不同方向交流群(机器学习 / 深度学习 / 自然语言处理 / 搜索推荐 / 图网络 / 面试交流 / 等),名额有限,赶紧添加下方微信加入一起讨论交流吧!(注意一定要备注信息才能通过)
参考文献
[1]. Qin, Z., Cheng, Y., Zhao, Z., Chen, Z., Metzler, D., & Qin, J. (2020, August). Multitask Mixture of Sequential Experts for User Activity Streams. In Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining (pp. 3083-3091).
- END -
Don't stop pretraining,继续预训练!
2021-10-10
GPT Plus Money!B O O M
2021-10-09
召回 粗排 精排,如何各司其职?
2021-10-06
图神经网络中可能用到的11种距离, 小结
2021-10-05
MoSE: 多任务混合序列专家模型相关推荐
- 【CTR排序】多任务学习之MMOE模型
学习总结 常见的多任务模型有三种范式: hard parameter sharing:底部有shared bottom,然后上层用全连接层分别学习特定任务模式,但是当两个任务相关性没那么好(比如排序中 ...
- 我们如何在Pinterest Ads中使用AutoML,多任务学习和多塔模型
Ernest Wang | Software Engineer, Ads Ranking 欧内斯特·王| 软件工程师,广告排名 People come to Pinterest in an explo ...
- 《预训练周刊》第16期:中科院推出全球首个图文音三模态预训练模型、顶会论文探索100层序列推荐模型的加速训练...
No.16 智源社区 预训练组 预 训 练 研究 观点 资源 活动 关于周刊 超大规模预训练模型是当前人工智能领域研究的热点,为了帮助研究与工程人员了解这一领域的进展和资讯,智源社区整理了第16期&l ...
- 计算机视觉-混合动态纹理模型(Mixtures of Dynamic Textures)
实话实说,对MDT和HMM的区别仍旧不是很确定.以下仅仅记录分析的过程. 动态纹理的表达式: HMM的表达式:(系统介绍可见HMM隐马尔可夫模型的例子.原理.计算和应用 - 知乎,HMM隐马尔可夫模型 ...
- 西安交大团队开发了一种混合深度学习模型,用于在基因组中识别启动子
来源:ScienceAI 编辑:萝卜皮 人类的大部分细胞中,每时每刻都在进行着各种复杂的转录过程:这一过程与后续的蛋白质合成息息相关,从而会影响人体中各类酶.抗体.激素.免疫因子等生物分子的产生,最终 ...
- 图文多模态语义融合前的语义对齐——一种单双混合塔多模态模型
图文多模态语义融合前的语义对齐--一种单双混合塔多模态模型 FesianXu 20220127 at Baidu Search Team 前言 之前在博文[2-4]中介绍了一些图文多模态语义对齐相关的 ...
- 性能超越最新序列推荐模型,华为诺亚方舟提出记忆增强的图神经网络
作者 | Chen Ma, Liheng Ma等 译者 | Rachel 出品 | AI科技大本营(ID:rgznai100) 用户-商品交互的时间顺序可以揭示出推荐系统中用户行为随时间演进的序列性特 ...
- 【论文写作分析】之一 《基于混合注意力Seq2seq模型的选项多标签分类》
[1] 参考论文信息 论文名称:<基于混合注意力Seq2seq模型的选项多标签分类> 发布期刊:<计算机工程与应用> 期刊信息:CSCD扩展 论文写作分析摘要: ...
- 推荐系统中基于深度学习的混合协同过滤模型
近些年,深度学习在语音识别.图像处理.自然语言处理等领域都取得了很大的突破与成就.相对来说,深度学习在推荐系统领域的研究与应用还处于早期阶段. 携程在深度学习与推荐系统结合的领域也进行了相关的研究与应 ...
最新文章
- nginx 日志切割
- 27、oracle(三)
- 删除指定路径下的文件
- Html5 Game - SpaceWar
- Kibana部署及配置(四)
- Python入门-day1变量和简单数据类型
- 利用curl验证ssl网站(webservice)
- windows便签快捷键_win10电脑有哪些常用的快捷键?
- 爬虫-古试词网验证码手工打码访问登陆后页面
- sublimetext3安装配置
- 芯片业巨震!英特尔拟90亿美元卖掉NAND闪存业务
- liunx安装和部署nacos
- Python学习中的知识点小记录(廖雪峰)
- 偶数支足球队进行单循环比赛,按照指定算法打印每轮的对阵形势
- Android修行手册 - ConstraintLayout示例
- EPICS IOC Shell
- 【单片机笔记】关于RGB彩灯WS2812B的驱动
- SBT项目配置依赖树查询组件
- informatica 学习日记整理
- win2003系统下 百度云盘 网络异常