论文 MiNet: Mixed Interest Network for Cross-Domain Click-Through Rate Prediction
MiNet: Mixed Interest Network for Cross-Domain Click-Through Rate Prediction
论文
CIKM 2020
阿里
应用场景
跨域点击率预测问题
例如:在UC浏览器中,用户浏览新闻信息,中间会穿插一些广告,预测用户点击该广告的概率。其中,新闻和广告属于两个不同的域。
创新点
首先,提出用户具有三种兴趣:
- 长期跨域兴趣,即用户自身画像特征,该特征在两个域中共享,都可适用,如年龄、性别等等;
- 短期源域兴趣,即用户点击的新闻历史兴趣,但是需要跟目标广告相关;
- 短期目标域兴趣,即用户交互的广告兴趣,也需要跟目标广告相关。
挑战
- 并不是所有交互过的新闻都会跟目标广告有关;
- 并不是所有交互过的广告都会跟目标广告有关;
- 需要建模,将信息从新闻源域迁移到广告目标域;
- 对于每个目标广告,用户的三种兴趣的重要性是不同的;
- 用户各兴趣向量维度可能是不一样的。
应对
- 对于挑战1、2,模型使用了item-level attention来分别处理近期交互过的新闻和广告,并提取有用信息;
- 对于挑战3的迁移问题,模型使用长期兴趣和设计迁移矩阵来进行迁移知识的学习;
- 对于挑战4,模型使用了interest-level attention来动态学习不同目标广告下用户三种兴趣的重要性;
- 对于挑战5,在interest-level attention中,选用合适的激活函数来解决维度不匹配的问题。
模型
模型图
接下来分别介绍这三种兴趣的提取过程以及相关重要步骤
Long-term Interest across Domains
该部分是将用户画像的每个特征域的嵌入进行拼接。
Short-term Interest from the Source Domain
计算流程如下
计算过程如下
该公式为Item-level Attention操作
as为最终的短期源域兴趣,rsi是源域中的新闻点击历史项。
兴趣向量为历史项的加权向量,为了该兴趣能够更加与目标广告相关,在权重计算过程中,使用了历史项、目标项、长期兴趣、迁移交互矩阵。由此处理,用户历史新闻项的权重便跟目标广告迁移联系。
Short-term Interest in the Target Domain
该部分操作原理与源域兴趣相同,输出兴趣向量at。
Interest-Level Attention
此时分别获得三种用户兴趣pu、as、at,兴趣向量维度是不同的,所以不能简单地进行相加。
而且,对于不同地目标广告而言,这三种兴趣地重要程度也是不一样地,所以不能进行简单地合并。
使用attention
计算过程如下
- Prediction
使用多个FC层。
使用辅助任务,预测用户是否点击目标新闻来进行辅助训练,更好地学习用户地长期兴趣,计算如下。
实验
在UC上的实验是将数据集分为训练集、验证集、测试集,现在验证集上决定最佳超参数,然后将训练集验证集合并为新的训练集,进行模型的训练和预测。
论文 MiNet: Mixed Interest Network for Cross-Domain Click-Through Rate Prediction相关推荐
- 【论文笔记】UBR4CTR:User Behavior Retrieval for Click-Through Rate Prediction (SIGIR 20)
本文记录UBR4CTR:User Behavior Retrieval for Click-Through Rate Prediction (SIGIR 20)的学习笔记.UBR4CTR将长序列的行为 ...
- CTR深度学习模型之 DIN(Deep Interest Network) 的理解与例子
在电商领域,每个用户都有丰富的历史行为数据,这些数据具有如下特点: 多样性(Diversity):用户可能对多种商品感兴趣,例如手机.衣服. 局部激活(Local Activation):用户是否点击 ...
- 8.Deep Interest Evolution Network for Click-Through Rate Prediction论文详解
一.背景总述 2017年6月阿里妈妈的精准定向检索及基础算法团队放出了论文Deep Interest Network(DIN),用于解决电子商务的CTR预估,再次基础上,最近又放出了改进版本Deep ...
- 7.Deep Interest Network for Click-Through Rate Prediction论文详解
一.总述 这是2018年阿里Guorui Zhou等人发表在KDD上的一篇论文.论文提出在CTR任务中,丰富的用户历史行为数据包含了用户多种兴趣,对于不同的候选广告,起作用的用户历史行为数据表示应该不 ...
- 推荐系统论文DSIN:Deep Session Interest Network
一.背景 前几天写了一篇阿里的论文BST,最后应用在我们自己的新闻推荐场景,离线AUC没有什么提升,今天分享一篇有收益的文章,同样出自阿里. 绝密伏击:推荐系统论文:Behavior Sequence ...
- CTR深度学习模型之 DSIN(Deep Session Interest Network) 论文解读
之前的文章讲解了DIEN模型:CTR深度学习模型之 DIEN(Deep Interest Evolution Network) 的理解与示例,而这篇文章要讲的是DSIN模型,它与DIEN一样都从用户历 ...
- 【论文阅读】Deep Cocktail Network: Multi-source Unsupervised Domain Adaptation with Category Shift
Deep Cocktail Network: Multi-source Unsupervised Domain Adaptation with Category Shift SUMMARY@ 2020 ...
- 【论文分享】异构图神经网络域名检测方法GAMD:Attributed Heterogeneous Graph Neural Network for Malicious Domain Detection
题目:Attributed Heterogeneous Graph Neural Network for Malicious Domain Detection 链接:https://ieeexplor ...
- [论文翻译]数据集的domian问题:Intramodality Domain Adaptation Using Self Ensembling and Adversarial Training
论文pdf下载: 链接 Intramodality Domain Adaptation Using Self Ensembling and Adversarial Training 使用自集成和对抗性 ...
最新文章
- linux平台的链接与加载
- python的动态性以及 使用__slots__
- linux下将硬件时钟调整为与本地时钟一致
- [原]ubuntu14.04 网卡逻辑修改没有文件/etc/udev/rules.d/70-persistent-net.rules
- boost::mpl模块实现copy_if相关的测试程序
- 算法入门经典 第三章
- 更改vs2010帮助文档的位置
- 利用深度学习识别番茄早期植株中的塔图绝对菌
- 4.7 Spark SQL 数据分析流程
- IEEE论文模板(latex/word)
- Python编写三角形
- Win10下的外接显示器不能识别的解决方法
- 宝塔linux 云锁安装卸载,Centos宝塔安装云锁带自编译好模块Nginx
- 中国新中产家庭“清洁观”:能躺着不站着,能靠科技不靠手
- 360插件化RePlugin踩坑
- Midjourney:一步一步教你如何使用 AI 绘画 MJ
- 在idea中如何导入一个已有的项目
- 计算机专业英语积累(包括前端和后端常用的)~持续更新
- android 监测鼠标滑轮,android2.3 监控鼠标滑动事件
- ECDH秘钥协商算法原理(ECDH Key Exchange)