MiNet: Mixed Interest Network for Cross-Domain Click-Through Rate Prediction

论文

CIKM 2020
阿里

应用场景

跨域点击率预测问题
例如:在UC浏览器中,用户浏览新闻信息,中间会穿插一些广告,预测用户点击该广告的概率。其中,新闻和广告属于两个不同的域。

创新点

首先,提出用户具有三种兴趣:

  1. 长期跨域兴趣,即用户自身画像特征,该特征在两个域中共享,都可适用,如年龄、性别等等;
  2. 短期源域兴趣,即用户点击的新闻历史兴趣,但是需要跟目标广告相关;
  3. 短期目标域兴趣,即用户交互的广告兴趣,也需要跟目标广告相关。
挑战
  1. 并不是所有交互过的新闻都会跟目标广告有关;
  2. 并不是所有交互过的广告都会跟目标广告有关;
  3. 需要建模,将信息从新闻源域迁移到广告目标域;
  4. 对于每个目标广告,用户的三种兴趣的重要性是不同的;
  5. 用户各兴趣向量维度可能是不一样的。
应对
  1. 对于挑战1、2,模型使用了item-level attention来分别处理近期交互过的新闻和广告,并提取有用信息;
  2. 对于挑战3的迁移问题,模型使用长期兴趣和设计迁移矩阵来进行迁移知识的学习;
  3. 对于挑战4,模型使用了interest-level attention来动态学习不同目标广告下用户三种兴趣的重要性;
  4. 对于挑战5,在interest-level attention中,选用合适的激活函数来解决维度不匹配的问题。

模型

模型图

接下来分别介绍这三种兴趣的提取过程以及相关重要步骤

  1. Long-term Interest across Domains

该部分是将用户画像的每个特征域的嵌入进行拼接。

  1. Short-term Interest from the Source Domain

计算流程如下

计算过程如下


该公式为Item-level Attention操作

as为最终的短期源域兴趣,rsi是源域中的新闻点击历史项。
兴趣向量为历史项的加权向量,为了该兴趣能够更加与目标广告相关,在权重计算过程中,使用了历史项、目标项、长期兴趣、迁移交互矩阵。由此处理,用户历史新闻项的权重便跟目标广告迁移联系。

  1. Short-term Interest in the Target Domain

该部分操作原理与源域兴趣相同,输出兴趣向量at。

  1. Interest-Level Attention

此时分别获得三种用户兴趣pu、as、at,兴趣向量维度是不同的,所以不能简单地进行相加。
而且,对于不同地目标广告而言,这三种兴趣地重要程度也是不一样地,所以不能进行简单地合并。
使用attention

计算过程如下

  1. Prediction
    使用多个FC层。
    使用辅助任务,预测用户是否点击目标新闻来进行辅助训练,更好地学习用户地长期兴趣,计算如下。

实验

在UC上的实验是将数据集分为训练集、验证集、测试集,现在验证集上决定最佳超参数,然后将训练集验证集合并为新的训练集,进行模型的训练和预测。

论文 MiNet: Mixed Interest Network for Cross-Domain Click-Through Rate Prediction相关推荐

  1. 【论文笔记】UBR4CTR:User Behavior Retrieval for Click-Through Rate Prediction (SIGIR 20)

    本文记录UBR4CTR:User Behavior Retrieval for Click-Through Rate Prediction (SIGIR 20)的学习笔记.UBR4CTR将长序列的行为 ...

  2. CTR深度学习模型之 DIN(Deep Interest Network) 的理解与例子

    在电商领域,每个用户都有丰富的历史行为数据,这些数据具有如下特点: 多样性(Diversity):用户可能对多种商品感兴趣,例如手机.衣服. 局部激活(Local Activation):用户是否点击 ...

  3. 8.Deep Interest Evolution Network for Click-Through Rate Prediction论文详解

    一.背景总述 2017年6月阿里妈妈的精准定向检索及基础算法团队放出了论文Deep Interest Network(DIN),用于解决电子商务的CTR预估,再次基础上,最近又放出了改进版本Deep ...

  4. 7.Deep Interest Network for Click-Through Rate Prediction论文详解

    一.总述 这是2018年阿里Guorui Zhou等人发表在KDD上的一篇论文.论文提出在CTR任务中,丰富的用户历史行为数据包含了用户多种兴趣,对于不同的候选广告,起作用的用户历史行为数据表示应该不 ...

  5. 推荐系统论文DSIN:Deep Session Interest Network

    一.背景 前几天写了一篇阿里的论文BST,最后应用在我们自己的新闻推荐场景,离线AUC没有什么提升,今天分享一篇有收益的文章,同样出自阿里. 绝密伏击:推荐系统论文:Behavior Sequence ...

  6. CTR深度学习模型之 DSIN(Deep Session Interest Network) 论文解读

    之前的文章讲解了DIEN模型:CTR深度学习模型之 DIEN(Deep Interest Evolution Network) 的理解与示例,而这篇文章要讲的是DSIN模型,它与DIEN一样都从用户历 ...

  7. 【论文阅读】Deep Cocktail Network: Multi-source Unsupervised Domain Adaptation with Category Shift

    Deep Cocktail Network: Multi-source Unsupervised Domain Adaptation with Category Shift SUMMARY@ 2020 ...

  8. 【论文分享】异构图神经网络域名检测方法GAMD:Attributed Heterogeneous Graph Neural Network for Malicious Domain Detection

    题目:Attributed Heterogeneous Graph Neural Network for Malicious Domain Detection 链接:https://ieeexplor ...

  9. [论文翻译]数据集的domian问题:Intramodality Domain Adaptation Using Self Ensembling and Adversarial Training

    论文pdf下载: 链接 Intramodality Domain Adaptation Using Self Ensembling and Adversarial Training 使用自集成和对抗性 ...

最新文章

  1. linux平台的链接与加载
  2. python的动态性以及 使用__slots__
  3. linux下将硬件时钟调整为与本地时钟一致
  4. [原]ubuntu14.04 网卡逻辑修改没有文件/etc/udev/rules.d/70-persistent-net.rules
  5. boost::mpl模块实现copy_if相关的测试程序
  6. 算法入门经典 第三章
  7. 更改vs2010帮助文档的位置
  8. 利用深度学习识别番茄早期植株中的塔图绝对菌
  9. 4.7 Spark SQL 数据分析流程
  10. IEEE论文模板(latex/word)
  11. Python编写三角形
  12. Win10下的外接显示器不能识别的解决方法
  13. 宝塔linux 云锁安装卸载,Centos宝塔安装云锁带自编译好模块Nginx
  14. 中国新中产家庭“清洁观”:能躺着不站着,能靠科技不靠手
  15. 360插件化RePlugin踩坑
  16. Midjourney:一步一步教你如何使用 AI 绘画 MJ
  17. 在idea中如何导入一个已有的项目
  18. 计算机专业英语积累(包括前端和后端常用的)~持续更新
  19. android 监测鼠标滑轮,android2.3 监控鼠标滑动事件
  20. ECDH秘钥协商算法原理(ECDH Key Exchange)

热门文章

  1. 如何通过微信小程序实现被动收入
  2. AI冲击人工:资深翻译3年前就接受了可能到来的失业,原画师被取代后又出现了“AI概念师”...
  3. python实现顺序查找
  4. 从零开始创建微信小程序Demo
  5. C++ 甲流疫情死亡率计算
  6. 2021-05-09 乔迁
  7. Linux之tail查看命令
  8. ssm+JSP计算机毕业设计自助洗车系统01923【源码、程序、数据库、部署】
  9. Lire使用实例:创建索引 搜索相似图片
  10. 量化策略——市盈率策略选股