论文:From Zero-Shot Learning to Cold-Start Recommendation / 从零样本学习到冷启动推荐
作者:Jingjing Li, Mengmeng Jing, Ke Lu, Lei Zhu, Yang Yang, Zi Huang
发表刊物:AAAI
发表年度:2019
下载地址:https://arxiv.org/abs/1906.08511

Abstract

零样本学习和冷启动推荐分别是计算机视觉和推荐系统中具有挑战性的研究问题,它们一般来各自的社区中被独立地研究。本文指出,零样本学习和冷启动推荐本质上是同一个研究问题,它们的目标都是要预测未知类的标签且都涉及特征表示空间和支持空间。本文首次提出使用零样本学习方法解决冷启动推荐问题,具体地,作者提出了低秩线性自编码器,该模型能够同时缓解领域漂移、伪相关和计算效率问题。该模型包括一个将用户行为映射到用户属性的地址编码器和一个从用户属性重构用户行为的解码器。实验证明,该方法可以同时提升零样本学习和冷启动推荐的精度。

Introduction

推荐系统的目的是在产品具有无限库存的假定下基于用户的当前上下文和过去的行为,为用户推荐一组他可能感兴趣的产品。但是,如果用户的历史行为不可用呢?例如很多推荐系统无法为新用户推荐,尤其是基于协同过滤的推荐系统。这一类问题被称为冷启动推荐问题,最近,学者们通过引入跨领域信息、个人信息或社交网络信息来缓解推荐系统中的用户冷启动问题。

目前缓解冷启动推荐问题的方法的思路是利用用户偏好来为新用户生成推荐结果。此过程涉及两个空间:属性空间和行为空间,其中属性空间包含用户偏好和个人信息,行为空间包含用户购买行为和历史交互,属性空间用于描述用户偏好,行为空间用于描述用户与目标系统的交互。那么冷启动推荐可以定义为:当行为空间中没有用户的交互数据但属性空间中有关于用户的辅助信息时,如何为一个新用户生成推荐。基于“具有相似偏好的用户往往具有相似的消费行为”假设,可以分两步进行冷启动推荐:1)将行为空间映射到属性空间,使得新/老用户产生联系;2)通过用户属性重构用户行为以产生推荐结果。

基于以上分析,我们可以发现,冷启动推荐问题本质上是零样本学习问题,具体地,零样本学习和冷启动推荐都涉及两个空间,一个用于直接特征表示,另一个用于补充描述,且二者的目标都是通过利用可见类和未知类之间共享的描述空间中的信息,预测属性空间中未知类的标签。本文首次提出使用零样本学习方法解决冷启动推荐问题,这种做法往往会面临以下问题:1)领域漂移问题:不仅行为空间和属性空间是异质的,老用户和新用户的概率分布也是不同的;2)稀疏性问题:在冷启动推荐中,用户行为较少导致用户-产品交互矩阵过于稀疏;3)效率问题:推荐系统是在线系统,用户讨厌等待。

作者提出低秩线性自编码器来从零样本学习的视角解决冷启动推荐问题,该模型采用编码器-解码器范式,解码器的重构过程能够有效缓解用户行为和用户属性间的领域漂移问题,且该模型的计算成本与样本量无关。模型中的低秩限制解决稀疏性问题,低秩表示有助于揭示主要因素而过滤掉无关的因素。

本文的主要贡献在于:

1)揭示了零样本学习和冷启动推荐是同一类问题,在零样本学习和冷启动推荐之间建立了联系,使得两个社区的成果可以共享;

2)提出了线性低秩自编码器模型,该模型能够有效缓解领域漂移问题、稀疏性问题和效率问题;

3)在零样本学习和冷启动推荐设定下的实验结果显示该模型能够同时为零样本学习和冷启动推荐问题带来性能提升。

Related Work

零样本学习:人类可以仅仅通过语义描述来识别之前从未看到过的物体,零样本学习算法也力求做到这一点:通过学习从视觉空间到语义空间的映射或从语义空间到视觉空间的映射来实现这一功能。从宏观的视角来看,零样本学习算法可以被分为三类:1)学习从视觉空间到语义空间的映射函数;2)学习从语义空间到视觉空间的映射函数;3)学习一个由视觉信息和语义信息共享的隐空间。

冷启动推荐:我们关注利用辅助信息解决冷启动推荐问题的研究,辅助信息可以是用户属性、个人信息或用户社交网络数据。这些研究中提出的方法可以大致分为三类:基于相似性的模型、基于矩阵分解的模型和基于特征映射的模型。

Model

Experiments

作者用提出的低秩线性自编码器在零样本图片分类任务和冷启动推荐任务上分别做了实验。

在零样本图片分类任务中的性能如下:

在冷启动推荐任务中的性能如下:

Conclusion

本文首次从零样本学习的视角对冷启动推荐问题进行研究,作者验证了提出的低秩线性自编码器在零样本图像分类和冷启动推荐中的性能。未来作者打算采用深度自编码器解决零样本学习和冷启动推荐问题。

论文阅读笔记:From Zero-Shot Learning to Cold-Start Recommendation相关推荐

  1. [论文阅读笔记05]Deep Active Learning for Named Entity Recognition

    一,题目 Deep Active Learning for Named Entity Recognition[NER任务的深度主动学习] 来源:ICLR 2018 原文:DEEP ACTIVE LEA ...

  2. 论文阅读笔记:Unsupervised Feature Learning via Non-Parametric Instance Discrimination

    Unsupervised Feature Learning via Non-Parametric Instance Discrimination 论文下载地址 github代码地址 Summary 这 ...

  3. 论文阅读笔记:Frequency-Aware Contrastive Learning for Neural Machine Translation

    论文链接:https://arxiv.org/abs/2112.14484 author={Zhang, Tong and Ye, Wei and Yang, Baosong and Zhang, L ...

  4. (论文阅读笔记1)Collaborative Metric Learning(一)(WWW2017)

    一.摘要 度量学习算法产生的距离度量捕获数据之间的重要关系.这里,我们将度量学习和协同过滤联系起来,提出了协同度量学习(CML),它可以学习出一个共同的度量空间来编码用户偏好和user-user 和 ...

  5. 【论文阅读笔记】One Shot 3D Photography

    论文主页:https://facebookresearch.github.io/one_shot_3d_photography/ 代码地址:https://github.com/facebookres ...

  6. 【论文阅读笔记】Multi-Task Feature Learning for Knowledge Graph Enhanced

    Multi-Task Feature Learning for Knowledge Graph Enhanced 1.框架 MKR是一个通用的.端对端深度推荐框架, 由三个主要部分组成:推荐模块.KG ...

  7. 自监督论文阅读笔记DisCo: Remedy Self-supervised Learning on Lightweight Models with Distilled Contrastive

    "DisCo: Remedy Self-supervised Learning on Lightweight Models with Distilled Contrastive Learni ...

  8. 【自监督论文阅读笔记】Contrastive Self-Supervised Learning With Smoothed Representation for Remote Sensing

    在遥感中,随着时间的推移不断积累大量未标记的图像,很难对所有数据进行标注.因此,一种可以使用未标记数据提高识别率的自监督学习技术将对遥感有用.这封信介绍了 基于 SimCLR 框架的 遥感平滑表示的 ...

  9. (论文阅读笔记1)Collaborative Metric Learning(二)(WWW2017)

    三.协同度量学习 这一部分,我们讨论CML作为一种更自然的方法获得关联关系.CML的思路是这样的:我们在已知正例关系的user-item集合S\mathcal{S}上建立一个隐性反馈模型,并且学习us ...

  10. 【论文阅读笔记】A Multi-Task Learning Formulation for Predicting Disease Progression

    Jiayu Zhou, Lei Yuan, Jun Liu, Jieping Ye   KDD2011 本文提出一种预测Alzheimer'sDisease (AD)老年痴呆症的cognitive s ...

最新文章

  1. python_字符串有时可以比较大小哦!
  2. 重构:一项常常被忽略的基本功
  3. cucumber_java从入门到精通(5)使用maven创建cucumber_java项目
  4. 程序员辞职卖卷饼:4天挣1个月工资!摆摊真那么赚钱?
  5. ESP8266之2M脚本
  6. Idea中启动tomcat服务,提示缺少一个tcnative-1.dll文件
  7. [BUUCTF-pwn]——[Black Watch 入群题]PWN
  8. c语言通讯录运行结果,自己改编的通讯录,运行不行啊
  9. 5G产业最新投资机会,25页PPT
  10. myeclipse自定义java注释
  11. centos 6.5 x64 上安装mariadb10
  12. WPF常用TriggerAction用法 (一)
  13. 2020年12月编程语言排行榜
  14. 科研实习 | 清华大学交叉信息研究院弋力老师招收三维视觉科研实习生
  15. 大规模网络拓扑测量与分析研究1-论文
  16. Hadoop Ha集群配置
  17. 宇宙浏览器汉化版——Universe
  18. 舆情监测系统软件如何选择及系统作用详介
  19. 软件泛指计算机运行,广义地讲,软件泛指计算机运行所需的各种数据、及与之相关的文档资料...
  20. js 取色器和 颜色拾取工具

热门文章

  1. 使用Apple第三方登录Java版
  2. 代码随想录第十五天 二叉树层序遍历 226、101
  3. 计算机内存和显卡,电脑显卡和内存怎么看
  4. Qt3升至Qt4需要注意的几件事项浅谈
  5. 计算机视频追踪方向,基于深度学习的目标视频跟踪算法综述
  6. 计算机的硬盘有几个区,电脑固态硬盘需要分区吗 分几个区比较好?
  7. 计算机桌面图标乱码,电脑软件上的文字变乱码怎么办?怎么修复?
  8. memery leak
  9. 使用Python实现淘宝订单定时付款
  10. mysql数据查询(DQL)