题目

Conversational Recommender System

简介

在这篇文章中,作者提出了一个将推荐和对话合并的统一的深度强化学习框架(framework)从而建立个性化的对话推荐代理,在进行评分预测和生成推荐时,该模型使用用户过去的评分和当前会话中收集到的用户查询。这样的对话系统通常试图通过提问来收集用户偏好,一旦收集到足够多的用户偏好,它就会向用户做出个性化的推荐。我们进行了模拟实验和真实的在线用户研究,以证明该框架的有效性

why

个性化的对话系统一般有很大的商业潜力,然而这方面的研究非常有限,现有的解决方案要么基于单轮自组织搜索引擎,要么基于传统的多轮对话系统。它们通常只利用当前会话中的用户输入,而忽略用户的长期偏好;另一方面,众所周知,基于推荐系统可以大大提高销售转化率,该系统基于过去的购买行为学习用户偏好,并优化面向业务的指标,如转化率或预期收入

what

本文的系统有三个主要部分

首先,自然语言理解(NLU)模块,用于分析每个用户话语,跟踪用户的对话历史,并不断更新用户的意图。这个NLU模块的重点是提取item特定的元数据

第二,本文提出了一个对话管理(DM)模块,它决定在给定当前状态下采取哪种操作。该数据挖掘模块具有专门为此任务定义的操作空间

第三个组件是自然语言生成模块,用于生成对用户的响应。该框架使我们能够构建一个对话式搜索和推荐系统,该系统可以决定何时以及如何从用户那里收集信息,并基于用户过去的购买历史和当前会话中的上下文信息做出推荐

对于NLU模块,本文训练深度信念跟踪器来基于上下文分析用户的当前话语,并从用户话语中提取目标item的方面值。它的输出表示为一个用户查询,用于更新当前的用户意图,它是关于目标的一组facet-value pairs。对话管理器和推荐系统都将使用用户查询

对于数据挖掘模块,本文训练了一个深度策略网络,在给定当前用户查询和推荐系统学习到的长期用户偏好的情况下,该网络决定在每个回合采取哪个动作,该动作可以是向用户询问关于特定方面的信息或者推荐产品列表,深度策略网络选择在整个对话会话中使预期回报最大化的操作(当收集的用户查询足以识别用户的信息需求时,最佳动作通常是为用户推荐个性化的项目列表;当收集的用户查询不充分时,最佳的行动通常是要求更多的信息)

how

针对如何解决建立会话式推荐系统的问题,本文的框架有三个组成部分:Belief Tracker、推荐系统和策略网络


  • Belief Tracker
    在时间步t的用户话语e(t),Belief Tracker的Input是n-gram向量z(t),z(t)的维数是n-gram词汇的大小

    接下来,直到当前时刻t的n-grams序列由LSTM网络编码成向量h(t),然后被送到softmax激活层以被转换成概率分布:

    在每一轮中,所有的f相互连接,形成当前会话中对话状态的当前信念
  • Recommender System
    U表示用户,I表示项目。对于数据集中的M个用户和n个项目,用户和项目表示为集合:{u1,u2,…,uM}和{i1,i2,…,iN}。输入特征x是one-hot编码的用户/项目向量,而dialogue belief是

    输出ym,n可以是显式反馈的评分,也可以是隐式反馈的0-1标量。本文使用双向(K = 2)调频:

    本文首先取每个aspect belief的argmax,每个aspect中取一个,随后这些值组合形成了一个新的分布,概率是l值概率的乘积。然后我们保留最可能的组合,并使用它们的方面值从整个项目集中检索项目,检索到的项目形成候选集。然后,本文使用训练好的模型根据候评分对它们进行重新排序
  • Deep Policy Network
    现在描述用于管理会话系统的深度策略网络。在每个回合,强化学习模型根据对话状态选择一个动作,以获得最大的长期回报。本文采用了强化学习的策略梯度法,可以直接学习一个策略,不需要参考价值函数,强化学习具有状态S、动作A、奖励R和策略π(a|s)的基本成分

Conclusion

本文提出了一个统一的框架,将推荐系统和对话系统技术集成在一起,构建一个智能对话推荐系统。在这个框架下,明确定义了agent动作空间和用户状态。随着会话代理与用户通信并从用户处收集更多信息,agent的状态(即用户信息需求或用户查询的可信度)被表示并不断更新为半结构化数据

agent采取行动并提供信息来优化长期奖励,例如更高的成功率、更短的回合或延迟的奖励,而不是只返回给当前用户查询的最高排名结果的贪婪方法。在推荐系统研究的基础上,本文还引入了会话系统的奖励函数。可以了解在强化学习的每一步,哪个动作可以使基于会话的奖励最大化。它学会根据需要收集face value,并在适当的时候直接提出建议

论文-《Conversational Recommender System》相关推荐

  1. 经典DL论文研读(part4)--ImageNet Classification with Deep Convolutional Neural Networks

    学习笔记,仅供参考,有错必纠 文章目录 ImageNet Classification with Deep Convolutional Neural Networks 摘要 Introduction ...

  2. 《每日论文》ImageNet Classification with Deep Convolutional Neural Networks

    这篇论文是剖析 CNN 领域的经典之作,也是入门 CNN 的必读论文.作者训练了一个面向数量为 1.2 百万的高分辨率的图像数据集 ImageNet, 图像的种类为 1000 种的深度卷积神经网络. ...

  3. AlexNet论文翻译(中英文对照版)-ImageNet Classification with Deep Convolutional Neural Networks

    图像分类经典论文翻译汇总:[翻译汇总] 翻译pdf文件下载:[下载地址] 此版为中英文对照版,纯中文版请稳步:[AlexNet纯中文版] ImageNet Classification with De ...

  4. ImageNet Classification with Deep Convolutional Neural Networks论文翻译——中文版

    文章作者:Tyan 博客:noahsnail.com  |  CSDN  |  简书 翻译论文汇总:https://github.com/SnailTyan/deep-learning-papers- ...

  5. 论文《ImageNet Classification with Deep Convolutional Neural Networks》阅读及AlexNet的Tensorflow2复现

    论文<ImageNet Classification with Deep Convolutional Neural Networks>阅读及AlexNet的Tensorflow2复现 论文 ...

  6. ImageNet Classification with Deep Convolutional Neural Networks论文翻译——中英文对照

    文章作者:Tyan 博客:noahsnail.com  |  CSDN  |  简书 翻译论文汇总:https://github.com/SnailTyan/deep-learning-papers- ...

  7. 论文研读 —— 6. ImageNet Classification with Deep Convolutional Neural Networks (1/3)

    文章目录 Authors and Publishment Authors Bibtex Abstract 1. Introduction 2. The Dataset Authors and Publ ...

  8. 《ImageNet Classification with Deep Convolutional Neural Networks》翻译

    1 引言 2 数据集 3 架构 3.1 ReLU 非线性 3.2 训练多个GPU 3.3 局部响应归一化 3.4 重叠池化 3.5 整体架构 4 减少过拟合 4.1 数据增强 4.2 Dropout ...

  9. 论文研读 —— 6. ImageNet Classification with Deep Convolutional Neural Networks (2/3)

    文章目录 3. The Architecture 3.1. ReLU Nonlinearity 3.2. Training on Multiple GPUs 3.3. Local Response N ...

  10. 论文研读 —— 6. ImageNet Classification with Deep Convolutional Neural Networks (3/3)

    文章目录 6. Results 6.1. Qualitative Evaluations 7. Discussion References 6. Results Our results on ILSV ...

最新文章

  1. Java数字包装类基本程序,Java基本数据类型包装类
  2. Jasypt 加密-引言
  3. mysql日期处理的一些实现
  4. ACCESS 文本文件导入和导出指定字段类型的方法
  5. Linux下创建Oracle的实例
  6. 《架构系列四:一键部署应用到Tomcat集群中》
  7. ios 安装OpenFire
  8. Momentum(动量/冲量)的理解及应用
  9. 关于Go语言,你不得不知的并发模式
  10. DFS-分布式文件系统对比
  11. 从零开始学《离散数学》-电子科技大学
  12. 2022年全球与中国磁阻随机存储器(MRAM)市场现状及未来发展趋势
  13. [RK3399][Android7.1] 移植笔记 --- 9.7寸eDP显示屏添加
  14. C#,深度好文,精致好码,文本对比(Text Compare)算法与源代码
  15. 时间序列预测方法及多步预测方法汇总
  16. Oracle查询语句练习(一)
  17. 全网最硬核 JVM TLAB 分析(单篇版不包含额外加菜)
  18. scrapy微博反爬虫_Scrapy 爬取新浪微博(解析api)
  19. 国际网页短信后台定制源码搭建软件平台定制-移讯云短信系统
  20. 怎么把HTML文件拉出来,怎么把网页HTML格式的文件

热门文章

  1. html及css中页面总宽度的代码,css 宽度(CSS width)
  2. 【期货期权】11月12日午盘盘面及涨跌逻辑解析
  3. 项目系统设计和数据库设计(追光的人)
  4. 台式机通过网线连接笔记本的wifi网络
  5. 服务器winsxs文件夹怎么清理工具,如何清理Win7系统winsxs文件夹中的垃圾?
  6. springboot使用xxl-job
  7. 为什么您没有得到最好的承包商,您将如何做(第2部分)
  8. 永远的七日之都服务器维护,永远的7日之都5月23日更新内容 七日之都5.23更新公告...
  9. 自动组卷系统C语言,自动组卷系统的设计与实现
  10. 计算机管理 压缩卷,windows10系统下c盘压缩卷只能压缩一半如何解决