Garcia-Molina等【1】指出,搜索和推荐中的根本问题是识别满足用户信息需求的信息对象。还表明搜索(信息检索)和推荐(信息过滤)是同一枚硬币的两个方面,具有很强的联系和相似性【2】。图1.1说明了搜索和推荐的统一匹配视图。共同的目标是向用户提供他们需要的信息。

图1.1:搜索和推荐中匹配的统一视图

搜索是一项检索任务,旨在检索与查询相关的文档。相反,推荐是一项过滤任务,旨在过滤出用户感兴趣的物品【3】。这样,搜索可以被认为是在查询和文档之间进行匹配,而推荐可以被认为是在用户和项目之间进行匹配。更正式地说,搜索和推荐中的匹配都可以视为构建匹配模型f:X×Y →R,该模型计算两个输入对象x和y之间的匹配程度,其中X和Y表示两个对象空间。 X和Y是搜索中查询和文档的空间,或推荐中用户和项目的空间。

在图1.1的统一匹配视图下,我们使用信息对象一词来表示要检索/推荐的文档/项目,并使用信息来表示相应任务中的查询/用户。通过在匹配和比较现有技术的同一观点下统一这两个任务,我们可以为问题提供更深刻的见解和更强大的解决方案。而且,统一这两个任务也具有实际和理论意义。

搜索和推荐已经在一些实际应用中结合在一起。例如,在某些电子商务站点中,当用户提交查询时,不仅基于相关性(查询产品匹配),而且还基于用户兴趣(用户产品匹配)显示产品的排名列表。在某些生活方式应用中,当用户搜索餐厅时,将根据相关性(查询-餐厅匹配)和用户兴趣(用户-餐厅匹配)返回结果。明显的趋势是,在某些情况下,搜索和推荐将集成到单个系统中,以更好地满足用户的需求,而匹配在其中起着至关重要的作用。

搜索和推荐已经具有许多共享技术,因为它们在匹配方面很相似。在匹配的基础上,可以通过使用推荐技术【4】解决问题,反之亦然【5】。随着深度学习技术的使用,用于搜索和推荐的匹配模型在架构和方法上更加相似,这体现在这些技术上:将输入(查询,用户,文档和项目)嵌入为分布式表示,结合神经网络组件来表示匹配函数,并以端到端的方式训练模型参数。此外,如果搜索和推荐共享相同的信息对象集(如上述电子商务网站和生活方式应用的示例),则可以联合建模和优化【6】【7】【8】。

参阅 《Current challenges and visions in music recommender systems research》阅读笔记

因此,为了开发更先进的技术,有必要并且有利的是采用统一的匹配视图来分析和比较现有的搜索和推荐技术。搜索和推荐中的匹配任务在实践中面临着不同的挑战。但是,根本的问题本质上是相同的,就是难以精确匹配的挑战。接下来,我们分别介绍这两个任务的主要挑战。

引文

【1】Garcia-Molina, H., G. Koutrika, and A. Parameswaran (2011). “In- formation seeking: Convergence of search, recommendations, and advertising”. Communications of the ACM. 54(11): 121–130.

【2】Belkin, N. J. and W. B. Croft (1992). “Information filtering and infor- mation retrieval: Two sides of the same coin?” Communications of the ACM. 35(12): 29–38.

【3】Adomavicius, G. and A. Tuzhilin (2005). “Toward the next generation of recommender systems: A survey of the state-of-the-art and possible extensions”. IEEE Transactions on Knowledge and Data Engineering. 17(6): 734–749.

【4】Zamani, H., J. Dadashkarimi, A. Shakery, and W. B. Croft (2016). “Pseudo-relevance feedback based on matrix factorization”. In: Pro- ceedings of the 25th ACM International on Conference on Informa- tion and Knowledge Management. CIKM ’16. Indianapolis, IN, USA: ACM. 1483–1492.

【5】Costa, A. and F. Roda (2011). “Recommender systems by means of in- formation retrieval”. In: Proceedings of the International Conference on Web Intelligence, Mining and Semantics. WIMS ’11. Sogndal, Norway: ACM. 57:1–57:5.

【6】Schedl, M., H. Zamani, C.-W. Chen, Y. Deldjoo, and M. Elahi (2018).“Current challenges and visions in music recommender systems research”. International Journal of Multimedia Information Retrieval. 7(2): 95–116.

【7】Zamani, H. and W. B. Croft (2018a). “Joint modeling and optimization of search and recommendation”. In: Proceedings of the First Biennial Conference on Design of Experimental Search & Information Re- trieval Systems. DESIRES ’18. Bertinoro, Italy: CEUR-WS. 36–41. url: http://ceur-ws.org/Vol-2167/paper2.pdf.

【8】Zamani, H. and W. B. Croft (2020). “Learning a joint search and rec- ommendation model from user-item interactions”. In: Proceedings of the 13th International Conference on Web Search and Data Min- ing. WSDM ’20. Houston, TX, USA: Association for Computing Machinery. 717–725.

c++两个文档匹配数据_《搜索和推荐中的深度匹配》——1.2 搜索和推荐中匹配统一性...相关推荐

  1. pgsql处理文档类型数据_【干货总结】:可能是史上最全的MySQL和PGSQL对比材料

    关于SQL特性支持情况的对比,可以参考:http://www.sql-workbench.net/dbms_comparison.html 9. 主从复制安全性 PGSQL 同步流复制.强同步(rem ...

  2. 比较两个文档的相似程度_您的文档对读者的友好程度如何?

    比较两个文档的相似程度 有成就的技术作家所要做的首要任务是为观众写作. 这个任务听起来很简单,但是当我想到世界各地的人们时,我想知道:他们能阅读我们的文档吗? 可读性已经研究了多年,接下来是对研究成果 ...

  3. 文档词频矩阵_如何通过词向量技术来计算 2 个文档的相似度?

    作者:吴俣https://www.zhihu.com/question/33952003/answer/135089460 Deep Learning 派系:(1)最简单的就是两个句子分别过一个CNN ...

  4. 如何计算两个文档的相似度(一)

    下面的内容转自我爱自然语言处理博客,感谢博主,学到很多东西. 原文链接:http://www.52nlp.cn/%E5%A6%82%E4%BD%95%E8%AE%A1%E7%AE%97%E4%B8%A ...

  5. 复旦大学张奇组:对话摘要数据不足?对话数据、文档摘要数据,我全都要!...

    ©PaperWeekly 原创 · 作者 | 刘兴贤 学校 | 北京邮电大学硕士生 研究方向 | 自然语言处理 这篇文章发表在 EMNLP 2021,是复旦大学张奇老师组的工作.本文尝试解决的问题是对 ...

  6. 文档词频矩阵_论文理解:从词嵌入到文档距离

    论文作者简介 本论文第一作者Matt J. Kusner是牛津大学的副教授,致力于设计适应现实世界问题需求的新机器学习模型(例如,fair algorithms, discrete generativ ...

  7. word文档的数据损坏如何进行修复

    本文章介绍的Office文档的数据恢复的原理和程序设计方法,都来源于对Office文档结构的分析.如果对Office文档的结构进行更深入的研究,将会发现更好的修复方法, 从而挽救更多的数据,并有可能开 ...

  8. python 合并word内容_python如何合并两个文档内容

    1.两个文档合并之前 2.合并两个文件的代码:file1 = open("name,tel.txt", "rb") file2 = open("nam ...

  9. Git提交到多个远程仓库(多看两个文档)

    Git提交到多个远程仓库(多看两个文档) 一.总结 一句话总结: 二. Git提交到多个远程仓库(多看两个文档) 有两种做法,先看第一种 一.通过命令行进行操作 例如我有下面两个仓库: Mybatis ...

  10. python3 chm文档下载_python3.7.0官方参考文档 最新api文档 chm_Python教程_源雷技术空间...

    资源名称:python3.7.0官方参考文档 最新api文档 chm 1.新语法特性: PEP 563, 推迟评估类型注释 2.向后不兼容语法更改: async 和 await 现在保留关键字 3.新 ...

最新文章

  1. 一键添加JAVA环境变量
  2. 介绍Windows Server服务器角色、角色服务和功能
  3. linux脚本 逻辑运算,Linux-shell-逻辑运算和;
  4. java- WatchService监控
  5. 极狐(GitLab)宣布获数亿元A轮融资,将加速推动中国开源DevOps生态
  6. 项目期复习:JS操作符,弹窗与调试,凝视,数据类型转换
  7. 第四百零四天 how can I 坚持
  8. 002-JavaScript基本应用
  9. [数据库]Bulk Insert命令详细
  10. 铃木雅臣晶体管电路设计学习笔记1
  11. 免费商用无版权素材 免费图库 抠图 PNG 插画素材
  12. linux常用的引导管理器,Linux引导管理器GRUB、GRUB 2和LILO简介
  13. 国产计算机系统哪个好,5大国产手机操作系统分析评测,你更中意谁?
  14. cv2.error: OpenCV(4.5.1) C:\Users\appveyor\AppData\Local\Temp\1\pip-req-buil windows下的解决方案
  15. 山地剝 (易經大意 韓長庚)
  16. 阿里云服务器(Windows)如何远程连接?
  17. 5W30和5W40原来的区别这么大!
  18. 不同坐标系下3D bbox通过中心点坐标和长宽高求8个角点问题
  19. 史上最简单的SpringCloud教程 | 第九篇: 服务链路追踪(Spring Cloud Sleuth)(Finchley版本)
  20. rnss和rdss的应用_浅谈北斗二代RDSS和RNSS组合技术.doc

热门文章

  1. 青岛Uber优步司机奖励政策(9月14日~9月20日)
  2. 一台服务器多个oracle启动
  3. HDOJ2000(ASC||码排序)【sort函数】
  4. yum配置(源配置-光驱,ftp服务器;基本用法)
  5. 很详细的硬盘基础知识
  6. 关于SOA您该知道却不愿知道的十件事
  7. 广州.Net俱乐部第二次聚会报道
  8. SpringBoot第八篇:整合MyBatis-Generator
  9. Mybatis Plus启动注入 SQL 原理分析
  10. 运行mvc项目报错 %@ Application Codebehind=Global.asax.cs Inherits=NHAPPAPI.MvcApplication Language=C...