嘿,记得给“机器学习与推荐算法”添加星标


互联网出现不久,推荐系统就诞生了,相关技术在学术界和工业界得到了广泛的研究和应用。目前,推荐系统已经成为最成功的网络应用之一,通过推荐不同种类的内容来为数十亿人服务,包括新闻资讯、视频、电子商务产品、音乐、电影、书籍、游戏、朋友、工作等。这些成功的案例证明,推荐系统可以将大数据转移成高价值。本文从两个方面简要回顾了推荐系统的发展历程:(1)推荐模型,(2)典型推荐系统的架构。之前我们整理了近30年关于推荐模型的发展历史可参考一文尽览推荐系统模型演变史(文末可下载),另外关于中国推荐系统发展历史可参考那些用推荐引擎改变世界的人。我们希望这个简短的回顾能够帮助了解网络推荐系统的进展,并且这些点在未来会以某种方式连接起来,从而激励建立更先进的推荐服务进而改变世界。

1992年,Belkin等人分析和比较了信息过滤和信息检索,其中信息检索是搜索引擎的基石,而信息过滤则是推荐系统主要利用的技术。同年,Goldberg等人提出了Tapestry系统,这是第一个通过人的评价来实现的基于协同过滤的信息过滤系统。受此启发,麻省理工学院(MIT)和明尼苏达大学(UMN)的一些研究人员开发了新闻推荐服务,命名为GroupLens,其关键部分是基于用户的协同过滤模型。John Riedl教授在UMN创立了一个研究实验室,也命名为GroupLens,是推荐系统研究的先驱。对于音乐和视频,类似的推荐技术已经分别被Ringo系统和视频推荐所应用。伴随着电子商务的兴起,业界意识到了推荐的商业价值。Net Perceptions是第一家专注于提供营销推荐引擎的公司,成立于1996年。其客户包括亚马逊、百思买和JC Penney等。Schafer等人从界面、推荐模型和用户输入等三个方面分析了六个网站,解释了推荐系统是如何帮助电子商务网站增加销售的。此后,学术研究和工业实际应用成为推荐系统技术进步的两架马车。1997年秋天,GroupLens研究实验室启动了MovieLens项目,用EachMovie数据集训练了第一版推荐模型。此后,在1998年至2019年期间,多个MovieLens数据集不断被发布,并成为推荐系统研究中最受欢迎的数据集之一。

从推荐模型的角度来看,协同过滤技术在2005年之前主导了推荐系统的应用和研究,如基于用户的协同过滤,基于项目的协同过滤和基于奇异值分解的协同过滤。在2006年至2009年期间,受Netflix奖金的激励,矩阵分解模型得到了广泛的研究-推荐系统之矩阵分解家族。在同一时期,一些研究人员开始提出非正式的论点,认为对推荐系统的评价应该从传统的准确性指标转向以用户为中心的评价。

由于推荐系统的基础研究和商业应用的快速发展,推荐社区决定于2007年在UMN举办第一届推荐系统会议ACM RecSys,关于今年年会的论文整理可参考RecSys2022推荐系统论文集锦。目前,RecSys已经成为专注于推荐系统研究的最重要的年度学术会议之一。同年,Richardson等人提出了一个逻辑回归模型,该模型在点击率估计方面的误差实现了30%的降低。此后,LR模型从不同方面不断改进,包括优化方法、自动特征工程等。2010年,Rendle提出了结合支持向量机和因子模型优势的因子分解机FMs。在FMs的基础上,Juan等人提出了域感知的因子分解机,该模型在对每个特征对的权重进行建模时考虑了特征的字段。同时,越来越多的研究关注推荐系统中的用户体验问题。Pu等人提出了一个以用户为中心的推荐系统评估框架;Konstan和Riedl对推荐系统研究从单纯的算法研究到集中于用户体验的研究的演变提出建议。

自2016年以来,基于深度神经网络的推荐模型在学术界和工业界得到了广泛关注。在工业推荐模型方面,Wide&Deep和DeepFM模型已经被部署用于改进应用推荐。YouTubeDNN和correct-sfx被用于提高视频推荐的准确性。DIN和DIEN被提出来用于对用户兴趣等序列信息进行建模,并采用了注意力机制。Wang等人提出了DCN和DCN V2来自动有效地学习有界度的预测性特征交互。在学术界,研究人员也提出了重要的深度推荐模型,如FNN、PNN、NeuralCF、NFM、CVAE。为了解决推荐模型研究中的可复现性问题,研究人员开发了一个用于CTR预测的开放基准,命名为FuxiCTR。Sun等人为基于隐式反馈的top-N推荐算法创建了基准,如可重复的和公平的评价指标。还有一些其他的开源推荐模型,很大程度上推动了推荐系统研究的进展。

近年来,为了解决推荐系统中的偏差问题,对因果推理启发推荐的研究越来越多-最新综述 | 基于因果推断的推荐系统。Schnabel等人提供了一种通过适应因果推理的模型和估计来处理选择偏差的方法。Thorsten在2018年教授了一门名为反事实机器学习的课程。大部分课程内容都是基于信息检索和推荐系统的例子。在本文中,我们并不试图对推荐系统的所有方面进行全面回顾,如人机交互、评估、隐私、攻击、用户体验、公平等。关于这些相关的研究课题,已经有了一些详细的综述。在本文中,主要回顾了实用的推荐模型和典型推荐系统的架构,并简要地讨论了关于未来推荐系统的一些想法。

关于更多细节可阅读原文:

https://arxiv.org/abs/2209.01860


欢迎干货投稿 \ 论文宣传 \ 合作交流

推荐阅读

深度总结 | 推荐算法中的特征工程

最新综述 | 基于因果推断的推荐系统

论文周报 | 推荐系统领域最新研究进展

由于公众号试行乱序推送,您可能不再准时收到机器学习与推荐算法的推送。为了第一时间收到本号的干货内容, 请将本号设为星标,以及常点文末右下角的“在看”。

喜欢的话点个在看吧

推荐系统模型发展简史相关推荐

  1. 八大编程知名编程语言或系统的发展简史

    知名编程语言或系统的发展简史 一.B语言 B语言之父:Ken Thompson(肯.汤普森).B语言是贝尔实验室开发的一种通用的程序设计语言,它是于1969年前后Ken Thompson(肯.汤普森) ...

  2. 推荐系统的发展与简单回顾

    文章来源于浅梦的学习笔记,作者Jiayue Cai " 本文结合百度和支付宝两段推荐系统相关的实习经历,针对工业界的模型发展做了简单梳理与回顾,涵盖表示学习,深度学习,强化学习知识图谱以及多 ...

  3. AI技术说:人工智能相关概念与发展简史

    作为近几年的一大热词,人工智能一直是科技圈不可忽视的一大风口.随着智能硬件的迭代,智能家居产品逐步走进千家万户,语音识别.图像识别等AI相关技术也经历了阶梯式发展.如何看待人工智能的本质?人工智能的飞 ...

  4. 【人工智能】发展简史 | 复习笔记

    人工智能发展简史 人工智能主要学派 功能主义(符号主义) 又称为逻辑主义.心理学派或计算机学派.其原理为:物理符号系统(即符号操作系统)假设和有限合理性原理.起源于数理逻辑/逻辑推理.学派代表如纽厄尔 ...

  5. 计算机信息处理技术的发展历程,中文信息处理技术发展简史.docx

    中文信息处理技术发展简史 张华平 (中国科学院计算技术研究所软件实验室北京100080) E-mail: zhanghp@sof[ware? Homepage: ; hMp://pipy_ 摘要:真正 ...

  6. 【人工智能】人工智能发展简史 | 复习笔记

    人工智能发展简史 人工智能基本概念 "人工智能" 是相对于"人类智能" 而言的,"人类智能"是"人工智能"的原型:&qu ...

  7. 【转载】人工智能发展简史

    网络查阅资料时候,看到的对人工智能发展简史,较为完整的讲述,故转载,仅供学习使用,原文链接:https://www.aminer.cn/ai-history.侵删. 人工智能到底是什么?通常来说,人工 ...

  8. 计算机网络之概述、发展简史、层次结构设计、网络拓扑、性能指标

    目录 一.什么是计算机网络: 计算机网络的分类 二.计算机网络的发展简史 互联网的发展历史: 我国互联网的发展历史: 三.层次结构设计的基本原则 层次结构设计的基本原则: ​编辑 OSI七层模型: T ...

  9. 软工导第一节课 计算机软件工程学作一个简短的概述,回顾计算机系统发展简史 软件工程的基本原理和方法有概括的本质的认识,详细讲解生命周期相关知识讲解8种典型的软件过程模型

    文章目录 软件危机 软件的定义 软件危机典型表现 产生软件危机的原因 消除软件危机的方法 软件工程 什么是软件工程 软件工程的本质特征 软件工程的基本原理 软件工程方法学 传统方法学 面向对象方法学 ...

最新文章

  1. 样式集(一) 通用商品列表样式
  2. pytorch 指定层学习率
  3. Xcode 修改系统的代码块样式 Code Snippet
  4. 《FlaskWeb开发:基于Python的Web应用开发实战》笔记
  5. PowerDesigner导出表为Excel(转)
  6. opencv配置原理
  7. Git下使用Beyond Compare作为比较和合并工具
  8. 怎么自学python-如何学习好Python这门课程?老男孩Python培训全套视频
  9. MySQL数据库介绍
  10. chrome/firefox插件ie tab,解决无法使用网银的问题
  11. 百度杯全国网络攻防大赛——初来乍到
  12. Safari浏览器兼容性问题处理
  13. Video.js使用教程一(详解)
  14. pytest框架之fixture测试夹具详解
  15. hash算法概念和hash加盐法
  16. ansible:变量调用set_fact和register
  17. 局域网搭建php_phpstudy8.0版本怎么搭建局域网
  18. C语言的转义字符,八进制
  19. 单线程顺序爬取图片以及对应的标签
  20. 工信部:禁止外资参与网络出版 外国游戏国内要玩完

热门文章

  1. Qt —— QVector
  2. mysql .net 乱码_.net mysql中文乱码解决办法
  3. 8 - 机器学习中的噪音与错误(Noise and Error)
  4. torch中datasets.load_dataset用法
  5. Excel2000/XP和PowerPoint2000/XP下内部COM插件的实现
  6. 身无分文怎么赚钱,分享个赚钱小故事!
  7. 回归分析的计算机实践实验,山东农业大学XS080011-数据分析实验
  8. 【C/C++小游戏】见缝插针(EasyX 图形库)
  9. 光学取景屏跑焦_光学取景器和电子取景器有什么区别?
  10. 一种LED吸顶灯关灯后微量的故障解决办法