互联网彻底改变了我们的购物方式。只需点击搜索按钮,数以千计的相关商品便会立即弹出来。在这个过程中,无论我们是否意识到,我们都正在使用 推荐系统(Recommendation System,RS)。

推荐系统无处不在,当我们在淘宝或京东上购买家电时,在携程上搜寻旅店时,在微博上浏览相片时,我们都在使用推荐系统,并同时在为推荐算法做出贡献。

01

推荐系统到底是什么?

简单地说,推荐系统是一种信息过滤工具,可以利用整个社区的用户画像和习惯给特定用户呈现其可能感兴趣的最相关内容。

一个有效的推荐系统包含三个主要功能:

• 克服信息过载问题

随着互联网上信息的爆炸式增长,用户不可能浏览所有的内容。推荐系统可以过滤掉低价值的信息,从而节省用户的时间。

• 提供定制化推荐

具有特定偏好的用户通常难以找到他们喜爱的商品。推荐系统应该帮助用户更好地根据自己的品味找到真正感兴趣的商品。

• 合理利用资源

根据长尾效应,最受欢迎的商品吸引了最多的注意力,而不那么受欢迎的商品,也就是其他大部分商品,将很少有人光顾。这是一种极大的资源浪费。推荐系统应该平衡受欢迎程度和实用性,让人们对这些不那么受欢迎的商品给予更多关注。

一个高效的推荐系统对平台和公司都有好处。用户更有可能根据他们的偏好来点击或购买被推荐的商品,并且会重新访问那些更了解他们的网站。总之,推荐系统在各种信息检索系统中都发挥着至关重要的作用,可以促进业务的发展和决策的制定。

然而,在推荐系统中,仍然有许多尚未解决的问题,冷启动用户数据隐私是其中的两个主要问题。

用联邦学习同时解决这两个问题是可行的。假设我们正通过联邦学习,用多方数据来训练一个全局模型。

  • 对于冷启动问题,我们可以从其他参与方借鉴相关信息和知识,以帮助对新商品进行评分或对新用户进行预测。

  • 对于数据隐私问题,用户的私有数据被保存在客户端设备中,只有更新的模型才会通过安全协议上传。

  • 此外,联邦学习将模型的学习过程分布到各个客户端上,大大降低了中央服务器的运算压力。

02 推荐模型

在详细介绍联邦推荐系统之前,我们首先介绍现有的推荐模型。

一般来说,推荐模型可以分为四种:协同过滤、基于内容的推荐系统、基于模型的推荐系统和混合推荐系统。

1. 协同过滤(Collaborative Filtering,CF)

它通过对用户与商品的历史互动进行建模来实现推荐。也就是说,基于用户-商品矩阵,协调过滤会给同一位用户推荐类似的商品,或者给类似的用户推荐同一商品。然而,在实际生活中,每一位用户通常只会与几件商品有交互,这使得用户——商品矩阵高度稀疏。低秩因子分解方法(Low-rank factorization),也称为矩阵因子分解,已被证明是解决稀疏性问题的一种有效方法。

2. 基于内容的推荐系统(Content-based Recommendation System)

它对商品的描述和用户的画像进行匹配来进行推荐。其核心思想是,如果一位用户喜欢一件商品,也会喜欢相似的商品。在基于内容的推荐系统里,商品由若干个关键词进行标记,而用户画像由描述该用户喜欢的商品种类的关键词组成。模型通过关键词对齐方法,推荐商品描述与用户画像相匹配的商品。

3. 基于模型的推荐系统(Model-based Recommendation System)

它使用机器学习和深度学习技术,对用户——商品关系进行直接建模。该方法有若干优点:与前两种线性方法相比,这种方法适用于对非线性关系进行建模;深度学习模型可以学习文本、图像及音频等异构信息的潜在表征,从而得到更好的推荐模型;RNN 等深度学习模型能够对序列数据进行处理,适用于如预测下一商品等序列模式挖掘任务。

4. 混合推荐系统(Hybrid Recommendation System)

它是指集成两个或多个推荐策略的模型,通常被认为是更有效的。一种简单的混合方法是,先分别进行基于内容过滤预测和协同过滤预测,再将二者的结果聚合在一起。以电影推荐为例,混合模型基于与被推荐用户相似的用户的电影观看和搜索记录(协同过滤),以及与被推荐用户喜欢的电影类似的电影(基于内容过滤),来为用户进行电影推荐。

03联邦推荐系统

这里使用联邦协同过滤作为例子,简要向大家描述一下联邦推荐系统是如何工作的。

假设一个电子商务公司想要训练一个协同过滤(CF)模型,让用户可以根据个人喜好和商品流行程度来找到想要的商品。由于数据的隐私安全问题等原因,无法直接收集到用户的原始数据,因此可以利用联邦学习训练协同过滤模型。

通常,一个协同过滤模型可以表示为,由多个用户因子向量(每个向量表示一个用户)组成的用户因子矩阵(user factor matrix)、由多个商品因子向量(每个向量表示一件商品)组成的商品因子矩阵 (item factor matrix) 的组合。联邦协同过滤由所有用户共同地学习这两个矩阵得到,如图中所示,包含以下五个步骤:

步骤1:  每一个客户 (例如,用户的本地设备) 从服务器下载全局商品因子矩阵。该矩阵可以是随机初始化的模型或预训练模型。

步骤2 : 每一个客户聚合显式数据和隐式数据。显式数据包括用户的反馈,例如对商品的评分和评论。隐式数据由用户订单历史、购物车清单、浏览历史、点击历史、搜索日志等信息组成。

步骤3: 每一个客户使用本地数据和全局商品因子矩阵对本地用户因子向量进行更新。

步骤4: 每一个客户使用本地数据和本地用户因子向量,计算全局商品因子矩阵的本地更新,并通过一个安全协议将更新上传至服务器。

步骤5: 服务器通过联邦加权算法(如联邦平均算法)聚合从各个客户端上传的本地模型更新。并使用聚合的结果对全局商品因子矩阵进行更新。之后,服务器将全局商品因子矩阵发送给各个客户。

上述过程是联邦协同过滤的一般情况。我们可以利用更强大的模型来代替协同过滤模型,如深度因子分解机(Factorziation Machine, FM)模型以进一步提高性能。

除了定制化的推荐任务,联邦推荐系统还可以利用来自不同参与方的不同特征提高推荐的精确度。

04挑战与展望

我们可以看到,研究人员在结合联邦学习和推荐系统等方面进行了一些创新性的研究工作,但这个领域仍有许多空白需要填补。

一个普遍的问题是:建立实用的隐私保护和安全的推荐系统需要什么?我们怎样才能建立这些系统?该问题可以进一步细分为几个具体的方面:如何在保护数据安全和隐私的同时,达到高准确度和低通信成本?我们应该选择哪种安全协议?哪种推荐算法更适用于联邦学习?

我们来探索一下未来可能的研究方向。

首先,不完整的数据会在多大程度上影响推荐系统的性能?换句话说,我们需要从用户那里收集多少数据,才能建立一个精准的推荐系统。

其次,传统的推荐器会利用用户的社交数据、时空数据等,然而目前还不清楚这些数据中哪一部分更有用。

最后,联邦学习框架与传统的推荐系统的设定有很大不同。因此,如何在联邦学习框架下,设计高效并且精确的推荐算法也是一项很有挑战性的研究工作。

05如何学习联邦学习

首部全面、系统论述联邦学习的中文著作 《联邦学习》 现已上市,可以作为广大学习者入门和探究联邦学习的第一本书!


更多科技资讯请见微信公众号:博文视点Broadview(微信号:bvbooks)

解决了!联邦学习+推荐系统,冷启动和数据隐私问题双双K.O相关推荐

  1. 联邦学习:保护用户数据隐私

    对数据保护通常是对数据做加密或移除敏感信息,但实际上即使移除了敏感信息,有足够多的真实的信息,还是可以通过算法是找到对应的人的,如: 卡内基梅隆大学的Latanya Sweeney的将匿名化的GIC数 ...

  2. 腾讯云大数据:神盾首创非对称联邦学习,深度保障数据隐私

    导语:在过去的几年中,我们见证了大数据及人工智能技术的飞速发展,许多机构却依旧苦于数据数量少.质量低等难题而无法将前沿理论商业化落地.助力像石油般宝贵的数据突破隐私保护的条框限制并实现其价值的流通,对 ...

  3. 在推荐系统中,我还有隐私吗?联邦学习:你可以有

    2020-11-19 15:38:41 机器之心分析师网络 作者:仵冀颖 编辑:H4O 在推荐系统无所不在的网络环境中,用户越来越强烈地意识到自己的数据是需要保密的.因此,能够实现隐私保护的推荐系统的 ...

  4. 【推荐系统】一文梳理联邦学习推荐系统研究进展

    推荐系统,对于我们来说并不陌生,它已经无时无刻不方便着我们的生活.学习.工作等方方面面,并且已经成为许多社交/购物/新闻平台中必不可少的组件.近些年来学术界以及工业界的研究者们已经对其进行了大量研究并 ...

  5. 联邦学习框架和数据隐私综述

    联邦学习 --新型的分布式机器学习技术. 一.联邦学习开源框架 1.联邦学习框架(按架构分类) 联邦学习常用的框架分为2种:中心化框架.去中心化框架,以中心化框架为主. 2.联邦学习的分类(按照参与方 ...

  6. 联邦学习攻击与防御综述

    联邦学习攻击与防御综述 吴建汉1,2, 司世景1, 王健宗1, 肖京1 1.平安科技(深圳)有限公司,广东 深圳 518063 2.中国科学技术大学,安徽 合肥 230026 摘要:随着机器学习技术的 ...

  7. 笔记︱联邦学习与隐私计算的案例集锦(一)

    文章目录 1 联邦学习与隐私计算 1.0 联邦学习背景 1.1 横向联邦学习(HorizontalFederatedLearning,HFL) 1.2 纵向联邦学习(VerticalFederated ...

  8. 联邦学习应用思考:需求还是方法?

    作者 | 徐葳 清华大学交叉信息研究院长聘副教授.华控清交首席科学家 前言: 目前,"联邦学习"这个术语在市场上存在很多认识上的误解和混淆,主要原因是其既在广义上表达了保护数据前提 ...

  9. 赠书 | 联邦学习如何在视觉领域应用?

    前言: 联邦学习是如何应用在视觉领域的?本文将通过一个获得了2020年AAAI人工智能创新应用奖的案例来向大家介绍. 本案例是联邦学习在视觉.物联网.安防领域的实际应用,对分散在各地的摄像头数据,通过 ...

  10. 联邦学习,为何而生?

    隐私数据是否早已泄露,而我们却毫无察觉? 随着大数据.边缘计算.大型云计算平台和各种开源框架的发展,机器学习等人工智能技术以前所未有的速度应用到各个行业,人工智能技术带来了新的挑战,数据的隐私和安全引 ...

最新文章

  1. Intel GPU及NVIDIA GPU对视频编解码支持情况
  2. 抚摸那条船——彭晓东
  3. git 2.30.1最新版本的使用
  4. 关于使用pietty或putty终端连接ubuntu虚拟机时报被拒绝连接问题
  5. 自然资源部标准地图底图转矢量Shapefile并配准
  6. 民间借贷红线大幅下调,二手车平台去金融化将成趋势?
  7. 使用Python生成ico文件
  8. 缓解焦虑,这9种食物必不可少!
  9. 服务器端给客户端发送消息,linux 服务器端给客户端发送消息
  10. 结合MVC.NET相关知识实现在线卖酒销售项目(一)
  11. 由浪潮8控存储登顶SPC-1所想,存储系统一个长期被忽略的指标
  12. html飞机大战游戏实验报告,飞机大战实验报告.docx
  13. SpringBoot拦截器或过滤器中使用流读取参数后,controller中注解读取不到参数
  14. ppt计算机软件制作流程,电脑怎么制作ppt步骤
  15. LOOP循环中不允许select single时候,如何处理
  16. DANN:利用神经网络算法评估变异位点的有害程度
  17. 给静态图片添加动态效果
  18. VMware ubuntu虚拟机的安装过程记录
  19. gocolly-字符串cookies处理(4)
  20. 浅谈设计模式之五——Adapter模式

热门文章

  1. openjdk8之编译和debug
  2. Xcode7.1模拟器卡顿问题以及解决方案
  3. bat实现监测计算机网络连接,断网自动重启网络连接
  4. ios中怎么样调节占位文字与字体大小在同一高度
  5. SDUT1500Message Flood(字典树)
  6. ASP.NET加密解密
  7. C# WinForm开发系列 - Form/Window
  8. javascript模拟抽奖
  9. (MathType)公式编号(1)和(2a)(2b)混编
  10. springboot系列二、springboot项目搭建