协同过滤分为  memory-based 和 model based

1. memory-based  利用用户物品之间相似度进行推荐

一种是 item-item 即喜欢这个物品的用户还喜欢..

一种是 user-item 即与你有相似爱好的用户还喜欢..

现在有个评分矩阵R,行表示用户,列表示物品,R(i,j)表示用户i对物品j的评分,R(:,j)表示所有用户对物品j的评分列,R(i,:)表示用户i对所有物品的评分行,用户与物品没有交互,评分自然为0,可以知道一般的矩阵R是稀疏的。

由user-item  计算每个用户的相似度,一般取(余弦相似度),即 cos(R(i,:),R(k,:)),  利用在sklearn中的模块很容易计算得到用户相似矩阵

from sklearn.metrics.pairwise import pairwise_distances
user_similarity = pairwise_distances(R, metric='cosine')

由item-item 计算每件商品相似度,

item_similarity = pairwise_distances(R.T, metric='cosine')

得到相似度就可以计算预测矩阵P, 即将用户与商品之间没有交互的R(i,j)赋上一个预测值

先考虑 item-item 我们可以知道如果物品m与某个物品b相似度较高,那么 与b有交互的用户k对b的评分会很接近于m,最简单的是m=b,那么评分相等,可以给出公式来预估k对m的评分,其中分母起到正则化的作用

用户k对物品m的评分预测:分子表示 物品m与其他所有物品b相似度 与 用户对其他物品b 的乘积 的和,相当于加权平均

考虑user-item  如果两个用户相似,自然他们对某个物品评分应该接近,但如果总有些用户a喜欢给物品评很高的分,这时候即使两个用户不相似,按照item-item 的公式,他们也能占到很高的权重,这就相当于一种干扰,一种噪声, 这样,对每个用户评分做一个平均,标准化

用户k对物品m的评分预测:   用户k对所有物品评分平均+   (用户k与其他所有用户a相似度 与 (其他用户a对m的评分-其他用户a对所有物品的平均评分)的加权和)/分母

这样我们就可以编写预测函数

def predict(R, similarity, type='item'):if type == 'user':mean_user_rating = R.mean(axis=1)# axis=1 计算每行rating_d = (R - mean_user_rating[:, np.newaxis]) #np.newaxis根据 R 调整矩阵prediction = mean_user_rating[:, np.newaxis] + similarity.dot(rating_d) / np.array([np.abs(similarity).sum(axis=1)]).Telif type == 'item':prediction = ratings.dot(similarity) / np.array([np.abs(similarity).sum(axis=1)])     return prediction

通常我们还要对预测结果进行评价,有多种评价函数,一般可以用RMSE(根平均平方误差)

自然我们要拿R的非0值进行比较,计算预测前后的误差

from sklearn.metrics import mean_squared_errordef rmse(prediction, test_R):prediction = prediction[test_R.nonzero()].flatten() test_R= test_R[test_R.nonzero()].flatten()return sqrt(mean_squared_error(prediction, test_R))

2 model-based  采用矩阵因子分解来近似填充原矩阵

一般来说矩阵R是稀疏的,考虑矩阵计算中的奇异值分解(SVD),通过将其分解成三个矩阵,其中S对角元素称为奇异值,通过过滤前k大的奇异值,可以近似保存原先矩阵的信息,正如一个图像矩阵,选取合适的k,重新计算得到的新图像可以在感官上与原图像无差异。

具体公式如

X 是m×n , U 是m×k , S 是 k×k , V.T 是k×n

这样通过计算就可以得到预测矩阵X

import scipy.sparse as sp
from scipy.sparse.linalg import svds
U, s, VT = svds(train_R, k = 15)  #选择k=15
S=np.diag(s)
X = np.dot(np.dot(U, S), VT)

本文主要介绍了memory-based 和 model-based的协同过滤方法

转载于:https://www.cnblogs.com/who-a/p/5649787.html

python实现推荐系统(一)相关推荐

  1. python开发的优秀界面-:Python做推荐系统,界面用什么实现

    我想学习一下Python编程,不知道从何学起,零基础,给推荐点教程或者书籍,要中文的真正从0开始 学习python的过程分个阶段:了解python.找个例手.做项目力提升. 第一步了解python 第 ...

  2. 使用Python构建推荐系统的机器学习

    Recommender systems are widely used in product recommendations such as recommendations of music, mov ...

  3. Python新闻推荐系统+爬虫+可视化 大数据项目 源码下载

    Python新闻推荐系统+爬虫+可视化 大数据项目 源码下载 网络爬虫:通过Python实现新浪新闻的爬取,可爬取新闻页面上的标题.文本.图片.视频链接 推荐算法:权重衰减+标签推荐+区域推荐+热点推 ...

  4. python 推荐系统算法,Python用户推荐系统minkowski算法的实现

    Python用户推荐系统minkowski算法的实现 #-*- coding: utf-8 -*- ''' python: www.iplaypy.com @author: Jekey 欧几里得距离 ...

  5. python美食推荐系统 菜谱管理系统 django框架 购物车 网站 MySQL数据库 源码下载 计算机毕业设计

    python美食推荐系统 管理系统 django框架 购物车 网站 源码下载 一.功能 注册.登录.后台管理员管理.美食.菜谱.论坛.资讯.用户分享.公告信息. 论坛管理.个人中心模块.购物车.客服中 ...

  6. python旅游推荐系统_用python写一个简单的推荐系统

    前言 在上篇文章豆瓣电影,电视剧DM实战中提及到,我和室友们产生了剧荒,萌生出要做一个个人用的推荐系统,解决剧荒的问题的想法,经过一轮的死缠烂打,这个个人推荐系统终于成型了. 今天来分享一下心得,对此 ...

  7. python推荐系统-python 简易推荐系统实现

    本文是参考了阿里云的推荐系统搭建文章的一个学习笔记,因为原文章的数据集找不到了,所以用的是不同的数据集(可能是有所更新,在其公布的原数据网站未发现其所使用的数据集),将利用python构建一个简单的推 ...

  8. python可以做什么系统-用python做推荐系统(一)

    一.简介: 推荐系统是最常见的数据分析应用之一,包含淘宝.豆瓣.今日头条都是利用推荐系统来推荐用户内容.推荐算法的方式分为两种,一种是根据用户推荐,一种是根据商品推荐,根据用户推荐主要是找出和这个用户 ...

  9. python推荐系统-基于Python的推荐系统的设计与实现

    张玉叶 摘  要: 大数据时代的推荐系统可以帮助用户从海量信息中高效地获取自己的潜在需求,是大数据在互联网领域的典型应用.文章介绍了利用Python语言实现的一个基于物品的协同过滤算法推荐系统,给出了 ...

  10. python旅游推荐系统_如何用Python搭建一个简单的推荐系统?

    推荐系统的相关知识我们已在前文中提到,在这篇文章中,我们会介绍如何用Python来搭建一个简单的推荐系统. 本文使用的数据集是MovieLens数据集,该数据集由明尼苏达大学的Grouplens研究小 ...

最新文章

  1. 利用微软Atlas消费外部Web服务
  2. ConstraintLayout 不能作为activity的根节点,否则fragment显示不出来
  3. linux命令查看几位,Linux每周几个命令(一)--查找篇
  4. 中国传感器行业应用规模与投资价值分析报告2022版
  5. OpenGL stencil test模板测试的实例
  6. python所有变量更新_在python中,如何动态更新变量?
  7. 10 个实验性的 JS/CSS3 编程技术
  8. Silverlight的OOB特性
  9. POJ2155 Matrix 二维线段树
  10. linux 下rpm软件的安装和卸载
  11. SWIG 转换C++接口为Java接口
  12. scala case class与class区别
  13. secoclient隧道保活超时或协商超时_绕不开的TCP之超时重传
  14. 人工智能-动物识别专家系统(pyqt5)
  15. Print2Flash 3汉化破解版下载
  16. 信号隔离器直流电流电压变送器 分配转换模块0-10V一进二出4-20mA
  17. PowerVR SGX
  18. 名帖298 王铎 行书《罗汉跋》
  19. oracle OCP考点在哪,Oracle OCP认证考哪几门
  20. 修改电脑qq的聊天背景

热门文章

  1. 开源项目:使用CUDA NV12转JPG
  2. 遇到一个难题:如何从java中调用到C的功能
  3. C# 随机数调用合集 Random
  4. mysql获取变量_获取Mysql的状态、变量
  5. jqgrid dataevents change 只触发一次_王者荣耀:最难触发的4个被动,张飞上榜,他:我太难了!...
  6. oracle中t,Oracle中如何用T
  7. python爬虫工程师必学app数据抓取实战_另辟蹊径,appium抓取app应用数据了解一下!...
  8. 大学物理光学思维导图_思维导图真的需要学吗?(附资料)
  9. 关于合格工程师素养的一些思考
  10. 第二轮冲次会议第八次