基于用户的协同推荐算法

推荐系统在我们的日常生活之中无处不在,例如,在电子商城购物,系统会根据用户的记录或者其他的信息来推荐相应的产品给客户,是一种智能的生活方式。之所以增加过滤,是因为在实现过滤推荐的时候是根据其他人的行为来做预测的,基于相似用户的喜好来实现用户的喜好预测。

简要介绍:         

通过找到兴趣相投,或者有共同经验的群体,来向用户推荐感兴趣的信息。

举例,如何协同过滤,来对用户A进行电影推荐?

答:简要步骤如下:

找到用户A(user_id_1)的兴趣爱好

找到与用户A(user_id_1)具有相同电影兴趣爱好的用户群体集合Set<user_id>

找到该群体喜欢的电影集合Set<movie_id>

将这些电影Set<Movie_id>推荐给用户A(user_id_1)

具体实施步骤如何?

答:简要步骤如下

(1)画一个大表格,横坐标是所有的movie_id,纵坐标所有的user_id,交叉处代表这个用户喜爱这部电影

如上表:

横坐标,假设有10w部电影,所以横坐标有10w个movie_id,数据来源自数据库

纵坐标,假设有100w个用户,所以纵坐标有100w个user_id,数据也来自数据库

交叉处,“1”代表用户喜爱这部电影,数据来自日志

画外音:什么是“喜欢”,需要人为定义,例如浏览过,查找过,点赞过,反正日志里有这些数据

(2)找到用户A(user_id_1)的兴趣爱好

如上表,可以看到,用户A喜欢电影{m1, m2, m3}

(3)找到与用户A(user_id_1)具有相同电影兴趣爱好的用户群体集合Set<user_id>

如上表,可以看到,喜欢{m1, m2, m3}的用户,除了u1,还有{u2, u3}

(4)找到该群体喜欢的电影集合Set<movie_id>

如上表,具备相同喜好的用户群里{u2, u3},还喜好的电影集合是{m4, m5}

画外音:“协同”就体现在这里。

(5)未来用户A(use_id_1)来访问网站时,要推荐电影{m4, m5}给ta。

基于python的电影推荐系统相关推荐

  1. 基于python的电影数据可视化分析与推荐系统

    温馨提示:文末有 CSDN 平台官方提供的博主 Wechat / QQ 名片 :) 1. 项目简介 本项目利用网络爬虫技术从国外某电影网站和国内某电影评论网站采集电影数据,并对电影数据进行可视化分析, ...

  2. 电影推荐系统 python简书_基于Spark的电影推荐系统(实战简介)

    ## 写在前面 一直不知道这个专栏该如何开始写,思来想去,还是暂时把自己对这个项目的一些想法 和大家分享 的形式来展现.有什么问题,欢迎大家一起留言讨论. 这个项目的源代码是在https://gith ...

  3. python电影推荐算法_基于Python的电影推荐算法

    原标题:基于Python的电影推荐算法 第一步:收集和清洗数据 数据链接:https://grouplens.org/datasets/movielens/ 下载文件:ml-latest-small ...

  4. 基于Spark的电影推荐系统(电影网站)

    第一部分-电影网站: 软件架构: SpringBoot+Mybatis+JSP 项目描述:主要实现电影网站的展现 和 用户的所有动作的地方 技术选型: 技术 名称 官网 Spring Boot 容器 ...

  5. 基于python 的电影票房可视化系统

    一.介绍 电影票房可视化系统是一个实时分析电影票房的系统,应用Python爬虫.Flask框架.Echarts等技术实现. 二.系统运行图 首页 实时票房排名 票房排行top10 电影类型票房占有率 ...

  6. 基于Spark的电影推荐系统(推荐系统~1)

    第四部分-推荐系统-项目介绍 行业背景: 快速:Apache Spark以内存计算为核心 通用 :一站式解决各个问题,ADHOC SQL查询,流计算,数据挖掘,图计算 完整的生态圈 只要掌握Spark ...

  7. 基于Spark的电影推荐系统(推荐系统~4)

    第四部分-推荐系统-模型训练 本模块基于第3节 数据加工得到的训练集和测试集数据 做模型训练,最后得到一系列的模型,进而做 预测. 训练多个模型,取其中最好,即取RMSE(均方根误差)值最小的模型 说 ...

  8. 基于Spark的电影推荐系统(推荐系统~5)

    第四部分-推荐系统-离线推荐 本模块基于第4节得到的模型,开始为用户做离线推荐,推荐用户最有可能喜爱的5部电影. 说明几点 1.主要分为两个模块.其一是为 单个随机用户 做推荐,其二是为 所有用户做推 ...

  9. 基于Python的图书推荐系统的设计与实现

    基于Python的图书推荐系统的设计与实现 课题描述 在这个数据爆炸的年代,人们的需求逐渐增多,而所对应的资源更是海量. 一个人要从无数的选择中选中自己所感兴趣的无异于大海捞针. 本系统在实现个人信息 ...

  10. 基于python的电影爬虫可视化系统设计与实现

    大数据时代的到来,随着人们线上互动以及网络交易,用户的信息数据完全充斥着网络,个体对产品及服务的偏好可以从这些数据中完全体现出来,为商家以及平台提供了更好的发展方向.但是要人为获取数据库中的大量数据信 ...

最新文章

  1. oracle11g的安装
  2. 自定义控件的构建(5)
  3. 最短路问题的原始对偶算法形式
  4. spring源码分析之context
  5. .NET语言的编译过程:中间语言(IL)和即时编译器(JIT)
  6. 思科路由PPPOE基本配置
  7. Servlet 过滤器笔记
  8. 安又琪 -《Angela安又琪》
  9. 本地虚拟机部署java项目(tomcat8 ,jdk8,VMWare)
  10. Spring 框架基础(03):核心思想 IOC 说明,案例演示
  11. 测试无损音乐软件,无损音乐一定靠谱?/无损检测方法
  12. springboot启动类
  13. 造命者天,立命者我_huadingjin_新浪博客
  14. CrawlSpider实现微信小程序社区爬虫【python爬虫入门进阶】(18)
  15. 9.png为什么可以保证图片不失真,.9.png操作详解————针对原文有补充
  16. 抖音网页版入口登录链接地址
  17. linux怎么找宝塔地址,宝塔Linux面板安全入口地址忘了(方法一)
  18. 【转】stringstream(sstream)常用用法介绍
  19. 【爬虫】python使用selenium抓取淘宝中的商品数据
  20. 爆米花现象_爆米花雨是什么梗 看了电影昆池岩你就懂了

热门文章

  1. 微信客服我是这样管理的
  2. 按键精灵_汉字转拼音
  3. java垃圾回收机制介绍
  4. 【系统分析师之路】 第八章 复盘软件测试与维护(软件维护)
  5. 计算机的excel的知识,计算机基础知识:Excel常用操作(一)
  6. 坦克大战游戏java代码_Java实现坦克大战游戏的源码示例
  7. 【SQL Server】用SQL命令建立数据库和表
  8. 网景R6400做无线中继服务器,网件R6400刷梅林后5G掉线假死怎么办解决办法
  9. 下载Chrome浏览器历史版本方法
  10. android chrome 无法下载,Android Chrome浏览器将支持下载暂停和取消