协同过滤算法_基于Mahout的协同过滤推荐算法
基于物品的协同过滤
对物品进行相似度计算,然后再进行推荐。
基于用户的协同过滤
基于用户的协同过滤算法是通过用户的历史行为数据发现用户对商品或内容的喜欢,并对这些喜好进行度量和打分。根据不同用户对相同商品或内容的态度和偏好程度计算用户之间的关系。在有相同喜好的用户间进行商品推荐。
模拟:5个用户分别对两件商品进行了评分。这里的分值可能表示真实的购买、浏览商品的次数、向朋友推荐商品,收藏,分享,或评论等等。这些行为都可以表示用户对商品的态度和偏好程度。
2Mahout
♛定义:Mahout是一个算法库,集成了很多算法;Apache Mahout是一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建指能应用程序;Mahout包含许多实现,包括聚类、分类、推荐过滤、频繁子项挖掘。
♛作用:推荐引擎,聚类,分类
3Mahout协同过滤算法
定义
Mahout使用了Taste来提高协同过滤算法的实现,它是一个基于Java实现的可扩展的,高效的推荐引擎。Taste既实现了最基本的基于用户的和基于内容的推荐算法,同时也提供了扩展接口,使用户可以方便的定义和实现自己的推荐算法。
Taste提供的主要接口
a.DataMode
DataModel 是用户喜好信息的抽象接口,它的具体实现支持从任意类型的数据源抽取用户喜好信息。Taste 默认提供JDBCDataModel 和 FileDataModel,分别支持从数据库和文件中读取用户的喜好信息。
b.UserSimilarity 、 ItemSimilarity
UserSimilarity 用于定义两个用户间的相似度,它是基于协同过滤的推荐引擎的核心部分,可以用来计算用户的“邻居”,这里我们将与当前用户口味相似的用户称为他的邻居。ItemSimilarity 类似的,计算Item之间的相似度。
c.UserNeighborhood
用于基于用户相似度的推荐方法中,推荐的内容是基于找到与当前用户喜好相似的邻居用户的方式产生的。UserNeighborhood 定义了确定邻居用户的方法,具体实现一般是基于 UserSimilarity 计算得到的。
4算法编程
下载数据源
代码展示
运行结果
END
协同过滤算法_基于Mahout的协同过滤推荐算法相关推荐
- 详解利用基于gensim的TF-IDF算法实现基于文本相似度的推荐算法
详解利用基于gensim的TF-IDF算法实现基于文本相似度的推荐算法 TF-IDF的基本原理 算法思想 计算公式 相似度计算原理 微型图书推荐案例 案例背景 开发工具 数据预处理 TF-IDF模型建 ...
- 协同过滤算法_基于用户的协同过滤推荐算法原理和实现
(给算法爱好者加星标,修炼编程内功) 来源:Create Chen's Blog https://www.cnblogs.com/technology/p/4467895.html 在推荐系统众多方法 ...
- java 用户协同过滤算法_基于用户的协同过滤推荐算法java实现(UserCF)
UserCF的核心思想即为根据用户数据模拟向量相似度,我们根据这个相似度,来找出指定用户的相似用户,然后将相似用户买过的而指定用户没有买的东西推荐给指定用户,推荐度的计算也是结合了相似用户与指定用户的 ...
- 病虫害模型算法_基于深度学习的目标检测算法综述
sigai 基于深度学习的目标检测算法综述 导言 目标检测的任务是找出图像中所有感兴趣的目标(物体),确定它们的位置和大小,是机器视觉领域的核心问题之一.由于各类物体有不同的外观,形状,姿态,加上成像 ...
- python 排列组合算法_基于python快速实现排列组合算法
1.python语言简单.方便,其内部可以快速实现排列组合算法,下面做简单介绍. 2.一个列表数据任意组合 2.1主要是利用自带的库#_*_ coding:utf-8 _*_ #__author__= ...
- c++多边形扫描线填充算法_基于MATLAB的道格拉斯普克算法递归实现
道格拉斯普克算法 (道格拉斯-普克)Douglas-Peukcer算法由D.Douglas和T.Peueker于1973年提出,是线状要素抽稀的经典算法.用它处理大量冗余的几何数据点,既可以达到数据量 ...
- 基于Mahout实现协同过滤推荐算法的电影推荐系统
1 Mahout介绍 Apache Mahout 是 Apache Software Foundation(ASF) 旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更 ...
- 推荐算法之基于物品的协同过滤
基于物品的协同过滤( item-based collaborative filtering )算法是此前业界应用较多的算法.无论是亚马逊网,还是Netflix .Hulu . YouTube ,其推荐 ...
- [推荐算法]ItemCF,基于物品的协同过滤算法
[推荐算法]ItemCF,基于物品的协同过滤算法 标签: ItemCF基于用户的协同过滤算法 2015-03-09 15:11 4144人阅读 评论(1) 收藏 举报 本文章已收录于: 分类: ...
最新文章
- statemodels 笔记: lowess
- Java Date的after和before方法解释
- [模板]LIS(最长上升子序列)
- matlab中GUI的属性检查器中的XLimMode是什么_如何在Matlab中使用GUI做一个简易音乐播放器? ---- (二)GUIDE...
- 【源码分析】微信小程序 - 01表单组件 - 01button - 实践
- mybatise 实现同一字段多模糊查询
- springside4例子
- 8汉化 netreflector_Reflector下载_.NET Reflector官方中文版下载-华军软件园
- 牛客Top200---最长回文字符串(java)
- 连接查询和子查询哪个效率高
- tomcat 是什么
- word批注怎么删除计算机名字,word 2007 如何删除批注者姓名?
- 【日语】secret base
- ‘Authentication failed.‘ on server xx.xx.xxx.x:27017. The full response is { “ok“ : 0.0, “errmsg“
- # imshow 报错
- lib lib32 lib64等lib文件夹的说明
- C++ free指针时的异常
- ZHS16GBK字符集插入中文时报错ORA-01756
- 2022年十一届认证杯D题
- nginx错误:unknown directive “锘? in F:\nginx/conf/nginx.conf:3