R网格MIC与频繁项集
频繁项集
用 R 进行购物篮分析
安装arules包并加载
内置Groceries数据集
library(arules) #加载arules程序包,如果没有install.packages("arules")
data(Groceries) #调用数据文件
inspect(Groceries) #观看数据集里的数据
求频繁项集Eclat算法
frequentsets=eclat(Groceries,parameter=list(support=0.05,maxlen=10))
观看频繁项集
inspect(frequentsets[1:10])
inspect(sort(frequentsets,by="support")[1:10]) #根据支持度对求得的频繁项集排序并察看
利用apriori函数提取关联规则
rules=apriori(Groceries,parameter=list(support=0.01,confidence=0.5))
列出关联规则
summary(rules) #察看求得的关联规则之摘要
inspect(rules)
按需要筛选关联规则
x=subset(rules,subset=rhs%in%"whole milk"&lift>=1.2) #求所需要的关联规则子集
inspect(sort(x,by="support")[1:5]) #根据支持度对求得的关联规则子集排序并察看
其中 lift=P(L,R)/(P(L)P(R)) 是一个类似相关系数的指标。 lift=1时表示L和R独立。这个数
越大,越表明L和R存在在一个购物篮中不是偶然现象。
R网格MIC与频繁项集相关推荐
- R语言使用apriori算法进行关联规则挖掘实战:关联规则概念、频繁项集、支持度(support)、置信度(confidence)、提升度(lift)、apriori算法
R语言使用apriori算法进行关联规则挖掘实战:关联规则概念.频繁项集.支持度(support).置信度(confidence).提升度(lift).apriori算法 目录
- R语言数据挖掘2.1.1.1 频繁项集
2.1.1.1 频繁项集 频繁项集的概念来源于真实的购物篮分析.在诸如亚马逊等商店中,存在很多的订单或交易数据.当客户进行交易时,亚马逊的购物车中就会包含一些项.商店店主可以通过分析这些大量的购物事务 ...
- 【机器学习实战】第12章 使用 FP-growth 算法来高效发现频繁项集
第12章 使用FP-growth算法来高效发现频繁项集 前言 在 第11章 时我们已经介绍了用 Apriori 算法发现 频繁项集 与 关联规则. 本章将继续关注发现 频繁项集 这一任务,并使用 FP ...
- FP-growth算法高效发现频繁项集
在用搜索引擎时,我们发现输入单词的一部分时,搜索引擎会自动补全查询词项,这里的原理其实是通过查询互联网上的词来找出经常出现在一块的词对,这需要一种高效发现频繁集的方法. 它基于Apriori构建,但在 ...
- 机器学习实战(十一)FP-growth(频繁项集)
目录 0. 前言 1. 构建FP树 2. 从FP树中挖掘频繁项集 3. 实战案例 3.1. FP-growth寻找频繁项集 学习完机器学习实战的FP-growth,简单的做个笔记.文中部分描述属于个人 ...
- 关联规则—频繁项集Apriori算法
转载地址:http://liyonghui160com.iteye.com/blog/2080531 一.前言 频繁模式和对应的关联或相关规则在一定程度上刻画了属性条件与类标号之间的有趣联系,因此将关 ...
- FP-growth:从FP树中挖掘频繁项集
前言 若想具体理解FP-growth,请参阅这位大神的作品: https://www.cnblogs.com/pinard/p/6307064.html 本文的前一节<FP-growth:构建F ...
- 使用FP-growth算法来高效发现频繁项集
FP-growth算法基于Apriori构建,但采用了高级的数据结构减少扫描次数,大大加快了算法速度.FP-growth算法只需要对数据库进行两次扫描,而Apriori算法对于每个潜在的频繁项集都会扫 ...
- FP-growth算法发现频繁项集(一)——构建FP树
常见的挖掘频繁项集算法有两类,一类是Apriori算法,另一类是FP-growth.Apriori通过不断的构造候选集.筛选候选集挖掘出频繁项集,需要多次扫描原始数据,当原始数据较大时,磁盘I/O次数 ...
最新文章
- win7开机动画_优化win7系统 让系统运行更顺畅
- 哈哈,我的Blog开通了。。。
- t3修改计算机后就无法登录了,电脑更换系统后,用友T3登录不上了,一直显示这个,怎么处理,这个怎么解决...
- 混淆矩阵评价指标_机器学习模型评价指标 -- 混淆矩阵
- goreman 多进程管理工具
- Eclipse 安装SVN的两种方式
- 让天之痕窗口化运行!
- python动态数据类型_[python学习手册-笔记]004.动态类型
- CAD梦想画图中的“绘图工具——椭圆”
- 国内B2C 26个经典购物网站商城收集
- wlacm 铲雪车snow 题解
- 0011基于单片机电子密码锁控制系统设计
- 《淘宝网开店 拍摄 修图 设计 装修 实战150招》一一1.8 侧光拍摄增强轮廓感
- 指纹浏览器会泄漏隐私吗?
- 设置SVN忽略文件和目录(文件夹)
- WinRAR如何保护压缩包的文件不被修改
- ubuntu 14.04 搜狗拼音输入法安装
- CSS 的快乐:画一个可爱的三只小鸟 Button
- HDOJ 2547 无剑无我(求两点距离)
- 用3种方式打开下载链接