python 关联规则包,python 实现关联规则算法Apriori的示例
首先导入包含apriori算法的mlxtend库,
pip install mlxtend
调用apriori进行关联规则分析,具体代码如下,其中数据集选取本博客 “机器学习算法——关联规则” 中的例子,可进行参考,设置最小支持度(min_support)为0.4,最小置信度(min_threshold)为0.1,
最小提升度(lift)为1.0,对数据集进行关联规则分析,
from mlxtend.preprocessing import TransactionEncoder
from mlxtend.frequent_patterns import apriori
from mlxtend.frequent_patterns import association_rules
import pandas as pd
df_arr = [['苹果','香蕉','鸭梨'],
['橘子','葡萄','苹果','哈密瓜','火龙果'],
['香蕉','哈密瓜','火龙果','葡萄'],
['橘子','橡胶'],
['哈密瓜','鸭梨','葡萄']
]
#转换为算法可接受模型(布尔值)
te = TransactionEncoder()
df_tf = te.fit_transform(df_arr)
df = pd.DataFrame(df_tf,columns=te.columns_)
#设置支持度求频繁项集
frequent_itemsets = apriori(df,min_support=0.4,use_colnames= True)
#求关联规则,设置最小置信度为0.15
rules = association_rules(frequent_itemsets,metric = 'confidence',min_threshold = 0.15)
#设置最小提升度
rules = rules.drop(rules[rules.lift <1.0].index)
#设置标题索引并打印结果
rules.rename(columns = {'antecedents':'from','consequents':'to','support':'sup','confidence':'conf'},inplace = True)
rules = rules[['from','to','sup','conf','lift']]
print(rules)
#rules为Dataframe格式,可根据自身需求存入文件
输出结果如下:
from to sup conf lift
0 (哈密瓜) (火龙果) 0.4 0.666667 1.666667
1 (火龙果) (哈密瓜) 0.4 1.000000 1.666667
2 (哈密瓜) (葡萄) 0.6 1.000000 1.666667
3 (葡萄) (哈密瓜) 0.6 1.000000 1.666667
4 (葡萄) (火龙果) 0.4 0.666667 1.666667
5 (火龙果) (葡萄) 0.4 1.000000 1.666667
6 (哈密瓜, 葡萄) (火龙果) 0.4 0.666667 1.666667
7 (哈密瓜, 火龙果) (葡萄) 0.4 1.000000 1.666667
8 (葡萄, 火龙果) (哈密瓜) 0.4 1.000000 1.666667
9 (哈密瓜) (葡萄, 火龙果) 0.4 0.666667 1.666667
10 (葡萄) (哈密瓜, 火龙果) 0.4 0.666667 1.666667
11 (火龙果) (哈密瓜, 葡萄) 0.4 1.000000 1.666667
Process finished with exit code 0
以上就是python 实现关联规则算法Apriori的示例的详细内容,更多关于python 实现关联规则算法Apriori的资料请关注聚米学院其它相关文章!
python 关联规则包,python 实现关联规则算法Apriori的示例相关推荐
- python实现关联算法_python实现关联规则算法Apriori代码示例
本篇文章小编给大家分享一下python实现关联规则算法Apriori代码示例,文章代码介绍的很详细,小编觉得挺不错的,现在分享给大家供大家参考,有需要的小伙伴们可以来看看. 首先导入包含apriori ...
- 从啤酒和尿布讲关联规则,大数据集处理算法Apriori以及改进的PCY算法
本文将讲解关联规则的相关概念.处理相关规则的一般算法.改进的大数据处理关联规则的Apriori算法以及进一步优化的PCY算法. 啤酒和尿布的故事已经广为人晓.很多年轻的父亲买尿布的时候会顺便为自己买一 ...
- python画图包-Python 绘图包 Matplotlib Pyplot 教程
Pyplot 接口简介 Pyplot 入门 matplotlib.pyplot?是命令风格函数的集合,使 Matplotlib 像 MATLAB 一样工作.每个 Pyplot 函数对图形做一些修改,例 ...
- python pandas包,Python的常用包pandas,numpy
Pandas 1.DataFrame 和 Series 的介绍import pandas as pd #导入pandas 包 array = [[1,2,3],[3,4,5]] #创建列表 ...
- python分类算法的应用_Python基于sklearn库的分类算法简单应用示例
Python基于sklearn库的分类算法简单应用示例 来源:中文源码网 浏览: 次 日期:2018年9月2日 [下载文档: Python基于sklearn库的分类算法简单应用示例.tx ...
- 安装python 的包控制mysql的Python脚本与执行系统命令的Python脚本
安装python 的包 python 有很多的第三方软件包, 提供了 标准库中没有的功能. python 的官方支持的软件包的网站: PyPI · The Python Package Index 安 ...
- win7怎么装python_如何在win7上面安装python的包
最近在win7上面搞python,然后写的一些代码涉及到了对Excel的读写.所以需要用到包xlrd xlwt xlutils. 但问题是这些包import后显示的是找不到.错误提示是:Import ...
- python实现关联算法_关联规则算法Apriori学习及Python实现
关联规则算法Apriori以及FP-growth学习 最近选择了关联规则算法进行学习,目标是先学习Apriori算法,再转FP-growth算法,因为Spark-mllib库支持的关联算法是FP,随笔 ...
- 数据挖掘之关联规则算法Apriori
关联规则最初是针对购物篮分析问题提出的,其目的是为了发现交易数据库中不同商品之间的关联规则. 关联规则挖掘的问题可以划分为两个子问题: 发现频繁项目集:通过用户给定Minsupport,寻找所有频繁项 ...
最新文章
- 2022-2028年中国再生金属行业投资分析及前景预测报告
- 汇编语言中栈及栈操作的实现
- 要不要读博?机器学习博五学生和强化学习博士展开了一场battle
- FLEX是什么及与FLASH的关系的介绍
- MySQL连接问题【如何解决MySQL连接超时关闭】
- 十二:NodeManager
- jsbridge实现及原理_如何实现一个优雅的jsBridge
- HDU4321(位运算二进制1的统计)
- iis php5.4配置_IIS 8+PHP5.4+SQL server2012配置
- 支付宝有50万存款,但欠30万房贷。是还房贷好,还是买基金好?
- 各年龄段都是怎么提加薪的?
- 复制粘贴发明人、Java 和互联网创建者相继去世,向初代互联网大佬致敬!
- C罗是你人生中最好的健身教练和精神导师
- unity Reflection Probe
- BTRFS - what makes BTRFS different?
- 基于VS2015MFC在X86debug编译平台调试opengl 代码出现oxc0000007b错误的解决方法
- [电影]推荐《启示》--完美的玛雅文化背景
- BookXNote使用
- Win10 更改桌面背景为图片不生效,马上自动变为纯色黑色
- 教程篇(5.4) 03. FortiManager 设备注册 ❀ Fortinet 网络安全专家 NSE5