1.导包

from mlxtend.preprocessing import TransactionEncoder
from mlxtend.frequent_patterns import apriori
from mlxtend.frequent_patterns import association_rules
import pandas as pd

2.读取文件

my_data=pd.read_excel("D:/棒/数据挖掘/basket.xlsx")
df_data=my_data.iloc[:,7:].copy()
df_data.head()

3.数据显示

my_data.describe()

结果如图:

4.数据处理:

dict_data={'F':False,'T':True}
df_data['fruitveg']=df_data['fruitveg'].map(dict_data)
df_data['freshmeat']=df_data['freshmeat'].map(dict_data)
df_data['dairy']=df_data['dairy'].map(dict_data)
df_data['cannedveg']=df_data['cannedveg'].map(dict_data)
df_data['cannedmeat']=df_data['cannedmeat'].map(dict_data)
df_data['frozenmeal']=df_data['frozenmeal'].map(dict_data)
df_data['beer']=df_data['beer'].map(dict_data)
df_data['wine']=df_data['wine'].map(dict_data)
df_data['softdrink']=df_data['softdrink'].map(dict_data)
df_data['fish']=df_data['fish'].map(dict_data)
df_data['confectionery']=df_data['confectionery'].map(dict_data)

结果如下:

5.设置支持度求频繁项集

frequent_itemsets = apriori(df_data,min_support=0.1,use_colnames= True)

frequent_itemsets

结果如下:

6.

#求关联规则,设置最小置信度为0.15

rules = association_rules(frequent_itemsets,metric = 'confidence',min_threshold = 0.15)

#设置最小提升度

rules = rules.drop(rules[rules.lift <1.0].index)

#设置标题索引并打印结果

rules.rename(columns = {'antecedents':'from','consequents':'to','support':'sup','confidence':'conf'},inplace = True)

rules = rules[['from','to','sup','conf','lift']]

rules

结果如下:

数据挖掘——关联分析例题代码实现(下)相关推荐

  1. C++算法设计与分析例题代码(基础篇)

    C++算法设计与分析例题代码 前言 一.求1/1!-1/3!+1/5!-1/7!+...+(-1)^(n+1)/(2n-1)! 二.一个数如果恰好等于它的因子之和(包括1,但不包含这个数本身),这个数 ...

  2. 数据挖掘-关联分析频繁模式挖掘Apriori、FP-Growth及Eclat算法的JAVA及C++实现

    (update 2012.12.28 关于本项目下载及运行的常见问题 FAQ见 newsgroup18828文本分类器.文本聚类器.关联分析频繁模式挖掘算法的Java实现工程下载及运行FAQ ) 一. ...

  3. 【数学建模】灰色关联分析 + Matlab代码实现

    文章目录 一.学习内容: 二.学习时间: 三.学习产出: 3.1 灰色关联分析基本思想 3.2 运用灰色关联分析的基本步骤 3.3 灰色关联分析代码实现(Matlab) 3.3.1 应用一:分析产业对 ...

  4. 数据挖掘关联分析中的支持度、置信度和提升度

    购物篮分析: 利用关联分析的方法可以发现联系如关联规则或频繁项集. 二元表示:每一行对应一个事务,每列对应一个项,项用二元变量表示,项在事务中出现比不出现更重要,因此项是非对称的的二元变量. 项集(I ...

  5. matlab灰色关联代码,灰色关联分析matlab代码

    灰色关联分析 function output=grayrela(x0) %参考因子与比较因子共同存储在一个矩阵x0中,参考因子位于第一列 %斜率序列 for i=2:length(x0(:,1)) x ...

  6. 数据挖掘——关联分析基础介绍(上)

    一.前提介绍: 啤酒与尿布: 在美国有婴儿的家庭中,一般是母亲在家中照看婴儿,年轻的父 亲前去超市购买尿布.父亲在购买尿布的同时,往往会顺便为自己购 买啤酒,这样就会出现啤酒与尿布这两件看上去不相干的 ...

  7. apriori算法c++_使用Apriori进行关联分析

    目录 1.名词概念 2.频繁项集发现 3.Apriori算法关联分析 4.代码实现 5.参考文章   通过组合交叉变量制定风控策略时有两种方法:一是通过决策树分箱进行变量交叉,可以见文章一个函数实现自 ...

  8. 使用Apriori算法进行关联分析

    目录 1.名词概念 2.频繁项集发现 3.Apriori算法关联分析 4.代码实现 5.参考文章   通过组合交叉变量制定风控策略时有两种方法:一是通过决策树分箱进行变量交叉,可以见文章一个函数实现自 ...

  9. 【数学建模】灰色关联(Matlab代码实现)

    目录 1 灰色关联理论 2 算例及Matlab代码实现 2.1 算例1 2.2 算例2   2.3 算例3 2.4 算例4  3 写在最后 1 灰色关联理论 灰色关联分析l是由邓聚龙教授于1982年提 ...

最新文章

  1. python turtle画圆、循环法_实验与作业(Python)-03 Python程序实例解析(函数、循环、range、turtle)...
  2. ubuntu14.04下通过.frm, .MYD,.MYI文件恢复建立mysql数据库
  3. ITK:具有写访问权限遍历图像的某个区域
  4. Android Studio 之 NDK篇
  5. 【信号】函数kill、raise、abort、alarm
  6. python serial 发送ctl+c_[已解决]shell 脚本 给命令发送 Ctrl+C信号
  7. mysql innodb隔离级别_浅析MySQL InnoDB的隔离级别
  8. vue比php的优势,vue.js的优势是什么
  9. Windows 编程[11] - WM_SIZE 消息
  10. Visio使用经验汇集
  11. Web前端性能优化——CSS优化
  12. adb shell使用教程+sqlite3使用示例
  13. 虚拟签到拍照打卡技巧,超实在的教程
  14. 搜索引擎如何优化?这些方法要知道
  15. python爬iptv直播源_GitHub - linnoreading/iptv-m3u: python 爬的直播源数据
  16. OpenNI 2.0
  17. 计算机的存储器体系结构,计算机体系结构设计 第05章 存储器体系结构设计.pptx...
  18. LuLu UI表单验证
  19. Superset1.3.2部分配置教程
  20. 讯众通信:把握产业互联网机遇 加速云通信大生态建设

热门文章

  1. 8.物体的几何表示——隐式曲面+物体的CSG树
  2. C++错误:不允许使用不完整的类型
  3. [201206][UML 精粹][标准对象建模语言简明指南][第3版][Martin Fowler][著]
  4. 在Android系统中调用系统前置摄像头
  5. Admui 源码所有相关问题
  6. 常用算法回顾——穷举法
  7. 扫码转账提示已停止访问该网页解决办法
  8. R329教程一|周易 AIPU 部署及仿真教程
  9. c#使用Nplot插件开发之使用线图与时间轴
  10. CSS-实现不同尺寸大小图片自适应父级DIV