关联规则的几个概念:

关联规则是形如 X -> Y 的蕴含式,表示通过 X 可以推导出 Y,X称为关联规则的左部(Left Hand Side,LHS),Y 称为关联规则的右部(Right Hand Side,RHS)。

关联规则有两个指标,分别是支持度(Support)和置信度(Confidence)。关联规则A -> B 的支持度(support)= P(AB),指的是事件 A 和事件 B 同时发生的概率。置信度(confidence) = P(B|A) = P(AB) / P(A),指的是发生事件A的基础上,发生事件B的概率。比如,如果尿布->啤酒关联规则的支持度为 30%,置信度60%,那么就表示所有的商品交易中,30% 交易同时购买了尿布和啤酒,在购买尿布的交易中,60% 的交易同时购买了啤酒。

关联规则分析需要从基础数据中挖掘出支持度和置信度都超过一定阈值的关联规则,以便在决策中应用。同时满足最小支持度阈值和最小置信度阈值的规则,称为强规则

挖掘关联规则的主流算法为 Apriori 算法。它的基本思想是在数据集中找出同时出现概率符合预定义(Pre-defined)支持度的频繁项集,而后从以上频繁项集中,找出符合预定义置信度的关联规则。

原理:
如果某个项集是频繁的,那么它的所有子集也是频繁的。它的逆否命题是,如果一个项集是非频繁的,那么它的所有超集也是频繁的。

在上图中,已知阴影项集{商品2,商品3}是非频繁的。利用这个基础知识,我们可以知道项集 {商品0,商品2,商品3},{商品1,商品2,商品3} 以及 {商品0,商品1,商品2,商品3} 也是非频繁的,因为它们是 {商品2,商品3} 的超集。于是在计算过程中,一旦计算出 {商品2,商品3} 的支持度,知道它是非频繁的后,就可以紧接着排除它的超集,节省了计算工作量。

关联规则分析 Apriori 算法 简介与入门相关推荐

  1. Python 在线电子零售公司销售数据(Online Retail | Kaggle)关联规则分析(Apriori算法)

    引言: 本文使用python语言完成了在线电子零售公司的跨国交易数据集的数据分析与可视化.根据关联规则原理设计实现了基于Apriori算法的关联规则挖掘程序并将程序封装.使用封装好的关联规则挖掘程序对 ...

  2. 【数据挖掘】关联规则挖掘 Apriori 算法 ( Apriori 算法过程 | Apriori 算法示例 )

    文章目录 一. Apriori 算法过程 二. Apriori 算法示例 参考博客 : [数据挖掘]关联规则挖掘 Apriori 算法 ( 关联规则简介 | 数据集 与 事物 Transaction ...

  3. 【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则性质 | 非频繁项集超集性质 | 频繁项集子集性质 | 项集与超集支持度性质 )

    文章目录 一. 非频繁项集超集性质 二. 频繁项集子集性质 三. 项集与超集支持度性质 参考博客 : [数据挖掘]关联规则挖掘 Apriori 算法 ( 关联规则简介 | 数据集 与 事物 Trans ...

  4. 【数据挖掘】关联规则挖掘 Apriori 算法 ( 频繁项集 | 非频繁项集 | 强关联规则 | 弱关联规则 | 发现关联规则 )

    文章目录 一. 频繁项集 二. 非频繁项集 三. 强关联规则 四. 弱关联规则 五. 发现关联规则 参考博客 : [数据挖掘]关联规则挖掘 Apriori 算法 ( 关联规则简介 | 数据集 与 事物 ...

  5. 【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则 | 数据项支持度 | 关联规则支持度 )

    文章目录 一. 关联规则 二. 数据项支持度 三. 关联规则支持度 参考博客 : [数据挖掘]关联规则挖掘 Apriori 算法 ( 关联规则简介 | 数据集 与 事物 Transaction 概念 ...

  6. 数据分享|R语言关联规则挖掘apriori算法挖掘评估汽车性能数据

    全文链接:http://tecdat.cn/?p=32092 我们一般把一件事情发生,对另一件事情也会产生影响的关系叫做关联.而关联分析就是在大量数据中发现项集之间有趣的关联和相关联系(形如" ...

  7. 【数据挖掘】关联规则挖掘 Apriori 算法 ( 置信度 | 置信度示例 )

    文章目录 一. 置信度 二. 置信度 示例 参考博客 : [数据挖掘]关联规则挖掘 Apriori 算法 ( 关联规则简介 | 数据集 与 事物 Transaction 概念 | 项 Item 概念 ...

  8. 关联规则挖掘--Apriori算法

    关联规则挖掘--Apriori算法 1.关联规则概述 2.置信度.支持度.提升度的概念 3.关联规则挖掘问题 4.Apriori算法 4.1 算法步骤 4.2 先验原理 4.3 寻找最大频繁项的过程 ...

  9. 【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则简介 | 数据集 与 事物 Transaction 概念 | 项 Item 概念 | 项集 Item Set | 频繁项集 | 示例解析 )

    文章目录 一. 关联规则挖掘简介 二. 数据集 与 事物 ( Transaction ) 概念 三.项 ( Item ) 概念 四.项集 ( Item Set ) 概念 五.频繁项集 六.数据集.事物 ...

最新文章

  1. Handler 实现的一个循环操作
  2. C++CTime使用方法
  3. MATLAB在通信系统仿真中的注意
  4. lua脚本在redis集群中执行报错--Lua script attempted to access a non local key in a cluster node...
  5. HarmonyOS之剪贴板的功能和使用
  6. 130. Surrounded Regions 被围绕的区域
  7. Android Studio 解决The SDK platform-tools is too old问题
  8. ListBox类似组件,鼠标右键点击事件得到选中Item
  9. 70 include指令
  10. asp判断ajax请求 -asp.net,一个asp注册验证用户名是否重复的Ajax实例
  11. install 命令用法详解
  12. Linux 命令(0)—— man 命令
  13. 动易cms5.0如何安装在远程服务器上,动易PowerEasy_SiteWeaver_CMS6.8安装教程
  14. 关于QQ邮箱登录提示一键登录解决方案
  15. 微信开发工具ts和js文件冲突
  16. 创建android studio桌面图标
  17. 获取地理位置定位信息-app端
  18. 一次 WebResource.axd 异常处理经历
  19. 骚操作,VSCode上发布知乎
  20. 软件测试 6(等价类) --等价类测试

热门文章

  1. LeetCode 1569. 将子数组重新排序得到同一个二叉查找树的方案数(DP)
  2. LeetCode 358. K 距离间隔重排字符串(贪心+优先队列)
  3. LeetCode 430. 扁平化多级双向链表(DFS)
  4. insert和update 锁等待_黑龙F5智感双全智能锁全球首发,掀起惊艳风潮
  5. windows键按了没反应_windows快捷键使用 - 小怜
  6. 服务器select与gevent
  7. leetcode第 46 场双周赛
  8. 分组统计 - DataFrame.groupby() 所见的各种用法 - Python代码
  9. dlib 怎么安装vs2017_win10中的dlib库安装过程
  10. was 程序jvm_【保家护行航】WAS知识学习分享