文章目录

  • 一、 Apriori 算法过程
  • 二、 Apriori 算法示例

参考博客 :

  • 【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则简介 | 数据集 与 事物 Transaction 概念 | 项 Item 概念 | 项集 Item Set | 频繁项集 | 示例解析 )
  • 【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则 | 数据项支持度 | 关联规则支持度 )
  • 【数据挖掘】关联规则挖掘 Apriori 算法 ( 置信度 | 置信度示例 )
  • 【数据挖掘】关联规则挖掘 Apriori 算法 ( 频繁项集 | 非频繁项集 | 强关联规则 | 弱关联规则 | 发现关联规则 )
  • 【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则性质 | 非频繁项集超集性质 | 频繁项集子集性质 | 项集与超集支持度性质 )

一、 Apriori 算法过程


原始数据集 D\rm DD ,

111 项集 C1\rm C_1C1​ , 222 项集 C2\rm C_2C2​ , ⋯\cdots⋯ , k\rm kk 项集 Ck\rm C_kCk​ , 这些项集都是候选项集 ,

根据 原始数据集 D\rm DD , 创造 111 项集 C1\rm C_1C1​ , 然后对 C1\rm C_1C1​ 执行 数据集扫描函数 , 找到其中的 频繁 111 项集 L1\rm L_1L1​ ,

根据 频繁 111 项集 L1\rm L_1L1​ , 创造 222 项集 C2\rm C_2C2​ , 然后对 C2\rm C_2C2​ 执行 数据集扫描函数 , 找到其中的 频繁 222 项集 L2\rm L_2L2​ ,

⋮\vdots⋮

根据 频繁 k−1\rm k-1k−1 项集 Lk−1\rm L_{k-1}Lk−1​ , 创造 k\rm kk 项集 Ck\rm C_kCk​ , 然后对 Ck\rm C_kCk​ 执行 数据集扫描函数 , 找到其中的 频繁 k\rm kk 项集 Lk\rm L_kLk​ ,

二、 Apriori 算法示例


事物编号 事物 ( 商品 )
001001001 奶粉 , 莴苣
002002002 莴苣 , 尿布 , 啤酒 , 甜菜
003003003 奶粉 , 尿布 , 啤酒 , 橙汁
004004004 奶粉 , 莴苣 , 尿布 , 啤酒
005005005 奶粉 , 莴苣 , 尿布 , 橙汁

最小支持度阈值为 minsup=0.6\rm minsup= 0.6minsup=0.6

根据 原始数据集 D\rm DD , 创造 111 项集 C1\rm C_1C1​ , 然后对 C1\rm C_1C1​ 执行 数据集扫描函数 , 找到其中的 频繁 111 项集 L1\rm L_1L1​ ,

111 项集 {奶粉}\{ 奶粉 \}{奶粉} 支持度 0.80.80.8
111 项集 {莴苣}\{ 莴苣 \}{莴苣} 支持度 0.80.80.8
111 项集 {尿布}\{ 尿布 \}{尿布} 支持度 0.80.80.8
111 项集 {啤酒}\{ 啤酒 \}{啤酒} 支持度 0.60.60.6
111 项集 {甜菜}\{ 甜菜 \}{甜菜} 支持度 0.20.20.2
111 项集 {诚挚}\{ 诚挚 \}{诚挚} 支持度 0.40.40.4

111 项集中只有 {奶粉}\{ 奶粉 \}{奶粉} , {莴苣}\{ 莴苣 \}{莴苣} , {尿布}\{ 尿布 \}{尿布} , {啤酒}\{ 啤酒 \}{啤酒} 是频繁 111 项集 ;

根据 频繁 111 项集 L1\rm L_1L1​ , 创造 222 项集 C2\rm C_2C2​ , 然后对 C2\rm C_2C2​ 执行 数据集扫描函数 , 找到其中的 频繁 222 项集 L2\rm L_2L2​ ,

222 项集 {奶粉,莴苣}\{ 奶粉 , 莴苣 \}{奶粉,莴苣} 支持度 0.60.60.6
222 项集 {莴苣,尿布}\{ 莴苣 , 尿布 \}{莴苣,尿布} 支持度 0.60.60.6
222 项集 {莴苣,啤酒}\{ 莴苣 , 啤酒 \}{莴苣,啤酒} 支持度 0.40.40.4
222 项集 {尿布,啤酒}\{ 尿布 , 啤酒 \}{尿布,啤酒} 支持度 0.80.80.8
222 项集 {奶粉,尿布}\{ 奶粉 , 尿布 \}{奶粉,尿布} 支持度 0.60.60.6
222 项集 {奶粉,啤酒}\{ 奶粉 , 啤酒 \}{奶粉,啤酒} 支持度 0.40.40.4

222 项集中只有 {奶粉,尿布}\{ 奶粉 , 尿布 \}{奶粉,尿布} , {尿布,啤酒}\{ 尿布 , 啤酒 \}{尿布,啤酒} , {莴苣,尿布}\{ 莴苣 , 尿布 \}{莴苣,尿布} , {奶粉,莴苣}\{ 奶粉 , 莴苣 \}{奶粉,莴苣} 是 频繁 222 项集 ;

根据 频繁 222 项集 L1\rm L_1L1​ , 创造 333 项集 C3\rm C_3C3​ , 然后对 C3\rm C_3C3​ 执行 数据集扫描函数 , 找到其中的 频繁 333 项集 L3\rm L_3L3​ ,

333 项集 {奶粉,莴苣,尿布}\{ 奶粉 , 莴苣 , 尿布 \}{奶粉,莴苣,尿布} 支持度 0.40.40.4
333 项集 {奶粉,莴苣,啤酒}\{ 奶粉 , 莴苣 , 啤酒 \}{奶粉,莴苣,啤酒} 支持度 0.20.20.2
333 项集 {莴苣,尿布,啤酒}\{ 莴苣 , 尿布 , 啤酒 \}{莴苣,尿布,啤酒} 支持度 0.40.40.4
333 项集 {奶粉,尿布,啤酒}\{ 奶粉 , 尿布 , 啤酒 \}{奶粉,尿布,啤酒} 支持度 0.40.40.4

333 项集中没有频繁项集 ;

【数据挖掘】关联规则挖掘 Apriori 算法 ( Apriori 算法过程 | Apriori 算法示例 )相关推荐

  1. 数据挖掘-关联规则挖掘之Apriori算法

    目录 一.定义 二.Apriori定律 Apriori定律1): Apriori定律2): 三.Apriori算法工作原理: 四.Apriori算法特点: 一.定义 Apriori是由a priori ...

  2. python 数据挖掘 关联规则挖掘 实践 Apriori FP-Tree mlxtend

    1 引言 关联规则分析也成为购物篮分析,最早是为了发现超市销售数据库中不同的商品之间的关联关系.例如一个超市的经理想要更多地了解顾客的购物习惯,比如"哪组商品可能会在一次购物中同时购买?&q ...

  3. 数据挖掘关联规则挖掘改进算法DHP

    前言: Apriori算法是关联规则挖掘经典算法,但不适合在大型数据库中挖掘关联规则,时间太慢,许多学者提出了改进的算法.比如DHP算法. DHP 1. 减少候选集数量 背景:这个操作是基于Ck来做的 ...

  4. 数据挖掘——关联规则挖掘

    <数据挖掘>国防科技大学 <数据挖掘>青岛大学 数据挖掘之关联规则挖掘 关联规则挖掘(Association Rule Mining)最早是由Agrawal等人提出.最初的动机 ...

  5. 数据挖掘关联规则挖掘FPtree的思想

    FPtree是针对Apriori关联规则挖掘算法的改进,他的优点在于只需要扫描一遍数据库,建好了FPtree之后,基于树做关联规则挖掘就可以了,显然大大减少了数据库的扫描次数. 建FPtree前的工作 ...

  6. 数据挖掘系列(1)关联规则挖掘基本概念与Aprior算法

    我计划整理数据挖掘的基本概念和算法,包括关联规则挖掘.分类.聚类的常用算法,敬请期待.今天讲的是关联规则挖掘的最基本的知识. 关联规则挖掘在电商.零售.大气物理.生物医学已经有了广泛的应用,本篇文章将 ...

  7. 数据挖掘算法之关联规则挖掘(一)apriori算法

    关联规则挖掘算法在生活中的应用处处可见,几乎在各个电子商务网站上都可以看到其应用 举个简单的例子 如当当网,在你浏览一本书的时候,可以在页面中看到一些套餐推荐,本书+有关系的书1+有关系的书2+... ...

  8. 利用weka进行数据挖掘——基于Apriori算法的关联规则挖掘实例

    文章目录 1. weka安装 2. 先分析一个Apriori算法的关联规则挖掘实例 3. 利用weka进行数据挖掘 3.1 将数据转为ARFF格式 3.2 利用weka进行分析 4. 参考文章 首先, ...

  9. matlab 关联规则挖掘,数据挖掘实验(六)Matlab实现Apriori算法【关联规则挖掘】...

    本文代码均已在 MATLAB R2019b 测试通过,如有错误,欢迎指正. (一)关联规则挖掘 关联规则挖掘(Association rule mining)是数据挖掘中最活跃的研究方法之一,可以用来 ...

最新文章

  1. 跑三小时的monkey测试该怎么算_百亿次的锤炼 - 带逛Dragonboat的各类测试
  2. rust里面的柴油桶有什么用_一种柴油桶倒油装置的制作方法
  3. Oracle 10G2 for CentOS 5.2 安装截图详解
  4. AutoSar软件文档阅读
  5. 数据库变为可疑_数据库出现可疑解决办法
  6. C语言实现SM4加解密
  7. 解决:启动word等office相关软件时,比较慢,会卡在一步Foxit PDF Creator COM Add-in很久
  8. 个人怎样出书需要走哪些流程
  9. RN设置宽高100%
  10. 携职教育:个税APP申报流程
  11. C++ 11 内容总结
  12. i9 13900ks和13900k区别 i913900ks和i913900k对比
  13. 数据分析 常见异常及解决办法(一)
  14. rono在oracle的作用_ColorOS产品规划总经理爆料预热Reno,这些功能你想要吗?
  15. 基于MobileNetv3实现人脸面部表情识别
  16. php laravel 开发工具,Laravel 快速开发工具
  17. PTA 计算年龄问题 (30 分)
  18. Asp.net core MVC paypal支付、回调——app支付
  19. 信号与系统——FT、FS、DTFT、DFS、DFT、FFT(一)
  20. 企业云工如何高效居家协同办公?试试这个方法

热门文章

  1. SAP SD买十送一的业务处理与系统实现
  2. 后盾网lavarel视频项目---模型一对多关联简单实例
  3. 对于python 3.x与python2.x中新型类的继承特性总结
  4. PHP7实战开发简单CMS内容管理系统(8)登录权限控制功能分离
  5. Flex前端与Java服务端交互,反射机制挑大旗
  6. J2EE架构[三层]
  7. 2019.08.07【NOIP提高组】模拟 A 组 总结
  8. SQL Server 2005 Service Broker 初探
  9. Educational Codeforces Round 56 Editorial
  10. TimeLine CSS/Javascript 时间线