基本概念

  1. I是一个项目集合,事务数据库D是由一系列具有唯一标识TID的事务组成,每个事务t都对应I上的一个子集

  2. 支持度:项目集I1在数据集D上的支持度是包含I1的事务在D中所占的百分比

  3. 频繁项目集:对项目集I和事务数据库D,T中所有满足用户指定的最小支持度的项目集,即大于或等于minsupport的I的非空子集

  4. 最大频繁项目集:在频繁项目集中挑出所有不被其他元素包含的频繁项目集!!

  5. 规则的可信度:包含I1,I2的事务数与包含I1的事务数之比(confidencex->(l-x))=support(l)-support(x1)

  6. 强关联规则:D在I上满足最小支持度和最小信任度的关联规则

关连规则挖掘问题可以划分成两个子问题:

  1. 发现频繁项目集
  2. 生成关联规则

下面看一个经典例题:

解题过程:

Apriori算法(经典的发现频繁项目集算法)分析相关推荐

  1. 12使用FP-growth算法来高效发现频繁项集

    第12章 使用FP-growth算法来高效发现频繁项集 一.背景 大家都用过搜索引擎.当我们输入一个单词或单词的一份,搜索引擎就会自动补全查询词项.例如:当我们在百度输入"为什么" ...

  2. 【机器学习实战】第12章 使用 FP-growth 算法来高效发现频繁项集

    第12章 使用FP-growth算法来高效发现频繁项集 前言 在 第11章 时我们已经介绍了用 Apriori 算法发现 频繁项集 与 关联规则. 本章将继续关注发现 频繁项集 这一任务,并使用 FP ...

  3. 使用FP-growth算法来高效发现频繁项集

    FP-growth算法基于Apriori构建,但采用了高级的数据结构减少扫描次数,大大加快了算法速度.FP-growth算法只需要对数据库进行两次扫描,而Apriori算法对于每个潜在的频繁项集都会扫 ...

  4. Apriori算法简介---关联规则的频繁项集算法

    由啤酒和尿布引出: 在一家超市中,人们发现了一个特别有趣的现象:尿布与啤酒这两种风马牛不相及的商品居然摆在一起.但这一奇怪的举措居然使尿布和啤酒的稍量大幅增加了.这可不是一个笑话,而是一直被商家所津津 ...

  5. Chapter 12 使用FP-growth算法来高效发现频繁项集

    本博文内容包括以下: 发现事务数据中的公共模式 FP-growth算法 发现twitter源中的共同词 FP-growth 算法 是基于Apriori算法,但在完成相同的任务(将数据集存储在一个特定的 ...

  6. 机器学习-使用FP-Growth算法来高效发现频繁项集

    FP-Growth算法是这里要介绍的第三个非监督学习算法,FP(Frequent Pattern)代表频繁模式.FP-Growth算法相对于Apriori算法来说效率更高,其只需要对数据集进行两轮扫描 ...

  7. 机器学习实战—使用FP-growth算法来高效发现频繁项集

    FP-growth算法基于Apriori构建,但采用了高级的数据结构减少扫描次数,大大加快了算法速度.FP-growth算法只需要对数据库进行两次扫描,而Apriori算法对于每个潜在的频繁项集都会扫 ...

  8. python 频繁项集_关联分析之发现频繁项集--使用Apriori算法(1)

    从大规模数据集中寻找物品间的隐含关系被称为关联分析,最有名的案例应该是啤酒和尿布了.这些关系可以用两种方式来量化,一个是使用频繁项集,给出经常在一起出现的元素项:一个是关联规则,每条关联规则意味着元素 ...

  9. python实现FP-growth算法发现频繁项集

    ★ FP-growth算法的作用: 该算法是代替Apriori算法来高效发现频繁集,但不能用于发现关联规则. ★ FP-growth算法的组成: 该算法需要构建三部分:1. 项头表   2. FP树  ...

最新文章

  1. 解决 Visual Studio 2017 RC 不兼容低版本 Visual Studio 创建的 MVC 4 项目的问题
  2. python和c++哪个好找工作-python和C++语言有何优缺点?哪个更适合人工智能?
  3. 2016.2.17文件夹选择框及文件选择框
  4. 旷视研究院博士图鉴|Be that challenger
  5. VTK:图像转结构化点用法实战
  6. 编程挑战:字符串的完美度
  7. 虚拟机运行Gazebo出现VMware: vmw_ioctl_command error
  8. BZOJ 1087 [SCOI2005]互不侵犯King(状压DP)
  9. Go的package学习
  10. day2--numpy
  11. java怎么实现直方图均衡化_直方图均衡化原理与实现
  12. (python版)《剑指Offer》JZ58:对称的二叉树
  13. linux中inotify+unison实现数据双向实时同步
  14. 领悟书生写论坛之类图设计
  15. 得到app文稿导出_得到app
  16. 谷歌小恐龙-有网也能玩儿
  17. 程序员必备的几个图标网站
  18. 重庆各大学计算机专业的录取分数线,重庆各高校历年录取分数线+王牌专业汇总!填报志愿必看!...
  19. centos安装telnet
  20. Android 布 局 翻 译 器

热门文章

  1. iPhone SE3值得入手吗,如今首批用户的评价新鲜出炉
  2. DRV8825 TB8825 最佳线路图布局
  3. zz: 胡适:赠与今年的大学毕业生
  4. JDBC进阶—— 师承尚硅谷(DAO)
  5. Unity植物大战僵尸游戏素材+源码
  6. 零基础自学UI设计要看什么书籍和资料
  7. oschina使用方法
  8. php注册阻止相同用户名,php如何禁止重复注册用户名
  9. nlp中的实体关系抽取方法总结
  10. 分享30个分类目录网站,seo优化首选,免费提交收录