一句话

关联分析(关联规则学习): 从大规模数据集中寻找物品间的隐含关系被称作 关联分析(associati analysis) 或者 关联规则学习(association rule learning)

一张图

解释一下这张图:
在关联规则Aprioir算法中,有两个很重要的概念,分别是频繁项集(frequent item sets),关联规则(associational rules),它们是用来描述隐含关系的形式。

频繁项集(frequent item sets): 经常出现在一块的物品的集合。
关联规则(associational rules): 暗示两种物品之间可能存在很强的关系。

那么 频繁 的定义是什么呢?怎么样才算频繁呢? 度量它们的方法有很多种,这里我们来简单的介绍下支持度和可信度。

支持度: 数据集中包含该项集的记录所占的比例。例如上图中,{豆奶} 的支持度为 4/5。{豆奶, 尿布} 的支持度为 3/5。
可信度: 针对一条诸如 {尿布} -> {葡萄酒} 这样具体的关联规则来定义的。这条规则的 可信度 被定义为 支持度({尿布, 葡萄酒})/支持度({尿布}),从图中可以看出 支持度({尿布, 葡萄酒}) = 3/5,支持度({尿布}) = 4/5,所以 {尿布} -> {葡萄酒} 的可信度 = 3/5 / 4/5 = 3/4 = 0.75。

举个栗子呗

还是上面的那个尿布和葡萄酒的栗子,让我们仔细的看一下它的关联规则的发现过程(Aprioir)

过程1:寻找k项频繁集


我们规定最小支持度为0.3
L1为1项频繁集,可以从图中看出它的计算过程为:

P(豆奶)=豆奶出现的次数订单总数量 P ( 豆 奶 ) = 豆 奶 出 现 的 次 数 订 单 总 数 量

P({豆奶})=\frac {豆奶出现的次数}{订单总数量}
L2为2项频繁集,从L1中选择候选者(去除了小于最小支持度的数据),计算过程为:

P(豆奶,莴苣)=豆奶,莴苣共同出现的次数订单总数量 P ( 豆 奶 , 莴 苣 ) = 豆 奶 , 莴 苣 共 同 出 现 的 次 数 订 单 总 数 量

P({豆奶,莴苣})=\frac {豆奶,莴苣共同出现的次数}{订单总数量}
同理可以推出L3

过程2:发现关联规则


这里举一个例子说明,买了尿布的人也会继续买葡萄酒的规则,支持度为0.6(前面已经算出),那么它的置信度计算过程为:

P(尿布−−>葡萄酒)=尿布,葡萄酒同时出现的概率尿布出现的概率=P(葡萄酒|尿布) P ( 尿 布 − − > 葡 萄 酒 ) = 尿 布 , 葡 萄 酒 同 时 出 现 的 概 率 尿 布 出 现 的 概 率 = P ( 葡 萄 酒 | 尿 布 )

P(尿布-->葡萄酒)=\frac{尿布,葡萄酒同时出现的概率}{尿布出现的概率}=P(葡萄酒|尿布)

以上就是Aprioir关联规则算法的整体思路啦!!!

一句话+一张图——说清楚Aprioir关联规则算法相关推荐

  1. 【机器学习-分类】一句话+一张图说清楚朴素贝叶斯算法(附案例+代码)

    说在前面 同一个算法本身存在各种不同的变体,即各种改进版本.一句话+一张图并不能涵盖所有情况,只是尽量用通俗的语言介绍其中经典的算法版本.希望对某算法本身不了解的人看完能迅速get到该算法在干什么:二 ...

  2. 我画了35张图就是为了让你深入 AQS

    来自:程序员cxuan 前言 谈到并发,我们不得不说AQS(AbstractQueuedSynchronizer),所谓的AQS即是抽象的队列式的同步器,内部定义了很多锁相关的方法,我们熟知的Reen ...

  3. 只有程序员才能看懂的30张图,绝配!

    点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达 周末轻松一下! 「1」 当我演示一个功能, 但它没有按预期进行时. 「2」 Bug 变 ...

  4. 25 张图读懂「文件系统」

    作者 | 小林coding 来源 | 小林coding(CodingLin) 文件系统的基本组成 文件系统是操作系统中负责管理持久数据的子系统,说简单点,就是负责把用户的文件存到磁盘硬件中,因为即使计 ...

  5. 三次简化一张图:一招理解LSTM/GRU门控机制

    机器之心专栏 作者:张皓 RNN 在处理时序数据时十分成功.但是,对 RNN 及其变种 LSTM 和 GRU 结构的理解仍然是一个困难的任务.本文介绍一种理解 LSTM 和 GRU 的简单通用的方法. ...

  6. 我画了35张图,就是为了让你深入理解 AQS

    前言 谈到并发,我们不得不说AQS(AbstractQueuedSynchronizer),所谓的AQS即是抽象的队列式的同步器,内部定义了很多锁相关的方法,我们熟知的ReentrantLock.Re ...

  7. 程序员才能看懂的30张图,看到最后一张我哭了

    「1」 当我演示一个功能, 但它没有按预期进行时. 「2」 Bug 变 Feature, 这招简直太帅了! 「3」 CPU新用途:烤肉 隔着屏幕都闻到一阵香气 「4」 当我修复一个隐藏Bug时 然后, ...

  8. cad必练10张图_CAD比例问题大详解!赶紧收藏!

    下面我们来按照从小白的起点学习比例问题: 对于比例问题,最关键的一点,就是要弄明白「现实世界」「CAD 的虚拟模型空间」「打印出来的图纸」这三个世界之间的关系.弄明白了这个,一切就迎刃而解了. 「现实 ...

  9. 一张图告诉你什么是系统架构师

    转载自 一张图告诉你什么是系统架构师 这张图从架构师的综合能力.岗位认识.岗位职责等方面,清楚的画出了作为一个架构的基本准则.人人都想成为架构师,可作为架构你达到了上面的要求了吗? 系统架构师是个神奇 ...

最新文章

  1. Spring Cloud(九)高可用的分布式配置中心 Spring Cloud Config 集成 Eureka 服务
  2. Gitlab代码管理仓库安装部署
  3. mysql计算多少天后的日期_数据库 - mysql 计算某个时间,多少天后,多少个月后时间戳...
  4. C#中容器控件GroupBox、Panel、TabControl
  5. VMwareTool 安装
  6. Spring Boot 自动配置的 “魔法” 是如何实现的?
  7. phpMyAdmin导入大的sql文件
  8. 多余的读写端口什么时候会对程序造成影响_程序员需要了解的硬核知识之控制硬件...
  9. Windows下CodeBlocks安装及配置注意事项
  10. 大数据_Flink_流式处理_简介_为什么要用Flink---Flink工作笔记0002
  11. 莫高窟永不褪色的微笑,照耀在华为未曾止步的数据保护征程
  12. 【通信】Matlab实现多同步压缩变换
  13. 如何在Word项目符号列表中将图片用作项目符号
  14. bootstrap table th内容太多表格撑破(自动换行)
  15. SDN(Software Defined Network) 软件定义网络学习
  16. Android6.0 ios,意超越iOS9!谷歌寄希望于Android6.0系统
  17. apa引用要在文中吗_引用还是抄袭?80%的大学生都搞不懂的学术写作!
  18. 一、Golang性能分析工具
  19. 【通信原理】第三章 -- 随机过程[下]
  20. 医号馆门诊管理软件SaaS系统——新开电子处方以及售药窗口操作手册

热门文章

  1. PMP笔记:Line Manager与Functional Manager
  2. 工作疑问之windows EFS加密后重装系统
  3. 计算机中的数学【费马大定理】 数学史上最著名的定理: x^n + y^n = z^n(n 2时,没有正整数解)...
  4. 《爬虫》爬取谷歌网页“人脸”图片
  5. 读书笔记,《刻意练习》,第三章,心理表征
  6. 时序分析 43 -- 时序数据转为空间数据 (二) 马尔可夫转换场
  7. 【UE4】使用Composure插件在场景或UI中实时显示CineCamera画面
  8. 惠普服务器报no bootable device were detected. Please attach a uefi.......处理
  9. Lively Wallpaper —— 优秀的开源视频壁纸软件
  10. 推荐几个不错的黑科技网站