1.支持度(Support)

支持度表示项集{X,Y}在总项集里出现的概率。公式为:

Support(X→Y) = P(X,Y) / P(I) = P(X∪Y) / P(I) = num(XUY) / num(I)

其中,I表示总事务集。num()表示求事务集里特定项集出现的次数。

比如,num(I)表示总事务集的个数

num(X∪Y)表示含有{X,Y}的事务集的个数(个数也叫次数)。

2.置信度 (Confidence)

置信度表示在先决条件X发生的情况下,由关联规则”X→Y“推出Y的概率。即在含有X的项集中,含有Y的可能性,公式为:

Confidence(X→Y) = P(Y|X) = P(X,Y) / P(X) = P(XUY) / P(X)

3.提升度(Lift)

提升度表示含有X的条件下,同时含有Y的概率,与不含X的条件下却含Y的概率之比。

Lift(X→Y) = P(Y|X) / P(Y)

例1,已知有1000名顾客买年货,分为甲乙两组,每组各500人,其中甲组有500人买了茶叶,同时又有450人买了咖啡;乙组有450人买了咖啡,如表(1)所示:

image.png

表(1)年货购买表

试求解 1)”茶叶→咖啡“的支持度

2) "茶叶→咖啡"的置信度

3)”茶叶→咖啡“的提升度

分析:

设X= {买茶叶},Y={买咖啡},则规则”茶叶→咖啡“表示”即买了茶叶,又买了咖啡“,于是,”茶叶→咖啡“的支持度为

Support(X→Y) = 450 / 500 = 90%

"茶叶→咖啡"的置信度为

Confidence(X→Y) = 450 / 500 = 90%

”茶叶→咖啡“的提升度为

Lift(X→Y) = Confidence(X→Y) / P(Y) = 90% / ((450+450) / 1000) = 90% / 90% = 1

由于提升度Lift(X→Y) =1,表示X与Y相互独立,即是否有X,对于Y的出现无影响。也就是说,是否购买咖啡,与有没有购买茶叶无关联。即规则”茶叶→咖啡“不成立,或者说关联性很小,几乎没有,虽然它的支持度和置信度都高达90%,但它不是一条有效的关联规则。

满足最小支持度和最小置信度的规则,叫做“强关联规则”。然而,强关联规则里,也分有效的强关联规则和无效的强关联规则。

如果Lift(X→Y)>1,则规则“X→Y”是有效的强关联规则。

如果Lift(X→Y) <=1,则规则“X→Y”是无效的强关联规则。

特别地,如果Lift(X→Y) =1,则表示X与Y相互独立。

mysql置信度支持度,支持度 置信度 提升度相关推荐

  1. 关联分析中的支持度、可信度和提升度

    关联规则下的几个参数: 支持度(Support):表示A和B同时使用的人数占所有用户数的比例,那么Support=P(A&B) 可信度(Confidence):表示使用A的用户中同时使用了B的 ...

  2. 【转载】关联分析中的支持度、置信度和提升度

    目录 1. 支持度(Support) 2. 置信度 (Confidence) 3. 提升度(Lift) 1. 支持度(Support) 支持度表示项集{X,Y}在总项集里出现的概率.公式为: Supp ...

  3. 关联分析中的支持度、置信度和提升度

    1.支持度(Support) 支持度表示项集{X,Y}在总项集里出现的概率.公式为: Support(X→Y) = P(X,Y) / P(I) = P(X∪Y) / P(I) = num(XUY) / ...

  4. 关联分析中的支持度、置信度和提升度 计算

    目录 项集(Itemset) 事务的宽度 支持度.置信度和提升度 定义 例一 例二 项集(Itemset) 包含0个或多个项的集合,如果包含k个项,则称为k-项集. 事务的宽度 事务中出现的项的个数 ...

  5. 关联规则 支持度 置信度 提升度

    1. 支持度(Support) 支持度是两件商品(X∩Y)在总销售笔数(N)中出现的概率,即X与Y同时被购买的概率. X.Y同时出现的概率 Support(X→Y) = P(XY) 2. 置信度 (C ...

  6. R语言使用apriori算法进行关联规则挖掘实战:关联规则概念、频繁项集、支持度(support)、置信度(confidence)、提升度(lift)、apriori算法

    R语言使用apriori算法进行关联规则挖掘实战:关联规则概念.频繁项集.支持度(support).置信度(confidence).提升度(lift).apriori算法 目录

  7. 关联规则概念、啤酒加尿布引出购物篮分析、频繁项集、支持度+置信度+提升度

    关联规则概念.啤酒加尿布引出购物篮分析.频繁项集.支持度+置信度+提升度 目录

  8. python 计算订单_python实现apriori算法的关联规则之支持度、置信度、提升度

    Apriori算法的简介 Apriori算法:使用候选项集找频繁项集 Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法.其核心是基于两阶段频集思想的递推算法.该关联规则在分类上属于单维 ...

  9. 支持度、置信度和提升度

    一般我们使用三个指标来度量一个关联规则,这三个指标分别是:支持度.置信度和提升度. Support(支持度):表示同时包含A和B的事务占所有事务的比例.如果用P(A)表示使用A事务的比例,那么Supp ...

最新文章

  1. W3C宣布成立Web性能工作组
  2. zynq学习06 zynq的PL中加入的AXI_GPIO IP核来控制GPIO操作
  3. B树、B-树、B+树、B*树(转)
  4. 覆盖你 80 % 网络生活的,竟是这样一家神秘实验室
  5. java正则表达式替换指定字符串_笔记_正则表达式替换字符串中特定范围内的字符。...
  6. extract和extractValue的差别
  7. str()和repre()的区别
  8. NoClassDefFoundError: org/apache/flink/metrics/MetricGroup
  9. js如何获取服务器端时间?
  10. mysql安装mac 压缩包_MAC mysql安装及设置
  11. react 中使用import()实现按需加载报错 解决方法 --‘import’ and ‘export’ may only appear at the top level
  12. 选择在共享模式中运行时使用的采样频率和位深度_优化的逻辑(三)干扰相关及扫频仪的使用...
  13. 5大最流行手机webAPP框架之Ionic
  14. java新的日期_java8你应该了解的新特性(新时间与日期API)
  15. 计算机应用软件专家证,计算机应用软件项目验收报告专家
  16. 简单.bat 代码蓝屏
  17. windows对计算机硬件有要求吗,win10对硬件有什么要求_win10硬件配置有哪些要求
  18. cf1111d(退背包)
  19. relation-graph实现企业架构图,关系图等(天眼查,企查查等企业架构图等实现)
  20. filedownload实现

热门文章

  1. intellij idea elixir 插件
  2. 动态加载jar包(一)
  3. D3D自定义的设备丢失对象
  4. 在ISA2006以SSL-TO-HTTP方式发布内部的WEB服务器(一)
  5. 多目标优化算法_阿里提出多目标优化全新算法框架,同时提升电商GMV和CTR
  6. 大家都在发圣诞树,我偏偏要发一个圣诞小游戏给大家玩【内附源码】
  7. 银行计算机系统(第3版),清华大学出版社-图书详情-《银行计算机系统》
  8. JAVA中为什么要用接口定义编程_【Java公开课|为什么要用Java接口,这些内容你一定要搞清楚】- 环球网校...
  9. android非空验证,Android 非空格式验证框架
  10. Python+OpenCV:级联分类器(Cascade Classifier)