mysql置信度支持度,支持度 置信度 提升度
1.支持度(Support)
支持度表示项集{X,Y}在总项集里出现的概率。公式为:
Support(X→Y) = P(X,Y) / P(I) = P(X∪Y) / P(I) = num(XUY) / num(I)
其中,I表示总事务集。num()表示求事务集里特定项集出现的次数。
比如,num(I)表示总事务集的个数
num(X∪Y)表示含有{X,Y}的事务集的个数(个数也叫次数)。
2.置信度 (Confidence)
置信度表示在先决条件X发生的情况下,由关联规则”X→Y“推出Y的概率。即在含有X的项集中,含有Y的可能性,公式为:
Confidence(X→Y) = P(Y|X) = P(X,Y) / P(X) = P(XUY) / P(X)
3.提升度(Lift)
提升度表示含有X的条件下,同时含有Y的概率,与不含X的条件下却含Y的概率之比。
Lift(X→Y) = P(Y|X) / P(Y)
例1,已知有1000名顾客买年货,分为甲乙两组,每组各500人,其中甲组有500人买了茶叶,同时又有450人买了咖啡;乙组有450人买了咖啡,如表(1)所示:
image.png
表(1)年货购买表
试求解 1)”茶叶→咖啡“的支持度
2) "茶叶→咖啡"的置信度
3)”茶叶→咖啡“的提升度
分析:
设X= {买茶叶},Y={买咖啡},则规则”茶叶→咖啡“表示”即买了茶叶,又买了咖啡“,于是,”茶叶→咖啡“的支持度为
Support(X→Y) = 450 / 500 = 90%
"茶叶→咖啡"的置信度为
Confidence(X→Y) = 450 / 500 = 90%
”茶叶→咖啡“的提升度为
Lift(X→Y) = Confidence(X→Y) / P(Y) = 90% / ((450+450) / 1000) = 90% / 90% = 1
由于提升度Lift(X→Y) =1,表示X与Y相互独立,即是否有X,对于Y的出现无影响。也就是说,是否购买咖啡,与有没有购买茶叶无关联。即规则”茶叶→咖啡“不成立,或者说关联性很小,几乎没有,虽然它的支持度和置信度都高达90%,但它不是一条有效的关联规则。
满足最小支持度和最小置信度的规则,叫做“强关联规则”。然而,强关联规则里,也分有效的强关联规则和无效的强关联规则。
如果Lift(X→Y)>1,则规则“X→Y”是有效的强关联规则。
如果Lift(X→Y) <=1,则规则“X→Y”是无效的强关联规则。
特别地,如果Lift(X→Y) =1,则表示X与Y相互独立。
mysql置信度支持度,支持度 置信度 提升度相关推荐
- 关联分析中的支持度、可信度和提升度
关联规则下的几个参数: 支持度(Support):表示A和B同时使用的人数占所有用户数的比例,那么Support=P(A&B) 可信度(Confidence):表示使用A的用户中同时使用了B的 ...
- 【转载】关联分析中的支持度、置信度和提升度
目录 1. 支持度(Support) 2. 置信度 (Confidence) 3. 提升度(Lift) 1. 支持度(Support) 支持度表示项集{X,Y}在总项集里出现的概率.公式为: Supp ...
- 关联分析中的支持度、置信度和提升度
1.支持度(Support) 支持度表示项集{X,Y}在总项集里出现的概率.公式为: Support(X→Y) = P(X,Y) / P(I) = P(X∪Y) / P(I) = num(XUY) / ...
- 关联分析中的支持度、置信度和提升度 计算
目录 项集(Itemset) 事务的宽度 支持度.置信度和提升度 定义 例一 例二 项集(Itemset) 包含0个或多个项的集合,如果包含k个项,则称为k-项集. 事务的宽度 事务中出现的项的个数 ...
- 关联规则 支持度 置信度 提升度
1. 支持度(Support) 支持度是两件商品(X∩Y)在总销售笔数(N)中出现的概率,即X与Y同时被购买的概率. X.Y同时出现的概率 Support(X→Y) = P(XY) 2. 置信度 (C ...
- R语言使用apriori算法进行关联规则挖掘实战:关联规则概念、频繁项集、支持度(support)、置信度(confidence)、提升度(lift)、apriori算法
R语言使用apriori算法进行关联规则挖掘实战:关联规则概念.频繁项集.支持度(support).置信度(confidence).提升度(lift).apriori算法 目录
- 关联规则概念、啤酒加尿布引出购物篮分析、频繁项集、支持度+置信度+提升度
关联规则概念.啤酒加尿布引出购物篮分析.频繁项集.支持度+置信度+提升度 目录
- python 计算订单_python实现apriori算法的关联规则之支持度、置信度、提升度
Apriori算法的简介 Apriori算法:使用候选项集找频繁项集 Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法.其核心是基于两阶段频集思想的递推算法.该关联规则在分类上属于单维 ...
- 支持度、置信度和提升度
一般我们使用三个指标来度量一个关联规则,这三个指标分别是:支持度.置信度和提升度. Support(支持度):表示同时包含A和B的事务占所有事务的比例.如果用P(A)表示使用A事务的比例,那么Supp ...
最新文章
- W3C宣布成立Web性能工作组
- zynq学习06 zynq的PL中加入的AXI_GPIO IP核来控制GPIO操作
- B树、B-树、B+树、B*树(转)
- 覆盖你 80 % 网络生活的,竟是这样一家神秘实验室
- java正则表达式替换指定字符串_笔记_正则表达式替换字符串中特定范围内的字符。...
- extract和extractValue的差别
- str()和repre()的区别
- NoClassDefFoundError: org/apache/flink/metrics/MetricGroup
- js如何获取服务器端时间?
- mysql安装mac 压缩包_MAC mysql安装及设置
- react 中使用import()实现按需加载报错 解决方法 --‘import’ and ‘export’ may only appear at the top level
- 选择在共享模式中运行时使用的采样频率和位深度_优化的逻辑(三)干扰相关及扫频仪的使用...
- 5大最流行手机webAPP框架之Ionic
- java新的日期_java8你应该了解的新特性(新时间与日期API)
- 计算机应用软件专家证,计算机应用软件项目验收报告专家
- 简单.bat 代码蓝屏
- windows对计算机硬件有要求吗,win10对硬件有什么要求_win10硬件配置有哪些要求
- cf1111d(退背包)
- relation-graph实现企业架构图,关系图等(天眼查,企查查等企业架构图等实现)
- filedownload实现
热门文章
- intellij idea elixir 插件
- 动态加载jar包(一)
- D3D自定义的设备丢失对象
- 在ISA2006以SSL-TO-HTTP方式发布内部的WEB服务器(一)
- 多目标优化算法_阿里提出多目标优化全新算法框架,同时提升电商GMV和CTR
- 大家都在发圣诞树,我偏偏要发一个圣诞小游戏给大家玩【内附源码】
- 银行计算机系统(第3版),清华大学出版社-图书详情-《银行计算机系统》
- JAVA中为什么要用接口定义编程_【Java公开课|为什么要用Java接口,这些内容你一定要搞清楚】- 环球网校...
- android非空验证,Android 非空格式验证框架
- Python+OpenCV:级联分类器(Cascade Classifier)