【转载】关联分析中的支持度、置信度和提升度
目录
1. 支持度(Support)
2. 置信度 (Confidence)
3. 提升度(Lift)
1. 支持度(Support)
支持度表示项集{X,Y}在总项集里出现的概率。公式为:
Support(X→Y) = P(X,Y) / P(I) = P(X Y) / P(I) = num(X Y) / num(I)
其中,I表示总事务集。num()表示求事务集里特定项集出现的次数。
比如,num(I)表示总事务集的个数;num(X Y)表示含有{X,Y}的事务集的个数(个数也叫次数)。
2. 置信度 (Confidence)
置信度表示在先决条件X发生的情况下,由关联规则”X→Y“推出Y的概率。即在含有X的项集中,含有Y的可能性,公式为:
Confidence(X→Y) = P(Y|X) = P(X,Y) / P(X) = P(X Y) / P(X)
Confidence(Y→X) = P(X|Y) = P(X,Y) / P(Y) = P(X Y) / P(Y)
3. 提升度(Lift)
提升度表示含有X的条件下,同时含有Y的概率,与Y总体发生的概率之比。
Lift(X→Y) = P(Y|X) / P(Y)
注:提升度 = 置信度 / 支持度 (lift(X->Y)=confidence(X->Y) / support(Y))
例1,已知有1000名顾客买年货,分为甲乙两组,每组各500人,其中甲组有500人买了茶叶,同时又有450人买了咖啡;乙组有450人买了咖啡,如表(1)所示:
表(1)年货购买表
试求解 1)”茶叶→咖啡“的支持度
2) "茶叶→咖啡"的置信度
3)”茶叶→咖啡“的提升度
分析:
设X= {买茶叶},Y={买咖啡},则规则”茶叶→咖啡“表示”即买了茶叶,又买了咖啡“,于是,”茶叶→咖啡“的支持度为
Support(X→Y) = 450 / 500 = 90%
"茶叶→咖啡"的置信度为
Confidence(X→Y) = 450 / 500 = 90%
”茶叶→咖啡“的提升度为
Lift(X→Y) = Confidence(X→Y) / P(Y) = 90% / ((450+450) / 1000) = 90% / 90% = 1
由于提升度Lift(X→Y) =1,表示X与Y相互独立,即是否有X,对于Y的出现无影响。也就是说,是否购买咖啡,与有没有购买茶叶无关联。即规则”茶叶→咖啡“不成立,或者说关联性很小,几乎没有,虽然它的支持度和置信度都高达90%,但它不是一条有效的关联规则。
满足最小支持度和最小置信度的规则,叫做“强关联规则”。然而,强关联规则里,也分有效的强关联规则和无效的强关联规则。
如果Lift(X→Y)>1,则规则“X→Y”是有效的强关联规则。
如果Lift(X→Y) <=1,则规则“X→Y”是无效的强关联规则。
特别地,如果Lift(X→Y) =1,则表示X与Y相互独立。
参考链接:
https://blog.csdn.net/sanqima/article/details/42746419
https://blog.csdn.net/weixin_42057852/article/details/82661667
【转载】关联分析中的支持度、置信度和提升度相关推荐
- 关联分析中的支持度、置信度和提升度 计算
目录 项集(Itemset) 事务的宽度 支持度.置信度和提升度 定义 例一 例二 项集(Itemset) 包含0个或多个项的集合,如果包含k个项,则称为k-项集. 事务的宽度 事务中出现的项的个数 ...
- 数据挖掘关联分析中的支持度、置信度和提升度
购物篮分析: 利用关联分析的方法可以发现联系如关联规则或频繁项集. 二元表示:每一行对应一个事务,每列对应一个项,项用二元变量表示,项在事务中出现比不出现更重要,因此项是非对称的的二元变量. 项集(I ...
- 关联分析中的支持度、置信度和提升度
1.支持度(Support) 支持度表示项集{X,Y}在总项集里出现的概率.公式为: Support(X→Y) = P(X,Y) / P(I) = P(X∪Y) / P(I) = num(XUY) / ...
- 关联分析中的支持度、可信度和提升度
关联规则下的几个参数: 支持度(Support):表示A和B同时使用的人数占所有用户数的比例,那么Support=P(A&B) 可信度(Confidence):表示使用A的用户中同时使用了B的 ...
- 基因组关联分析中的交互作用研究
基因组关联分析中的交互作用研究 语音 编辑 讨论 上传视频 本词条缺少概述图,补充相关内容使词条更完整,还能快速升级,赶紧来编辑吧! <基因组关联分析中的交互作用研究>是依托中国科学技术大 ...
- 全基因组关联分析中上位性检测算法的研究
全基因组关联分析中上位性检测算法的研究 前言 这个项目主要是分享一些全基因组关联分析中上位性检测算法的研究经验,算是,怎么入门,写这么个东西,一是做总结,二是咱实验室估计以后还会有做这个方向的,备着吧 ...
- python 计算订单_python实现apriori算法的关联规则之支持度、置信度、提升度
Apriori算法的简介 Apriori算法:使用候选项集找频繁项集 Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法.其核心是基于两阶段频集思想的递推算法.该关联规则在分类上属于单维 ...
- 支持度、置信度和提升度
一般我们使用三个指标来度量一个关联规则,这三个指标分别是:支持度.置信度和提升度. Support(支持度):表示同时包含A和B的事务占所有事务的比例.如果用P(A)表示使用A事务的比例,那么Supp ...
- 支持度、置信度、提升度、apriori算法理解(简易版)
关于支持度.置信度.提升度以及apriori算法的理解(简单版) 理解支持度 所谓支持度,就是比如说10个用户购买商品,有8个用户购买商品A,那么商品A的支持度就是80%.支持度越大,关联规则越重要, ...
最新文章
- NSLog打印自定义对象
- 阿里大佬总结的算法进阶指南,助你进大厂!
- 给你的开源项目加一个绶带吧
- JavaScript设计模式学习——builder pattern(建造者模式)
- gorm框架:user role用户角色一对一关联Model编写
- 《JavaScript面向对象精要》——1.9 总结
- cmd怎么进入linux系统时间,Linux怎么更改命令提示符信息
- Windows7修改hosts提示:您没有权限在此位置中保存文件
- php mysql查询例子_php mysqli多个查询的例子
- “隐私经济”有未来吗?
- JavaScript对象的常用属性及使用
- Python 认识字典
- 20220626-JAVA高德地图天气API调用总结
- 一阶系统开环传递函数表达式_第四讲 控制系统的方框图
- 多行文字省略(涵盖标点符号,中英文等复杂字符串)
- 【DBAI】《基于机器学习的数据库技术综述》
- FPGA零基础学习:数字电路中的数字表示
- 寻找不能拼读的汉语拼音
- PHPMYWIND 图片信息调用
- java 计算九宫格_Java计算手机九宫格锁屏图案连接9个点的方案总数
热门文章
- go定时器 每天重复_Go 简单性的价值:来自对 Go 倍加青睐的谷歌软件工程师的自述...
- MFC对话框自适应大小(四舍五入)高精度版本
- 训练时发生的错误:Couldn‘t open shared file mapping: <000001910A228862>, error code: <1455>
- vue组件的通信方式
- layui复选框组件:如何操控隐藏域实现checked状态切换(含代码、案例、截图)
- phpcmsV9上传文件类型的设置
- vue.js踩坑之单向数据流
- HTML字符实体(常用特殊字符)
- linux kvm服务,Linux-让Kvm虚拟机开放服务端口!
- 小程序 bindtouchmove 使用拖动按钮 页面跟着滑动并拖动卡顿感 问题