关联分析的目的是找到事务间的关联性,用以指导决策行为。如“67%的顾客在购买啤酒的同时也会购买尿布”,因此通过合理的啤酒和尿布的货架摆放或捆绑销售可提高超市的服务质量和效益。又如“‘C语言’课程优秀的同学,在学习‘数据结构’时为优秀的可能性达88%”,那么就可以通过强化“C语言”的学习来提高教学效果。
接下来我会分为四部分来讲解

  我们先明确一些概念:

频繁项集:经常出现在一块儿的物品的集合。
关联规则:暗示两种物品之间可能存在很强的关系。
支持度(support):
项在事务中发生的频率。
支持度表示项集{X,Y}在总项集里出现的概率。
公式为:
Support(X- +Y) = P(X,Y)/P(I) = P(X∪Y) /P(I)
其中,I表示总事务集。
置信度(Confidence): .
表示在先决条件x发生的情况下,由关联规则”X→Y"推出Y的概率。
即在含有x的项集中,含有Y的可能性,公式为:
Confidence(X-→Y)= P(Y|X) = P(X,Y)/ P(X) = P(XUY)/ P(X)
提升度(Lift):
表示含有x的条件下,同时含有Y的概率,与Y总体发生的概率之比。
Lift(X→Y)= P(Y|X) / P(Y)
关于关联分析还有另外的算法,这里讲解Apriori算法


这里的逆否命题怎么理解呢?就是说比如一个项集{2,3},不是频繁的,那么它的超集{2,3,5}就一定不是频繁的。

下面我会举个例子,来讲解这个算法

由表,我们找出频繁项集(其中阈值是由我们随便设的)

剪枝加自连接,得到我们最后的频繁项集

由频繁项集产生强关联规则,然后算关联规则之间的置信度和提升度


由此我们得出,用户感兴趣的规则为儿童床→蚊帐或蚊帐→儿童床。

这里明确一个强关联规则中提升度的概念,要使我们两个东西之间关联是有效的,就需要计算提升度,大于1的提升度,才是用户感兴趣的,有效的。

那么怎么区分理解置信度和提升度?置信度也就是说在买了冰丝凉席之后又去买儿童床的概率,提升度则是衡量冰丝凉席→儿童床这条规则是否有效。如果冰丝凉席→儿童床=0,就说明两者独立不存在关联性,用户一般就会单独购买两者,不会一起买。就比如1号炒锅和2号炒锅,用户买了1号之后,就不会再买2号了,因为用户已经有了炒锅。=0就说明两者是这两种炒锅的关系。

关联分析法,超详解!进来秒懂!!相关推荐

  1. 【机器学习】关联分析Apriori算法详解以及代码实现

    Apriori算法以及统计学基础 什么是关联分析 简单的统计学基础 Apriori输出频繁集 从频繁项集中挖掘关联规则 什么是关联分析 从大规模数据集中寻找物品间的隐含关系被称作关联分析.而寻找物品的 ...

  2. 灰色关联分析法详解及python实践

    1. 关于灰色关联分析 1.1. 什么是灰色关联分析 灰色关联分析是指对一个系统发展变化态势的定量描述和比较的方法,其基本思想是通过确定参考数据列和若干个比较数据列的几何形状相似程度来判断其联系是否紧 ...

  3. DID会固定年份吗_倍分法DID详解 (三):多时点 DID (渐进DID) 的进一步分析

    作者:王昆仑 (天津大学) E-mail: shawn0513@163.com 连享会专题课程:DSGE 模型及应用 连享会 DSGE 专题课程 这是连享会「倍分法(DID)专题推文」系列的第三篇文章 ...

  4. rust如何在木板上上传图片_腐蚀rust游戏玩法方式详解

    在腐蚀这款游戏中玩家所有的物资都需要自己去寻找,不过很多时候遇到不怀好意的玩家时最好提高安全意识,及时躲避袭击,下面是游戏玩法发展方式详解. 游戏玩法方式详解 这里分两种发展方式 1.纯新手 首先需要 ...

  5. 线性规划之单纯形法【超详解+图解】-转载

    线性规划之单纯形法[超详解+图解] 目录 1.作用 2.线性规划的一般形式 5.1几何意义 5.2如何判断最优 5.3如何选择新的基变量 5.4如何选择被替换的基变量 5.5终止条件 标准型: 转化为 ...

  6. 消息队列超详解(以RabbitMQ和Kafka为例,为何使用消息队列、优缺点、高可用性、问题解决)

    消息队列超详解(以RabbitMQ和Kafka为例) 为什么要用消息队列这个东西? 先说一下消息队列的常见使用场景吧,其实场景有很多,但是比较核心的有3个:解耦.异步.削峰. 解耦:现场画个图来说明一 ...

  7. Android Telephony分析(三) ---- RILJ详解

    前言 本文主要讲解RILJ工作原理,以便更好地分析代码,分析业务的流程.  这里说的RILJ指的是RIL.java (frameworks\opt\telephony\src\java\com\And ...

  8. DID会固定年份吗_倍分法DID详解 (二):多时点 DID (渐进DID)

    作者:王昆仑 (天津大学) Stata连享会 计量专题  || 公众号合集 2020寒假Stata现场班 (北京, 1月8-17日,连玉君-江艇主讲) 「+助教招聘」 2020寒假Stata现场班 文 ...

  9. [C++ 系列] 90. 超详解C++思维导图

    这段时间针对 C++ 的学习到了一个收尾的阶段.目前所涉及到了 C++ 基础语法.大小知识点的学习.当然语言学习绝对离不开实战项目的练手,网络优质资源以及各类经典丛书也是 C++ 学习的巨大宝库.在此 ...

  10. 十日均线算法oracle,10日均线法的详解

    @@@.各位..注意该股必需是多头排列.....最好是多头市场.........这样正确率才高..收盘价在十天平均线上才可以考虑买入股票.股价跌破十天平均线时,必须卖出股票.有的人一定会觉得这太简单. ...

最新文章

  1. 数据库锁机制为什么很重要?
  2. 搜索文件夹下包含的文件
  3. oracle lms进程 内存,Oracle RAC 内存融合(Cache Fusion)
  4. [js] pjax和ajax的区别是什么?
  5. hibernate 多条件组合查询之sql拼接
  6. Modbus教程| Modbus协议,ASCII和RTU帧,Modbus工作
  7. pytorch DistributedDataParallel提示未参与loss计算的变量错误
  8. Behavior Designer知识点
  9. secureCRT 如何上传下载文件
  10. 卧槽!真可恶,竟然有人贩卖儿童软色情表情包,网友:...
  11. 数字电子技术基础笔记
  12. java毕业设计社区食堂供餐源码+lw文档+mybatis+系统+mysql数据库+调试
  13. 关于Win8引导菜单风格切换
  14. cpu亲和力总结taskset和setcpu及其他相关
  15. 【论文翻译笔记】Seamlessly Unifying Attributes and Items: Conversational Recommendation for Cold-Start User
  16. 前端二面必会面试题(附答案)
  17. 基于Java+SpringBoot+Thymeleaf+Mysql在线电子书阅读系统学习系统设计与实现
  18. android studio引入lib,Android studio项目引入另外一个项目做为Lib
  19. 基于任务复制的异构集群并行程序的执行
  20. 【精】iOS知识树,知识点(包括对象、Block、消息转发、GCD、运行时、runloop、动画、Push、KVO、tableview,UIViewController、提交AppStore)

热门文章

  1. [Irving]SQL去重复-DISTINCT用法
  2. html是什么意思?
  3. macbookair有没有touchbar_Touch Bar 真的好用吗?苹果全新 MacBook Pro 触控条上手体验...
  4. 企业微信企业邮箱设置,微信企业邮箱如何设置?
  5. Python面试简历技能点写法总结
  6. 华为实验跨交换机不同vlan通信
  7. IllegalStateException: Only fullscreen opaque activities can request orientation
  8. ubuntu snap 安装的nextcloud 忘记管理员密码,重新设置密码。
  9. Java - java代码实现ip归属地查询,调用百度ip地址查询,局域网也能查询到位置
  10. html中css设置td高度,如何使div填充td高度