挖掘频繁模式、关联和相关
前言
- 如何从大量的事务的或关系的数据中发现关联规则?
- 如何挖掘多层和多维空间中的关联规则?
- 什么样的关联规则是最有趣的?
- 如何帮助或指导挖掘过程发现有趣的关联或相关?
- 如何利用用户选择的参数或约束加快挖掘过程?
规则的支持度(support)和置信度(confidence)是规则兴趣度的两种度量.它们分别反映所发现的规则的有用性和确定性.
设 I = {I1, I2, ..., Im}是项的集合.设任务相关的数据D是数据库事务的集合,其中每个事务T是项的集合,使得T⊆I.每一个事务有一个标识符,称作TID.设A是一个项集,事务T包含A当且仅当A⊆T.关联规则是形如A => B的蕴含式,其中A⊂I,B⊂I,并且A∩B=∅.规则A => B在事务集D中成立,具有支持度s,其中s是D中事务包含A∪B(即集合A和B的并或A和B二者)的百分比.它是概率P(A∪B).规则A => B在事务集D中具有置信度c,其中c是D中包含A的事务同时也包含B的百分比.这是条件概率P(B|A).即
support(A => B) = P(A∪B)
confidence(A => B) = P(B|A)
同时满足最小支持度阀值(min_sup)和最小置信度阀值(min_conf)的规则称作强规则.为方便计算,我们用0~100%之间的值,而不是用0~1.0之间的值表示支持度和置信度.
转载于:https://www.cnblogs.com/yosg/p/4755469.html
挖掘频繁模式、关联和相关相关推荐
- 【数据挖掘笔记六】挖掘频繁模式、关联和相关性:基本概念和方法
6.挖掘频繁模式.关联和相关性:基本概念和方法 频繁模式(frequent pattern)是频繁地出现在数据集中的模式. 6.1 基本概念 频繁模式挖掘搜索给定数据集中反复出现的联系,旨在发现大型事 ...
- 挖掘频繁模式、关联和相关性:基本概念和方法
基本概念 频繁模式挖掘搜索给定数据及中国反复出现的联系. 购物篮分析:一个例子 频繁项集.闭项集和关联规则 规则的支持度和置信度是规则兴趣度的两种度量. 一个例子: 支持度:支持度为2%,意味着分析的 ...
- 挖掘频繁模式、关联和Apriori算法
挖掘频繁模式.关联和Apriori算法 1. 引入 1.1 基本概念 频繁模式:频繁出现在数据集中的模式 频繁模式挖掘:获取到给定数据集中反复出现的联系 注:模式其实可以理解为,你在淘宝购物,你的购物 ...
- apriori算法_挖掘频繁模式、关联和Apriori算法
挖掘频繁模式.关联和Apriori算法 1. 引入 1.1 基本概念 频繁模式:频繁出现在数据集中的模式 频繁模式挖掘:获取到给定数据集中反复出现的联系 注:模式其实可以理解为,你在淘宝购物,你的购物 ...
- 频繁模式挖掘——概述
频繁模式挖掘(Frequent Pattern Mining) 基本概念 a. 频繁模式(frequent pattern)是频繁地出现在数据集中的模式(如项集.子序列或子结构). 例如: i. 频繁 ...
- 十七、频繁模式、关联和相关性的基本概念和方法
1.挖掘频繁模式.关联和相关性 动机:寻找数据的内在规律 什么样的产品会经常在一起购买? 当购买一台电脑后,后续会有哪些购买行为? 数据离散化是一种数据变换形式. 数据变换策略概述 通过规范化变换数据 ...
- 数据挖掘(一)频繁模式挖掘算法的实现和对比
注:参考多篇CSDN文章所得 一.实验内容 巩固频繁模式挖掘的基本算法原理及特点,设计程序,基于不同特征的数据集比较不同方法的优缺点,并基于算法原理和特点分析造成这种现象的原因. 二.算法原理 1 A ...
- 关联规则(挖掘),数据关联(融合)
3月9日07:49| 新浪博客| 来源:时空交互| 查看原文> 关联式规则 关联式规则(Association Rules, AR),又称关联规则,是数据挖掘的一个重要课题,用于从大量数据 ...
- FP-Tree频繁模式树算法
参考资料:http://blog.csdn.net/sealyao/article/details/6460578 更多数据挖掘算法:https://github.com/linyiqun/DataM ...
最新文章
- Parallax Mapping Shader 凸凹感【转】
- 关于path.join,path.resolve的详细介绍
- win10 ObservableCollection 排序自动收缩问题
- Python 2退出历史舞台 一句话证明它的重要性
- SAP HANA Hint简介
- python中对字符串进行编码_Python 中的字符串编码
- 对ios中CGContextRef和image的处理
- MFC开发IM--MFC非模态对话框的创建及显示
- 如何将自己的网站分享到QQ空间,微信,微博等等。
- 将原生安卓项目封装为cordova插件实例分析
- 大数据技术与人工智能的关系
- 市盈率相对盈利增长比率PEG
- 【记录】凯酷84说明书
- 钉钉生成jspapi token出现IP地址不在白名单的解决办法
- 让 Odoo POS 支持廉价小票打印机
- 在html中如何画斜线,在CSS中绘制斜线
- 笔记本win10系统连接wifi显示无Internet安全如何解决
- 服务器上传,时间超时 tomcat 如何设置保持连接
- JsonParser
- Java并发编程(一)—— FutureTask超详细教程
热门文章
- Golang加密md5
- 个人计算机的安全设置,个人计算机安全设置..doc
- php中命名空间重要吗,关于php:PHP中命名空间是怎样的存在一
- linux启动exe出来SQLite问题,CentOS 7下sqlite3的问题修复
- 金融业如何更好地利用大数据实现突破性变革?(实例解读)
- 11.1 安装配置Apache
- 对 makefile中 order-only 前提条件的理解
- 命令行编译xcodebuild
- linux设备驱动归纳总结(六):2.分享中断号【转】
- 基于SMB协议的共享文件读写 博客分类: Java