prefixspan是挖掘频繁子序列,子序列不一定是连续的,当心!!!
序列模式挖掘是从序列数据库中发现频繁子序列作为模式。
子序列与频繁序列
了解了序列数据的概念,我们再来看看上面是子序列。子序列和我们数学上的子集的概念很类似,也就是说,如果某个序列A所有的项集在序列B中的项集都可以找到,则A就是B的子序列。当然,如果用严格的数学描述,子序列是这样的:
对于序列A={a1,a2,...ana1,a2,...an}和序列B={b1,b2,...bmb1,b2,...bm},n≤mn≤m,如果存在数字序列1≤j1≤j2≤...≤jn≤m1≤j1≤j2≤...≤jn≤m, 满足a1⊆bj1,a2⊆bj2...an⊆bjna1⊆bj1,a2⊆bj2...an⊆bjn,则称A是B的子序列。当然反过来说, B就是A的超序列。
而频繁序列则和我们的频繁项集很类似,也就是频繁出现的子序列。比如对于下图,支持度阈值定义为50%,也就是需要出现两次的子序列才是频繁序列。而子序列<(ab)c>是频繁序列,因为它是图中的第一条数据和第三条序列数据的子序列,对应的位置用蓝色标示。
看到了吧,没有要求abc是必须连续的子列。
如何用在用户行为异常检测呢?????既然不是连续子序列的话????
转载于:https://www.cnblogs.com/bonelee/p/10756915.html
prefixspan是挖掘频繁子序列,子序列不一定是连续的,当心!!!相关推荐
- 【数据挖掘笔记六】挖掘频繁模式、关联和相关性:基本概念和方法
6.挖掘频繁模式.关联和相关性:基本概念和方法 频繁模式(frequent pattern)是频繁地出现在数据集中的模式. 6.1 基本概念 频繁模式挖掘搜索给定数据集中反复出现的联系,旨在发现大型事 ...
- 挖掘频繁模式、关联和相关性:基本概念和方法
基本概念 频繁模式挖掘搜索给定数据及中国反复出现的联系. 购物篮分析:一个例子 频繁项集.闭项集和关联规则 规则的支持度和置信度是规则兴趣度的两种度量. 一个例子: 支持度:支持度为2%,意味着分析的 ...
- 挖掘频繁模式、关联和Apriori算法
挖掘频繁模式.关联和Apriori算法 1. 引入 1.1 基本概念 频繁模式:频繁出现在数据集中的模式 频繁模式挖掘:获取到给定数据集中反复出现的联系 注:模式其实可以理解为,你在淘宝购物,你的购物 ...
- apriori算法_挖掘频繁模式、关联和Apriori算法
挖掘频繁模式.关联和Apriori算法 1. 引入 1.1 基本概念 频繁模式:频繁出现在数据集中的模式 频繁模式挖掘:获取到给定数据集中反复出现的联系 注:模式其实可以理解为,你在淘宝购物,你的购物 ...
- 河北工业大学数据挖掘实验三 应用 Apriori 算法挖掘频繁项集
河北工业大学数据挖掘实验三 应用 Apriori 算法挖掘频繁项集 一.实验目的 二.实验原理 1.Apriori 算法 2.提高频繁项集逐层产生的效率 三.实验内容和步骤 1.实验内容 2.实验步骤 ...
- 使用python挖掘频繁项集
本实验包含以下内容: 学习挖掘频繁项集,掌握apriori算法 1.实现用apriori算法挖掘频繁项集(最小支持度计数2) 2.分析你所实现的apriori算法的缺点 3. 数据集: 数据集 TID ...
- python 频繁项集_Apriori算法:从数据中挖掘频繁项集
简介 Apriori是一种流行的算法,用于在关联规则学习中提取频繁项集.Apriori算法被设计用于对包含交易的数据库进行操作,例如商店客户的购买.如果项目集满足用户指定的支持阈值,则该项目集被视为& ...
- Apriori算法挖掘频繁项集
用Apriori或者FP-growth算法挖掘出所有的频繁项集,并写出具体的实现代码.假设事务数据库D表1:最小支持度计数为2. 下图是以Apriori算法为例. 表1 事务数据库D Ti ...
- 挖掘频繁模式、关联和相关
前言 如何从大量的事务的或关系的数据中发现关联规则? 如何挖掘多层和多维空间中的关联规则? 什么样的关联规则是最有趣的? 如何帮助或指导挖掘过程发现有趣的关联或相关? 如何利用用户选择的参数或约束加快 ...
最新文章
- 定期定量采购_采购的四种方法
- linux dhcp服务器配置及小实验
- DOM中 property 和 attribute 详解
- 程序设计导引及在线实践_四金一银!西电在计算机系统与程序设计竞赛再创佳绩...
- mysql创建多个联合索引吗_高性能索引油画策略(二):多个索引是独立建立索引还是建联合索引?...
- 计算机应用备课教案,计算机应用基础教案备课(全套).doc
- 诺基亚 PC Internet 访问 N70为例
- JAVA 9中module初探
- SQL Server 修改字段名
- 环境篇:CM+CDH6.3.2环境搭建(全网最全)
- 推荐一款办公室必备股票看盘工具
- Swipe轮播插件的使用
- JS在H5下实现本地历史搜索记录
- 绑定变量窥视_窥视量子计算与密码学
- QT中的sender函数,result函数
- 用c语言实现文本文件中的字符筛选分析(二)
- Graph Visualization and Navigation in Information Visualization: A Survey 译文
- 蝴蝶效应,鳄鱼法则,罗森塔尔效应,帕金森定律,手表定律,破窗理论,晕轮效应 ,霍桑效应,二八定律,木桶理论,马太效应,踢猫效应…………
- 成都计算机高校排名,成都排名前十的大学 2021高校最新排行榜
- 网红姓名被抢注商标,你自己的名字还安全吗?
热门文章
- 一. 视频信息与压缩编码
- 查看LINUX进程内存占用情况 top pmap ps
- 单元格格式_你最想要的自定义单元格格式来了!
- 微助教课件怎么下载_初中英语八年级下册Unit3课堂要点归纳,知识点睛,语法练习(可下载打印,附答案)...
- 学校为什么要单位接收函_温江会计培训学校:为什么要学习会计实操
- JAVA中的通配符的符号_Linux下的通配符和特殊符号用法详解
- mysql mydumper_采用mydumper对MySQL部分数据库进行热备
- 史上超级详细:HashMap源码分析,你了解到源码的魅力了嘛
- 【深度学习】基于Pytorch的卷积神经网络概念解析和API妙用(二)
- python【数据结构与算法】内置函数enumerate(枚举) 函数(看不懂你来打我)