序列模式挖掘是从序列数据库中发现频繁子序列作为模式。

子序列与频繁序列

    了解了序列数据的概念,我们再来看看上面是子序列。子序列和我们数学上的子集的概念很类似,也就是说,如果某个序列A所有的项集在序列B中的项集都可以找到,则A就是B的子序列。当然,如果用严格的数学描述,子序列是这样的:

    对于序列A={a1,a2,...ana1,a2,...an}和序列B={b1,b2,...bmb1,b2,...bm},n≤mn≤m,如果存在数字序列1≤j1≤j2≤...≤jn≤m1≤j1≤j2≤...≤jn≤m, 满足a1⊆bj1,a2⊆bj2...an⊆bjna1⊆bj1,a2⊆bj2...an⊆bjn,则称A是B的子序列。当然反过来说, B就是A的超序列。

    而频繁序列则和我们的频繁项集很类似,也就是频繁出现的子序列。比如对于下图,支持度阈值定义为50%,也就是需要出现两次的子序列才是频繁序列。而子序列<(ab)c>是频繁序列,因为它是图中的第一条数据和第三条序列数据的子序列,对应的位置用蓝色标示。

看到了吧,没有要求abc是必须连续的子列。

如何用在用户行为异常检测呢?????既然不是连续子序列的话????

转载于:https://www.cnblogs.com/bonelee/p/10756915.html

prefixspan是挖掘频繁子序列,子序列不一定是连续的,当心!!!相关推荐

  1. 【数据挖掘笔记六】挖掘频繁模式、关联和相关性:基本概念和方法

    6.挖掘频繁模式.关联和相关性:基本概念和方法 频繁模式(frequent pattern)是频繁地出现在数据集中的模式. 6.1 基本概念 频繁模式挖掘搜索给定数据集中反复出现的联系,旨在发现大型事 ...

  2. 挖掘频繁模式、关联和相关性:基本概念和方法

    基本概念 频繁模式挖掘搜索给定数据及中国反复出现的联系. 购物篮分析:一个例子 频繁项集.闭项集和关联规则 规则的支持度和置信度是规则兴趣度的两种度量. 一个例子: 支持度:支持度为2%,意味着分析的 ...

  3. 挖掘频繁模式、关联和Apriori算法

    挖掘频繁模式.关联和Apriori算法 1. 引入 1.1 基本概念 频繁模式:频繁出现在数据集中的模式 频繁模式挖掘:获取到给定数据集中反复出现的联系 注:模式其实可以理解为,你在淘宝购物,你的购物 ...

  4. apriori算法_挖掘频繁模式、关联和Apriori算法

    挖掘频繁模式.关联和Apriori算法 1. 引入 1.1 基本概念 频繁模式:频繁出现在数据集中的模式 频繁模式挖掘:获取到给定数据集中反复出现的联系 注:模式其实可以理解为,你在淘宝购物,你的购物 ...

  5. 河北工业大学数据挖掘实验三 应用 Apriori 算法挖掘频繁项集

    河北工业大学数据挖掘实验三 应用 Apriori 算法挖掘频繁项集 一.实验目的 二.实验原理 1.Apriori 算法 2.提高频繁项集逐层产生的效率 三.实验内容和步骤 1.实验内容 2.实验步骤 ...

  6. 使用python挖掘频繁项集

    本实验包含以下内容: 学习挖掘频繁项集,掌握apriori算法 1.实现用apriori算法挖掘频繁项集(最小支持度计数2) 2.分析你所实现的apriori算法的缺点 3. 数据集: 数据集 TID ...

  7. python 频繁项集_Apriori算法:从数据中挖掘频繁项集

    简介 Apriori是一种流行的算法,用于在关联规则学习中提取频繁项集.Apriori算法被设计用于对包含交易的数据库进行操作,例如商店客户的购买.如果项目集满足用户指定的支持阈值,则该项目集被视为& ...

  8. Apriori算法挖掘频繁项集

    用Apriori或者FP-growth算法挖掘出所有的频繁项集,并写出具体的实现代码.假设事务数据库D表1:最小支持度计数为2. 下图是以Apriori算法为例.       表1 事务数据库D Ti ...

  9. 挖掘频繁模式、关联和相关

    前言 如何从大量的事务的或关系的数据中发现关联规则? 如何挖掘多层和多维空间中的关联规则? 什么样的关联规则是最有趣的? 如何帮助或指导挖掘过程发现有趣的关联或相关? 如何利用用户选择的参数或约束加快 ...

最新文章

  1. 定期定量采购_采购的四种方法
  2. linux dhcp服务器配置及小实验
  3. DOM中 property 和 attribute 详解
  4. 程序设计导引及在线实践_四金一银!西电在计算机系统与程序设计竞赛再创佳绩...
  5. mysql创建多个联合索引吗_高性能索引油画策略(二):多个索引是独立建立索引还是建联合索引?...
  6. 计算机应用备课教案,计算机应用基础教案备课(全套).doc
  7. 诺基亚 PC Internet 访问 N70为例
  8. JAVA 9中module初探
  9. SQL Server 修改字段名
  10. 环境篇:CM+CDH6.3.2环境搭建(全网最全)
  11. 推荐一款办公室必备股票看盘工具
  12. Swipe轮播插件的使用
  13. JS在H5下实现本地历史搜索记录
  14. 绑定变量窥视_窥视量子计算与密码学
  15. QT中的sender函数,result函数
  16. 用c语言实现文本文件中的字符筛选分析(二)
  17. Graph Visualization and Navigation in Information Visualization: A Survey 译文
  18. 蝴蝶效应,鳄鱼法则,罗森塔尔效应,帕金森定律,手表定律,破窗理论,晕轮效应 ,霍桑效应,二八定律,木桶理论,马太效应,踢猫效应…………
  19. 成都计算机高校排名,成都排名前十的大学 2021高校最新排行榜
  20. 网红姓名被抢注商标,你自己的名字还安全吗?

热门文章

  1. 一. 视频信息与压缩编码
  2. 查看LINUX进程内存占用情况 top pmap ps
  3. 单元格格式_你最想要的自定义单元格格式来了!
  4. 微助教课件怎么下载_初中英语八年级下册Unit3课堂要点归纳,知识点睛,语法练习(可下载打印,附答案)...
  5. 学校为什么要单位接收函_温江会计培训学校:为什么要学习会计实操
  6. JAVA中的通配符的符号_Linux下的通配符和特殊符号用法详解
  7. mysql mydumper_采用mydumper对MySQL部分数据库进行热备
  8. 史上超级详细:HashMap源码分析,你了解到源码的魅力了嘛
  9. 【深度学习】基于Pytorch的卷积神经网络概念解析和API妙用(二)
  10. python【数据结构与算法】内置函数enumerate(枚举) 函数(看不懂你来打我)