数据挖掘-序列模式挖掘-prefixspan算法(样例)

所有结果:

通俗来讲:可以以1-频繁项d为例,我们的思路讲解的很明白;这儿我们一般化我们的求解过程:

1)第一次扫描原始数据库,得到长度为1的频繁序列。f_list  = {a:4, b:4, c:4, d:3, e:3, f: 3}

2)从长度为1的频繁项开始,即从a,b,c,d,e,f开始(注意各个是独立的,分别开始)以a开始为例,第二次扫描原始数据库得到a的投影数据库。对a的投影数据库进行计数。计数结果:{a:2, b:4, c:4, d: 2, e:1,f:2, _d:1, _b:2, _f:1},符合支持度的与a结合,得到长度为2的序列。有<aa>, <ab>, <ac>, <ad>, <af>,<(ab)>.。注意除了以a开始,我们还有其他几个也要开始按照一样的思路进行。

3)同2中过程类似,对以a开始得到的长度为2的序列,扫描a的投影数据库,得到长度为2的各个频繁序列的投影数据库,再在各个投影数据库进行计数。

【注意】:递归思维。频繁序列-->从上一个投影数据库得到新的投影数据库--->频繁序列-->投影数据库.

参考:

https://www.cnblogs.com/pinard/p/6323182.html

数据挖掘-序列模式挖掘-prefixspan算法(样例)相关推荐

  1. 数据挖掘-序列模式挖掘-PrefixSpan算法(ppt版本)

    PrefixSpan算法 通俗来讲:前缀prefix就是序列数据前面部分的子序列 后缀:对于某一个前缀,序列中除去前缀后面剩下的子序列就是我们的后缀. 投影数据库:假设alpha是序列数据库 S的一个 ...

  2. 数据挖掘关联规则挖掘改进算法DHP

    前言: Apriori算法是关联规则挖掘经典算法,但不适合在大型数据库中挖掘关联规则,时间太慢,许多学者提出了改进的算法.比如DHP算法. DHP 1. 减少候选集数量 背景:这个操作是基于Ck来做的 ...

  3. OHEM(Online Hard Example Mining)在线难例挖掘(在线困难样例挖掘) HNM (目标检测)

    Hard Negatie Mining与Online Hard Example Mining(OHEM)都属于难例挖掘,它是解决目标检测老大难问题的常用办法,运用于R-CNN,fast R-CNN,f ...

  4. Gluon-cv:安装使用以及目标检测算法样例

    最近学习了解到这个框架,自我感觉使用起来较为简单,官方开源的版本是基于mxnet实现的. 目标检测,跟踪,reid,gan里面都有相关网络样例 github地址:https://github.com/ ...

  5. 序列模式挖掘——GSP算法实战

    GSP算法实战 #统计组合出现次数 def cou_ls(LS):#LS为列表dic={}for i in LS:dic[i]=dic.get(i,0)+1return dic#删除支持度小于2的 d ...

  6. PrefixSpan算法详解+举例实现+代码

    序列模式及PrefixSpan算法 1.序列模式介绍 2.Prefixspan算法基础 3.Prefixspan算法原理 4.Prefixspan算法举例 1.序列模式介绍 什么是序列模式? 序列模式 ...

  7. prefixspan java_PrefixSpan序列模式挖掘算法

    介绍 与GSP一样,PrefixSpan算法也是序列模式分析算法的一种,不过与前者不同的是PrefixSpan算法不产生任何的侯选集,在这点上可以说已经比GSP好很多了.PrefixSpan算法可以挖 ...

  8. 关联规则算法c语言样例及分析_推荐系统总结系列-关联规则算法(四)

    基于关联规则的推荐有三种方法:Apriori关联规则算法FP Tree关联规则算法:PrefixSpan关联规则算法: 关联规则挖掘推荐算法: 关联规则挖掘是一种在大规模交易中识别类似规则关系模式的通 ...

  9. 4种序列模式挖掘算法的比较分析

    http://fpcheng.blog.51cto.com/2549627/829527 算法简介 AprioriAll算法属于Apriori类算法,其基本思想为首先遍历序列数据库生成候选序列并利用A ...

最新文章

  1. ControllerDescriptor的认识
  2. 学校的计算机教室火灾级别,学校教室火灾隐患有哪些
  3. python3语法错误-Python3 错误和异常
  4. 【CF526F】Pudding Monsters
  5. hibernate一对多关联映射
  6. 卷积Strassen算法
  7. C#来创建和读取XML文档 [转]
  8. 热血致敬!曾影响几代科学巨匠的传奇经典,至今仍无人能超越!
  9. Python 装饰器@functools.wraps(func)
  10. 【OpenCV应用】python处理行李图像匹配项目——图像(简单)清晰化
  11. C++/C代码审查表
  12. Atitit 功能扩展法细则条例 目录 1. 界面ui扩展 2 1.1. 使用h5做界面 2 1.2. 自制h5 ide。。简化ui自定义配置 2 2. 业务逻辑扩展 2 2.1. Bpm流程引擎还
  13. matlab所有画图函数,matlab所有画图函数
  14. 软件配合HT8691功放使用技巧
  15. 信号与系统、数字信号处理——复试常见问题
  16. 如何制作专属的VS Code主题
  17. 关于arduino驱动SH1106 OLED屏幕使用U8g2库显示案例
  18. Axis1.4 远程命令执行(CVE-2019-0227)复现
  19. py.test --pep8 vsearch.py报错解决办法
  20. BlackHat2020议题之Web缓存投毒

热门文章

  1. 个人管理|曾航:给年轻人的写作课(上)
  2. 操作系统学习笔记——第九讲——虚拟内存(9.4页框分配和颠簸)
  3. 同济大学王昊奋:知识图谱在多模态大数据时代的创新和实践 | 世界人工智能大会达观数据论坛
  4. 微信视频号直播如何做?(二)
  5. 什么软件可以用来提取图片文字?这几款软件超好用
  6. c语言文件获取失败问题
  7. 学习、计划的一点的想法
  8. kiss原则包括什么_编程中的kiss原则是什么?
  9. Circos入门教程
  10. Topaz Sharpen AI for Mac(图片清晰度增强软件)