一、论文整体思路:

作者提出了一种基于前缀树的数据结构,NegNodeset,其实是对之前前缀树的一种改进,主要区别在于采用了位图编码,通过这种数据结构产生的算法称为negFIN。

negFIN算法高效有三个原因

二、问题定义

I= {i1,i2,…, init} 表示事务数据库所有项的集合,T表示每个事务,T⊆I ,DB = {T1,T2,…, Tnt} 是所有事务的集合

P称为k-项集,如果P⊆T ,那么事务T包含了项集P,support(P)是DB中包含P的百分比,如果support(P)大于min-support

我们就称P为频繁项集,频繁项集是2的nit 次方,nit = |I| 。

三、之前贡献

主要对前缀树的研究,结构1)Node-list,2)N-list,3)Nodeset,4)DisffNodeset (***先理解下前缀树和哈希树)

1) Node-list和N-list是通过对节点进行先序和后序排列,这两种数据结构产生的算法分别是PPV和PrePost频繁项集挖掘算法,

这两个算法的缺点消耗了大量内存;

2)对于这种情况,数据结构Nodeset将其进行改进,k-项集的获得通过取k-1项集的交集,算法为FIN,确定是对于一些数据集Nodeset基数太大;

3)为了将其进行改进,DiffNodest数据结构提出,k-项集的获得两个不同的k-1项集获得,算法为dFIN,算法的更快了。

4)文中提出了NegNodeset为了实现计算两个不同的DiffNodesets花费时间较长,主要利用的是位图,提出的算法negFIN;

四、相关工作

频繁项集挖掘算法

1)通过产生候选项集

比如Apriori算法,以及一些其他的算法,这种方法的主要缺点是需要多次扫描数据库。

2)模式增长方法

这种方式不会产生候选项集,也避免了多次扫描数据库,包括FP-tree和FP-growth算法,缺点:对于稀疏的数据集效率低,数据结构复杂。

3)前缀树方法

五、基本术语

F1频繁项集的集合,例如F1 = {e, b, a, c, d} ,
L1是根据支持度进行非降序排列的频繁项集L1 = [e, d, c, b, a] ,L1 = [i0,i1,…, inf - 1] ,nf=|F1|
k-项集P,Pk = ik…i2i1 ,ik>...>i2>i1

例如P = {e, b, d} ,P3 = bde ,对Pk进行位图编码BMC(Pk) = bnf - 1…b1b0 ,这里需要注意的是

BMC(node-path)分为两部分,主要部分和无关部分

转载于:https://www.cnblogs.com/Optimism/p/10711138.html

论文总结(negFIN: An efficient algorithm for fast mining frequent itemsets)相关推荐

  1. 【阅读笔记】低照度图像增强-《Fast efficient algorithm for enhancement of low lighting video》

    本文介绍的是一种比较实用的低照度图像增强效果很好的方法,Xuan Dong论文<Fast efficient algorithm for enhancement of low lighting ...

  2. 《The swirlds hashgraph consensus algorithm: Fair, fast, byzantine fault tolerance》Hashgraph论文的学习

    参考链接: 论文原文: Baird L. The swirlds hashgraph consensus algorithm: Fair, fast, byzantine fault toleranc ...

  3. Competing in the Dark: An Efficient Algorithm for Bandit Linear Optimization

    Competing in the Dark: An Efficient Algorithm for Bandit Linear Optimization Feb. 23, 2021 Aim‾\unde ...

  4. 目标检测经典论文——Fast R-CNN论文翻译(纯中文版):Fast R-CNN(微软研究院)

    目标检测经典论文翻译汇总:[翻译汇总] 翻译pdf文件下载:[下载地址] 此版为纯中文版,中英文对照版请稳步:[Fast R-CNN中英文对照版] Fast R-CNN Ross Girshick 微 ...

  5. 【读点论文】FBNet:Hardware-Aware Efficient ConvNet Design via Differentiable Neural Architecture Search可微分

    FBNet: Hardware-Aware Efficient ConvNet Design via Differentiable Neural Architecture Search Abstrac ...

  6. 论文翻译:2020_TinyLSTMs: Efficient Neural Speech Enhancement for Hearing Aids

    论文地址:TinyLSTMs:助听器的高效神经语音增强 音频地址:https://github.com/Bose/efficient-neural-speech-enhancement 引用格式:Fe ...

  7. 论文复现:Learning Efficient Convolutional Networks through Network Slimming

    论文核心 论文提出了一种结构化剪枝策略,剪枝对象为 channel ,对 channel 重要性的评价标准使用的是 Batch Normalization 层中的缩放因子,这不会给网络带来额外的开销. ...

  8. 论文翻译解读:Efficient estimation of word representations in vector space【Word2Vec】

    文章目录 简要信息 重点内容概括 Efficient estimation of word representations in vector space 摘要 1 介绍 1.1 论文目标 1.2 以 ...

  9. 【论文翻译】MobileNets: Efficient Convolutional Neural Networks for Mobile VisionApplications【v1, 2017.4】

    文章目录 Abstract 1. Introduction 2. Prior Work 3. MobileNet Architecture 3.1. Depthwise Separable Convo ...

最新文章

  1. python路径拼接os.path.join()函数的用法
  2. linux 内核发布时间,求问Linux最新内核版本以及发布日期。
  3. mysql 日志表设计_在mysql 使用binlog日志
  4. 机器学习(三十四)——策略梯度
  5. c语言中fr,关于frwite()函数的一个问题,弄了好久就是不行,求解啊!
  6. [ASP,VB] - 利用ASP调用API COM接口实现开关机
  7. 华北电力大学的计算机类专业排名,2018年华北电力大学王牌专业排行榜,考生和家长们都好好看看!...
  8. HTC Vive安装及如何连接电脑详细教程(全程图解)
  9. java linux socket编程_linux下socket编程实例?javasocket编程流程?java socket编程实例代码讲解...
  10. 很黄色的JAVA游戏_《yellow》很黄!很暴力?居然有这么黄的游戏!
  11. 华为笔记本换装linux双系统,华为及荣耀笔记本装Deepin双系统不能引导Windows的解决...
  12. pyinstaller打包有pandas和numpy库过程中遇到的bug及处理
  13. Wireshark从入门到精通(进阶篇)
  14. 功不唐捐——《程序员职场第一课》后记
  15. Premiere Pro CC2019安装详细教程
  16. ogg19.1.0.0.4打补丁
  17. HBuilderx 配置多环境发行
  18. 【学习路线】2022届校招C++后端服务器开发/实习,个人学习路线总结/记录
  19. 论文阅读_Hawkeye: Towards a Desired Directed Grey-box Fuzzer
  20. HTML复选框,点击文字,对应的复选框选中

热门文章

  1. 01-HTML基础与进阶-day5-录像262
  2. 牛客小白月赛7 B 自杀游戏
  3. linux非root用户启动桌面
  4. RHEL6入门系列之三十,服务管理
  5. ArcSDE初学者需要弄清楚的几个问题(转载)
  6. Android MVP模式的初识
  7. Kuskal/Prim POJ 1789 Truck History
  8. 科技领袖技术大亨们被指是现代强盗:不仅赚钱还想垄断
  9. itms-services 格式
  10. 用户测评 | EDAS Serverless 上手体验 1