论文总结(negFIN: An efficient algorithm for fast mining frequent itemsets)
一、论文整体思路:
作者提出了一种基于前缀树的数据结构,NegNodeset,其实是对之前前缀树的一种改进,主要区别在于采用了位图编码,通过这种数据结构产生的算法称为negFIN。
negFIN算法高效有三个原因
二、问题定义
I= {i1,i2,…, init} 表示事务数据库所有项的集合,T表示每个事务,T⊆I ,DB = {T1,T2,…, Tnt} 是所有事务的集合
P称为k-项集,如果P⊆T ,那么事务T包含了项集P,support(P)是DB中包含P的百分比,如果support(P)大于min-support
我们就称P为频繁项集,频繁项集是2的nit 次方,nit = |I| 。
三、之前贡献
主要对前缀树的研究,结构1)Node-list,2)N-list,3)Nodeset,4)DisffNodeset (***先理解下前缀树和哈希树)
1) Node-list和N-list是通过对节点进行先序和后序排列,这两种数据结构产生的算法分别是PPV和PrePost频繁项集挖掘算法,
这两个算法的缺点消耗了大量内存;
2)对于这种情况,数据结构Nodeset将其进行改进,k-项集的获得通过取k-1项集的交集,算法为FIN,确定是对于一些数据集Nodeset基数太大;
3)为了将其进行改进,DiffNodest数据结构提出,k-项集的获得两个不同的k-1项集获得,算法为dFIN,算法的更快了。
4)文中提出了NegNodeset为了实现计算两个不同的DiffNodesets花费时间较长,主要利用的是位图,提出的算法negFIN;
四、相关工作
频繁项集挖掘算法
1)通过产生候选项集
比如Apriori算法,以及一些其他的算法,这种方法的主要缺点是需要多次扫描数据库。
2)模式增长方法
这种方式不会产生候选项集,也避免了多次扫描数据库,包括FP-tree和FP-growth算法,缺点:对于稀疏的数据集效率低,数据结构复杂。
3)前缀树方法
五、基本术语
F1频繁项集的集合,例如F1 = {e, b, a, c, d} ,
L1是根据支持度进行非降序排列的频繁项集L1 = [e, d, c, b, a] ,L1 = [i0,i1,…, inf - 1] ,nf=|F1|
k-项集P,Pk = ik…i2i1 ,ik>...>i2>i1
例如P = {e, b, d} ,P3 = bde ,对Pk进行位图编码BMC(Pk) = bnf - 1…b1b0 ,这里需要注意的是
BMC(node-path)分为两部分,主要部分和无关部分
转载于:https://www.cnblogs.com/Optimism/p/10711138.html
论文总结(negFIN: An efficient algorithm for fast mining frequent itemsets)相关推荐
- 【阅读笔记】低照度图像增强-《Fast efficient algorithm for enhancement of low lighting video》
本文介绍的是一种比较实用的低照度图像增强效果很好的方法,Xuan Dong论文<Fast efficient algorithm for enhancement of low lighting ...
- 《The swirlds hashgraph consensus algorithm: Fair, fast, byzantine fault tolerance》Hashgraph论文的学习
参考链接: 论文原文: Baird L. The swirlds hashgraph consensus algorithm: Fair, fast, byzantine fault toleranc ...
- Competing in the Dark: An Efficient Algorithm for Bandit Linear Optimization
Competing in the Dark: An Efficient Algorithm for Bandit Linear Optimization Feb. 23, 2021 Aim‾\unde ...
- 目标检测经典论文——Fast R-CNN论文翻译(纯中文版):Fast R-CNN(微软研究院)
目标检测经典论文翻译汇总:[翻译汇总] 翻译pdf文件下载:[下载地址] 此版为纯中文版,中英文对照版请稳步:[Fast R-CNN中英文对照版] Fast R-CNN Ross Girshick 微 ...
- 【读点论文】FBNet:Hardware-Aware Efficient ConvNet Design via Differentiable Neural Architecture Search可微分
FBNet: Hardware-Aware Efficient ConvNet Design via Differentiable Neural Architecture Search Abstrac ...
- 论文翻译:2020_TinyLSTMs: Efficient Neural Speech Enhancement for Hearing Aids
论文地址:TinyLSTMs:助听器的高效神经语音增强 音频地址:https://github.com/Bose/efficient-neural-speech-enhancement 引用格式:Fe ...
- 论文复现:Learning Efficient Convolutional Networks through Network Slimming
论文核心 论文提出了一种结构化剪枝策略,剪枝对象为 channel ,对 channel 重要性的评价标准使用的是 Batch Normalization 层中的缩放因子,这不会给网络带来额外的开销. ...
- 论文翻译解读:Efficient estimation of word representations in vector space【Word2Vec】
文章目录 简要信息 重点内容概括 Efficient estimation of word representations in vector space 摘要 1 介绍 1.1 论文目标 1.2 以 ...
- 【论文翻译】MobileNets: Efficient Convolutional Neural Networks for Mobile VisionApplications【v1, 2017.4】
文章目录 Abstract 1. Introduction 2. Prior Work 3. MobileNet Architecture 3.1. Depthwise Separable Convo ...
最新文章
- python路径拼接os.path.join()函数的用法
- linux 内核发布时间,求问Linux最新内核版本以及发布日期。
- mysql 日志表设计_在mysql 使用binlog日志
- 机器学习(三十四)——策略梯度
- c语言中fr,关于frwite()函数的一个问题,弄了好久就是不行,求解啊!
- [ASP,VB] - 利用ASP调用API COM接口实现开关机
- 华北电力大学的计算机类专业排名,2018年华北电力大学王牌专业排行榜,考生和家长们都好好看看!...
- HTC Vive安装及如何连接电脑详细教程(全程图解)
- java linux socket编程_linux下socket编程实例?javasocket编程流程?java socket编程实例代码讲解...
- 很黄色的JAVA游戏_《yellow》很黄!很暴力?居然有这么黄的游戏!
- 华为笔记本换装linux双系统,华为及荣耀笔记本装Deepin双系统不能引导Windows的解决...
- pyinstaller打包有pandas和numpy库过程中遇到的bug及处理
- Wireshark从入门到精通(进阶篇)
- 功不唐捐——《程序员职场第一课》后记
- Premiere Pro CC2019安装详细教程
- ogg19.1.0.0.4打补丁
- HBuilderx 配置多环境发行
- 【学习路线】2022届校招C++后端服务器开发/实习,个人学习路线总结/记录
- 论文阅读_Hawkeye: Towards a Desired Directed Grey-box Fuzzer
- HTML复选框,点击文字,对应的复选框选中