1. Mahout0.9—Hadoop2.20—FPG关联规则算法

1.1. FPG函数

目前Mahout0.9 无fpg函数,0.9之前版本有,但是在0.9中可以找到fpg的jar包;
mahout org.apache.mahout.fpm.pfpgrowth.FPGrowthDriver 等价于 fpg;
1) fpg参数(mahout org.apache.mahout.fpm.pfpgrowth.FPGrowthDriver)
-- minSupport,最小支持度,默认3
-- maxHeapSize,最大项集,默认50
-- numGroups,分组数量
-- splitterPattern,数据分割符,如:" \"[ ,\\t]*[,|\\t][ ,\\t]*\" ", "[ ,\t]*[,|\t][ ,\t]*"
-- numTreeCacheEntries,fpg树数量,Values: [5-10]", 默认"5"
-- method,sequential|mapreduce,并行或者串行计算;
-- encoding,编码,Default value: UTF-8", "UTF-8"
-- useFPG2,"2", "Use an alternate FPG implementation"

1.2 FPG挖掘

#上传数据

sudo hadoop fs  -put  ./ retail.dat /user/input

# 1、FPG命令
sudo mahout fpg -i /user/input/retail.dat -o /user/output  -method mapreduce -s 200 -regex '[ ]' –k 20 
# 1、FPG命令(Mahout0.9)
sudo mahout mahout org.apache.mahout.fpm.pfpgrowth.FPGrowthDriver -i /user/input2/retail.dat -o /user/output  -method mapreduce -s 200 -regex '[ ]' –k 20

# 2、输出结果文件查看:

sudo mahout seqdumper -i /user/output/fpgrowth/part-r-00000

转载请注明出处:

http://blog.csdn.net/sunbow0/article/details/41962141

Mahout0.9—Hadoop2.20—FPG关联规则算法相关推荐

  1. sparkmllib关联规则算法(FPGrowth,Apriori)

    关联规则算法的思想就是找频繁项集,通过频繁项集找强关联. 介绍下基本概念: 对于A->B 1.置信度:P(B|A),在A发生的事件中同时发生B的概率 p(AB)/P(A) 例如购物篮分析:牛奶 ...

  2. 关联规则算法在游戏行业中的应用

    关联规则算法在游戏行业中的应用 本文为学习<R语言游戏数据分析与挖掘>学习笔记. Apriori算法应用广泛,可用于消费市场价格分析,猜测顾客的消费习惯,比如较有名的"尿布和啤酒 ...

  3. 使用Apriori关联规则算法实现购物篮分析

    Apriori算法是一种挖掘关联规则的频繁项集算法,其核心思想是通过候选集生成和情节的向下封闭检测两个阶段来挖掘频繁项集,而且算法已经被广泛的应用到商业,网络安全等各个领域. 购物篮分析是通过发视频顾 ...

  4. 数据挖掘——关联规则算法之FP-tree

    数据挖掘--关联规则算法之FP-tree 前言 FP-tree算法 FP-tree的优缺点 前言 Apriori算法需要生成大量的候选集而且需要进行多次的扫描,对于那些大数据量的数据集很耗费时间.基于 ...

  5. 关联规则算法php,科学网—加权关联规则权值的计算 - 叶文菁的博文

    加权关联规则挖掘(以apriori和fp-tree算法为例)的权值计算. 以下面的数据为例来进行说明,表2中的交易权重和归一化权重只是截图结果,这里的具体数值可不要考虑. 加权支持度的计算为Sup(B ...

  6. Apriori关联规则算法

    关联规则算法中的几个重要概念:置信度.支持度.提升度. 例子: 支持度: 支持度是一个百分比,指某个商品组合出现的次数与总次数之间的比例,支持度越高表示该组合出现的几率越大. 在上面图中我们可以发现& ...

  7. 关联规则 java_Java实现的关联规则算法

    Java实现的关联规则算法 java 2020-7-12 下载地址 https://www.codedown123.com/29481.html Java实现的关联规则算法 资源下载此资源下载价格为2 ...

  8. 关联规则算法c语言样例及分析_推荐系统总结系列-关联规则算法(四)

    基于关联规则的推荐有三种方法:Apriori关联规则算法FP Tree关联规则算法:PrefixSpan关联规则算法: 关联规则挖掘推荐算法: 关联规则挖掘是一种在大规模交易中识别类似规则关系模式的通 ...

  9. 一句话+一张图——说清楚Aprioir关联规则算法

    一句话 关联分析(关联规则学习): 从大规模数据集中寻找物品间的隐含关系被称作 关联分析(associati analysis) 或者 关联规则学习(association rule learning ...

最新文章

  1. android录像增加时间记录(源码里修改)
  2. RAID类型及软RAID的组建
  3. 070_获取日期方法
  4. 删除-ARMV8-V9-ATF-FFA学习笔记目录-2021-08
  5. [开源]基于姿态估计的运动计数APP开发(三)
  6. vue+node全栈移动商城【6】-node接口配置文件
  7. 085:QuerySet API详解-defer和only
  8. 自定义Java定时器(基于ScheduledExecutorService)
  9. 封条格式用word怎么打_封条格式用word怎么打
  10. python 单向链表实现快速排序_若干排序算法的Python实现方法及原理
  11. FeedingBottle 3.2另一个无线破解GUI
  12. 优化设计鲍威尔法c语言,机械优化设计鲍威尔法编程
  13. python virtualenv_python之virtualenv的简单使用方法(必看篇)
  14. t分布 u分布 卡方分布_F分布、t分布、正太分布与卡方分布的联系与区别
  15. 怎么吸引百度蜘蛛抓取自己的网页
  16. 微分的概念和微分的基本公式与运算法则
  17. Requirement already satisfied的解决方案
  18. AWFWD改进后的融合算法
  19. 从SARS、埃博拉到新冠状病毒,技术在革命中进步
  20. oracle查询最新100条数据

热门文章

  1. 《F4+2团队项目需求改进与系统设计》
  2. 将LCD液晶屏和电子墨水屏进行对比,谁更胜一筹?
  3. 计算机专业社会需要分析,计算机专业社会需求数据分析开题报告.doc
  4. 戴尔sc系列存储阵列柜服务器,入门级SCv2000!戴尔扩大存储产品组合
  5. Luminar 4:AI 天空更换
  6. 解决流只能读一次的问题,getInputStream() has already been called for this request
  7. 创建一个非循环单链表并对其进行操作
  8. 帽子接球小游戏(一)--制作UI面板
  9. 深入理解java虚拟机-读书笔记2-垃圾收集器和内存分配策略
  10. 究竟是什么,决定了一个人的成就!醍醐灌顶!