目录

问题

导入数据

方法一:通过工具栏选择Import,导入数据“数据集-关联分析.csv”

​编辑方法二:通过算子载入数据集

数据探索

结果透视图

Step1:检查数据缺失值、异常值

Step2:约减数据集中属性

Step3: FP-Growth找到频繁项集

​编辑

Step4:产生关联规则:Create Association Rules

调整FP-Growth的支持度(Support)参数


运用RapidMiner进行关联分析(算子有read csv,select attribute,fp-growth,create association rules)

问题

Roger是一个居民社区的管理者。社区内的居民都非常热衷于参加各种社区组织。鉴于此,Roger认为可以充分利用社区组织间的现有关联,通过让一些团体合作,来扩展社区居民的社交圈,开展一系列有利于整个社区的工作。 他知道社区中有教会、社会组织、兴趣爱好协会、政治组织、专业组织、援助导向型组织。 他不知道团体之间是否存在联系,从而让两个或多个团体之间自然地开展项目合作。 他认为首先应该找出区域内不同类型团体之间是否存在关联。

为了进一步了解居民参与社区组织的情况,Roger创建了一个面向居民的在线调查。每个受邀参与调查的居民都将获得一个唯一的标识码,以确定有多少人参与调查。调查后,Roger获得了一个包含以下属性的数据集:

Elapsed_Time: 每个调查对象完成调查所用的时间。精确到0.01分钟。

Time_in_Community: 用于询问调查对象在该社区的居住时间是0-2年、3-9年,还是10年以上,并在数据集中分别记录为“Short”、“Medium”或“Long”。

Gender: 调查对象性别。

Working: 调查对象是否从事有薪工作,结果为yes/no。

Age: 调查对象年龄。

Family: 调查对象是否结婚,结果为yes/no。

Hobbies: 调查对象是否参与兴趣爱好协会,结果为yes/no。

Social_Club: 调查对象是否参与社会组织,结果为yes/no。

Political: 调查对象是否参与政治组织,结果为yes/no。 Professional: 调查对象是否参与专业组织,结果为yes/no。

Religious: 调查对象是否参与教会组织,结果为yes/no。

Support_Group: 调查对象是否参与援助导向型组织,结果为yes/no。

为了解答Roger的问题,他请我们构建一个关联规则模型,以找出社区组织之间的关联。

导入数据

方法一:通过工具栏选择Import,导入数据“数据集-关联分析.csv”

说明: 点击资源库上的导入按钮

点击从电脑导入

从文件管理器中选择对应的文件后点next 持续点next直到出现存储位置

点击local repository并点击finish结束导入

导入成功后会弹出导入的结果

使用时直接拖拽数据集进入流程视图即可

方法二:通过算子载入数据集

数据探索

查看读入数据 运行后,若算子状态指示符变为绿色,则表示运行成功; 其他算子状态指示符

(1)状态指示灯:红色指示灯说明有参数未被设置或输入端口未被连接等问题,黄色指示灯说明还未执行算子,不管配置是否基本齐全,绿色指示灯说明一切正常,已成功执行算子。

(2)三角警示牌:用于表明是否有算子的状态信息出现。 (3)断点:用于表明分析员是否在这个算子前面或是后面暂停了流程,以检测中间效果。

(4)注释:如果这个算子中出现了注释,则会通过这个图标表示出来。

(5)子流程:这个图标用来指示是否有子流程。双击算子可以进入子流程。

结果透视图

运行成功后,RapidMiner会自动跳转到结果透视图下。 在结果透视图下,可以实现原始数据的查看、描述性统计、数据可视化(统计图表绘制)等基本功能。

数据干净,没有缺失值

Time_in_Community:居民在社区居住时间较长

Gender:男女比例较为均衡

Working:社区中的居民大约有一半有工作

Age:社区居民较为年轻,平均年龄36岁

Family:社区中超过半数以上的人没有结婚

社区组织相关字段: - 社区的人群接近半数人参与了专业组织,专业技能普遍较强;兴趣爱好类、宗教类组织受到大家广泛参与;参与政治组织的人较少

Step1:检查数据缺失值、异常值

我们发现包括Religious在内的很多字段值是0或1 数据转换:引入Numerical to Binominal算子,将Religious等字段的数据类型由0/1转换为二值型True/False可能更为直观,也会更利于后续的处理

Step2:约减数据集中属性

只保留与社区组织类别相关的属性:Select Attributes算子

Step3: FP-Growth找到频繁项集

宗教组织与兴趣爱好协会可能存在关联关系

Step4:产生关联规则:Create Association Rules

在当前参数设置下,没有关联规则产生

调整FP-Growth的支持度(Support)参数

参加了兴趣爱好协会、社会组织的居民,往往也会参加宗教协会。

运用RapidMiner进行关联分析(算子有read csv,select attribute,fp-growth,create association rules)相关推荐

  1. 使用数据挖掘软件Rapidminer进行关联规则分析

    这段时间使用了Rapidminer进行关联规则的挖掘实验,很多细节问题折腾了好长时间.在网络上也搜不到类似的东西,尤其是中间遇到一个问题折腾了两天.最后是通过研究Rapidminer本身带有的例子才把 ...

  2. 案例分享 | 某券商利用AI技术进行告警关联分析(上)

    本内容来自公众号"布博士"------(擎创科技资深产品专家) 背景: 作为大型券商企业之一,某券商对深入数字化转型,以及对应用.网络.主机.操作系统.中间件.用户使用体验等的全面 ...

  3. 基于 Flink 构建关联分析引擎的挑战和实践

    点击上方"zhisheng",选择"设为星标" 公众号(zhisheng)内回复:ffa 可以获取到所有 PPT 和视频 随着云计算.大数据等新一代IT技术在各 ...

  4. Apriori算法通俗详解_fpgrowth2_关联分析评估

    20220317 https://blog.csdn.net/a790439710/article/details/103080674 支持度,置信度各指标再理解 条件模式基:在某元素比如y出现的前提 ...

  5. Python --深入浅出Apriori关联分析算法(二) Apriori关联规则实战

    上一篇我们讲了关联分析的几个概念,支持度,置信度,提升度.以及如何利用Apriori算法高效地根据物品的支持度找出所有物品的频繁项集. Python --深入浅出Apriori关联分析算法(一) 这次 ...

  6. OSSIM平台安全事件关联分析实践

    OSSIM平台安全事件关联分析实践 在<开源安全运维平台OSSIM最佳实践>一书中叙述到,事件关联是整个OSSIM关联分析的核心,对于OSSIM的事件关联需要海量处理能力,主要便于现在需要 ...

  7. Apriori算法进行关联分析实战

    使用Apriori算法进行关联分析(层次聚类) 一.基础知识 1.关联分析定义及存在的问题 定义:从大规模的数据集中寻找物品间的隐含关系,被称为关联分析或关联规则学习. 关联分析存在的主要问题:主要问 ...

  8. 植物MWAS研究—谷子产量与微生物组关联分析

    点击上方蓝色「宏基因组」关注我们!专业干货每日推送! MWAS简介 微生物组关联分析(Microbiome/Metagenome-wide association studies , MWAS)是指捕 ...

  9. Nature综述: 宏基因组关联分析-深入研究微生物组

    本文由谢忠杰编译,董小橙.江舜尧编辑,本文较长,建议用电脑阅读. "微生太"原创微文,转载已获授权. 导读 问题1:哪些疾病与人体微生物明确相关? 问题2:如何研究人体微生物与健康 ...

最新文章

  1. leetcode算法题--Combinations
  2. Hash查找的基本原理及实现
  3. 史上最全推荐系统传统算法合集
  4. 网易有道押注教育智能硬件,蓝海市场还能维持多久?
  5. git 应用 rebase
  6. 北京成立前沿国际人工智能研究院,李开复出任首任院长
  7. Python中 sys.argv[]
  8. Oracle Database Documentary Library
  9. 计算机Excel电子表格处理文件,#excel2016打不开已恢复的文件#所有表格打不开怎么办...
  10. 量表类问卷影响关系研究(精读笔记1)SPSS
  11. 五一期间完成了某市交警系统的一个系统升级迁移项目
  12. 图论们,小爷来ak你们啦瓦咔咔~
  13. CAD的图导入PADS 做板框(转)
  14. 素问·金匮真言论原文
  15. 如何提升程序员的代码编写能力
  16. 几种自动目标跟踪算法的比较研究
  17. CS0120 对象引用对于非静态的字段、方法或属性XX是必需的
  18. 一些“不正规”的软件项目招标前小技巧
  19. 全国计算机一级准考证号查询
  20. 基于IPMI的FRU

热门文章

  1. webservice java教程_[Java教程]JAVA开发Webservice——JAXB
  2. BPR项目实施中常用的五大技术和方法(转载)
  3. 一般过去时和过去进行时
  4. 专业摄影-水的拍摄技巧
  5. enq:TX-CONTENTION
  6. 弘辽科技:2022年淘宝双11交易退款规则是什么?退款有影响吗?
  7. linggo:非线性规划
  8. Dragger2好网文整合
  9. php一级标题红色字体,什么是一级标题
  10. 博客群发(1)--构思