rapidminer进行关联分析、分类预测、聚类分析
商品交叉销售关联分析
Step1:检查数据缺失值、异常值
Step2:约减数据集中属性
Step3:FP-Growth找到频繁项集
Step4:产生关联规则
FF-Growth的min support = 0.9和create association rules min confidence = 0.9时的关联规则
但是结论conclusion都是Health Profucts Division,说明健康类商品是人们的生活必需品,参考价值不大。
我们适当放宽min support = 0.5和min confidence = 0.6
发现当Housewares Division,Novelty Gift Division存在时,Personal Electronics Division更容易被购买。support = 0.108
泰塔尼克号幸存者分类预测
step1:角色设定
step2:加入决策树操作符
step3:对测试数据集预测
step4:交叉检验
confidence = 0.5时的class precision = 76.52%和83.33%。
例如更改confidence = 0.1时,class precision = 75.07%和83.42%,相比之下confidence = 0.5的时候交叉检验效果更好一些。
调整决策树操作符的criterion参数,其中gain_ratio参数模型得到的效果明显好于gini_index参数。
gini_index参数
gain_ratio参数
Iris鸢尾花数据集聚类分析
step1:选择a1和a2属性
step2:添加K-means聚类操作符
step3:调整聚类个数,查看散点个数,人工评价聚类效果。
得到每个点的聚类结果
可视化表示聚类分析
此处选择的聚类个数是3,即k = 3
若选择聚类个数为5
聚类分析 k = 5
rapidminer进行关联分析、分类预测、聚类分析相关推荐
- GAPIT 3.0:全基因组关联分析与预测软件最新版发布
近日,GPB在线发表了西南民族大学青藏高原动物遗传资源保护与利用(四川省.教育部)重点实验室题为"GAPIT Version 3: Boosting Power and Accuracy f ...
- 运用RapidMiner进行关联分析(算子有read csv,select attribute,fp-growth,create association rules)
目录 问题 导入数据 方法一:通过工具栏选择Import,导入数据"数据集-关联分析.csv" 编辑方法二:通过算子载入数据集 数据探索 结果透视图 Step1:检查数据缺失值. ...
- 基于关联分析与机器学习的配网台区重过载预测方法
基于关联分析与机器学习的配网台区重过载预测方法 张国宾,王晓蓉,邓春宇 中国电力科学研究院,北京 100192 摘要:针对配电网运行中长期存在的台区重过载问题,提出基于关联规则挖掘的重过载影响因素分析 ...
- 关联分析U聚类分析探讨心脏病的诱发
1 数据准备 现有一份heart disease.xls数据,内含21个变量,分别是ID(序号).sex(性别).age(年龄).profession(工作强度).Marital Status(婚姻状 ...
- NLP之NBGBT:基于朴素贝叶斯(count/tfidf+网格搜索+4fCrva)、梯度提升树(w2c+网格搜索+4fCrva)算法对IMDB影评数据集进行文本情感分析(情感二分类预测)
NLP之NB&GBT:基于朴素贝叶斯(count/tfidf+网格搜索+4fCrva).梯度提升树(w2c+网格搜索+4fCrva)算法对IMDB影评数据集进行文本情感分析(情感二分类预测) ...
- ML之NBLoR:利用NB(朴素贝叶斯)、LoR(逻辑斯蒂回归)算法(+TfidfVectorizer)对Rotten Tomatoes影评数据集进行文本情感分析—五分类预测
ML之NB&LoR:利用NB(朴素贝叶斯).LoR(逻辑斯蒂回归)算法(+TfidfVectorizer)对Rotten Tomatoes影评数据集进行文本情感分析-五分类预测 目录 输出结果 ...
- ML之NBLoR:利用NB(朴素贝叶斯)、LoR(逻辑斯蒂回归)算法(+CountVectorizer)对Rotten Tomatoes影评数据集进行文本情感分析—五分类预测
ML之NB&LoR:利用NB(朴素贝叶斯).LoR(逻辑斯蒂回归)算法(+CountVectorizer)对Rotten Tomatoes影评数据集进行文本情感分析-五分类预测 目录 输出结果 ...
- r语言实现关联分析--关联规则挖掘(Apriori算法) (r语言预测学习笔记)
r语言实现关联分析–关联规则挖掘 关联分析: 引子: 我们一般把一件事情发生,对另一间事情也会产生影响的关系叫做关联.而关联分析就是在大量数据中发现项集之间有趣的关联和相关联系(形如"由于某 ...
- 关于灰色关联分析以及灰色预测初步理解
前言 最近初步的学习了灰色关联分析跟灰色预测的知识,做个简要的笔记 一.灰色关联分析 1.引言 我们分析的问题都存在很多指标,也可以说是多种系统作用因素共同决定,当我们准备做出决定时,会找到哪个变量对 ...
- 机器学习:基于多项式贝叶斯对蘑菇毒性分类预测分析
基于多项式贝叶斯对蘑菇毒性分类预测分析 作者:i阿极 作者简介:Python领域新星作者.多项比赛获奖者:博主个人首页
最新文章
- 北大新研究用数学模型揭网红崛起奥秘!登上Nature子刊
- hookup_2.10-0.2.3.jar包下载
- EBS R12中如何使用CGI登录Form
- 在wamp 2.0环境下面安装Zend Optimizer的方法
- 汇编指令:LDM、STM详解
- HDU6395 Sequence(矩阵快速幂+数论分块)
- 历史首次!中国联通、中国电信组队了,只为达成这个目的
- Hie with the Pie(poj3311)
- vim“用sudo写”技巧如何工作?
- 16. Element contentEditable 属性
- win7修改hosts文件方法
- 用友NC任意文件上传漏洞复现
- Java-集合练习题(1)
- java+swing+mysql员工工资管理系统设计分析
- 耳穴减肥自身感受细节描述0422
- QLabel控件实现圆形头像显示
- Windows XP系统下建立V-PN服务器
- 全球及中国红外探测器芯片行业发展动态及投资应用前景调研报告2021-2027年
- 韩顺平老师讲解13个自学编程的坑
- influxDB自定义查询时区
热门文章
- Laravel框架实现中英文双语站
- MRP专题二:计划策略(MTO)
- 如何解决“配置系统未能初始化“ 错误的解决方案?
- 删除远程桌面记录的两种方式介绍
- 使用谷歌浏览器出现插件未就绪以及CLodop云打印服务(localhost本地)未安装启动!请下载安装包!
- 2017最新App Store 审核指南中文版
- 【动手学深度学习】01 Windows下安装环境
- 草根程序员转型做项目管理走过的点点滴滴_康奈尔笔记法介绍
- 虚拟环境中用Anaconda安装显卡CUDA驱动与CUDA运行版本匹配
- jvm分析工具JProfiler详解