商品交叉销售关联分析

Step1:检查数据缺失值、异常值
Step2:约减数据集中属性

Step3:FP-Growth找到频繁项集

Step4:产生关联规则

FF-Growth的min support = 0.9和create association rules min confidence = 0.9时的关联规则

但是结论conclusion都是Health Profucts Division,说明健康类商品是人们的生活必需品,参考价值不大。

我们适当放宽min support = 0.5和min confidence = 0.6

发现当Housewares Division,Novelty Gift Division存在时,Personal Electronics Division更容易被购买。support = 0.108

泰塔尼克号幸存者分类预测

step1:角色设定
step2:加入决策树操作符

step3:对测试数据集预测

step4:交叉检验



confidence = 0.5时的class precision = 76.52%和83.33%。

例如更改confidence = 0.1时,class precision = 75.07%和83.42%,相比之下confidence = 0.5的时候交叉检验效果更好一些。

调整决策树操作符的criterion参数,其中gain_ratio参数模型得到的效果明显好于gini_index参数。

gini_index参数

gain_ratio参数

Iris鸢尾花数据集聚类分析

step1:选择a1和a2属性
step2:添加K-means聚类操作符
step3:调整聚类个数,查看散点个数,人工评价聚类效果。

得到每个点的聚类结果

可视化表示聚类分析

此处选择的聚类个数是3,即k = 3

若选择聚类个数为5

聚类分析 k = 5

rapidminer进行关联分析、分类预测、聚类分析相关推荐

  1. GAPIT 3.0:全基因组关联分析与预测软件最新版发布

    近日,GPB在线发表了西南民族大学青藏高原动物遗传资源保护与利用(四川省.教育部)重点实验室题为"GAPIT Version 3: Boosting Power and Accuracy f ...

  2. 运用RapidMiner进行关联分析(算子有read csv,select attribute,fp-growth,create association rules)

    目录 问题 导入数据 方法一:通过工具栏选择Import,导入数据"数据集-关联分析.csv" ​编辑方法二:通过算子载入数据集 数据探索 结果透视图 Step1:检查数据缺失值. ...

  3. 基于关联分析与机器学习的配网台区重过载预测方法

    基于关联分析与机器学习的配网台区重过载预测方法 张国宾,王晓蓉,邓春宇 中国电力科学研究院,北京 100192 摘要:针对配电网运行中长期存在的台区重过载问题,提出基于关联规则挖掘的重过载影响因素分析 ...

  4. 关联分析U聚类分析探讨心脏病的诱发

    1 数据准备 现有一份heart disease.xls数据,内含21个变量,分别是ID(序号).sex(性别).age(年龄).profession(工作强度).Marital Status(婚姻状 ...

  5. NLP之NBGBT:基于朴素贝叶斯(count/tfidf+网格搜索+4fCrva)、梯度提升树(w2c+网格搜索+4fCrva)算法对IMDB影评数据集进行文本情感分析(情感二分类预测)

    NLP之NB&GBT:基于朴素贝叶斯(count/tfidf+网格搜索+4fCrva).梯度提升树(w2c+网格搜索+4fCrva)算法对IMDB影评数据集进行文本情感分析(情感二分类预测) ...

  6. ML之NBLoR:利用NB(朴素贝叶斯)、LoR(逻辑斯蒂回归)算法(+TfidfVectorizer)对Rotten Tomatoes影评数据集进行文本情感分析—五分类预测

    ML之NB&LoR:利用NB(朴素贝叶斯).LoR(逻辑斯蒂回归)算法(+TfidfVectorizer)对Rotten Tomatoes影评数据集进行文本情感分析-五分类预测 目录 输出结果 ...

  7. ML之NBLoR:利用NB(朴素贝叶斯)、LoR(逻辑斯蒂回归)算法(+CountVectorizer)对Rotten Tomatoes影评数据集进行文本情感分析—五分类预测

    ML之NB&LoR:利用NB(朴素贝叶斯).LoR(逻辑斯蒂回归)算法(+CountVectorizer)对Rotten Tomatoes影评数据集进行文本情感分析-五分类预测 目录 输出结果 ...

  8. r语言实现关联分析--关联规则挖掘(Apriori算法) (r语言预测学习笔记)

    r语言实现关联分析–关联规则挖掘 关联分析: 引子: 我们一般把一件事情发生,对另一间事情也会产生影响的关系叫做关联.而关联分析就是在大量数据中发现项集之间有趣的关联和相关联系(形如"由于某 ...

  9. 关于灰色关联分析以及灰色预测初步理解

    前言 最近初步的学习了灰色关联分析跟灰色预测的知识,做个简要的笔记 一.灰色关联分析 1.引言 我们分析的问题都存在很多指标,也可以说是多种系统作用因素共同决定,当我们准备做出决定时,会找到哪个变量对 ...

  10. 机器学习:基于多项式贝叶斯对蘑菇毒性分类预测分析

    基于多项式贝叶斯对蘑菇毒性分类预测分析 作者:i阿极 作者简介:Python领域新星作者.多项比赛获奖者:博主个人首页

最新文章

  1. 北大新研究用数学模型揭网红崛起奥秘!登上Nature子刊
  2. hookup_2.10-0.2.3.jar包下载
  3. EBS R12中如何使用CGI登录Form
  4. 在wamp 2.0环境下面安装Zend Optimizer的方法
  5. 汇编指令:LDM、STM详解
  6. HDU6395 Sequence(矩阵快速幂+数论分块)
  7. 历史首次!中国联通、中国电信组队了,只为达成这个目的
  8. Hie with the Pie(poj3311)
  9. vim“用sudo写”技巧如何工作?
  10. 16. Element contentEditable 属性
  11. win7修改hosts文件方法
  12. 用友NC任意文件上传漏洞复现
  13. Java-集合练习题(1)
  14. java+swing+mysql员工工资管理系统设计分析
  15. 耳穴减肥自身感受细节描述0422
  16. QLabel控件实现圆形头像显示
  17. Windows XP系统下建立V-PN服务器
  18. 全球及中国红外探测器芯片行业发展动态及投资应用前景调研报告2021-2027年
  19. 韩顺平老师讲解13个自学编程的坑
  20. influxDB自定义查询时区

热门文章

  1. Laravel框架实现中英文双语站
  2. MRP专题二:计划策略(MTO)
  3. 如何解决“配置系统未能初始化“ 错误的解决方案?
  4. 删除远程桌面记录的两种方式介绍
  5. 使用谷歌浏览器出现插件未就绪以及CLodop云打印服务(localhost本地)未安装启动!请下载安装包!
  6. 2017最新App Store 审核指南中文版
  7. 【动手学深度学习】01 Windows下安装环境
  8. 草根程序员转型做项目管理走过的点点滴滴_康奈尔笔记法介绍
  9. 虚拟环境中用Anaconda安装显卡CUDA驱动与CUDA运行版本匹配
  10. jvm分析工具JProfiler详解