SPSS 数据挖掘方法概述——关联、决策树

本实验是基于关联和决策树在数据挖掘中的应用。通过该实验,能够客观实际地理解关联分析和决策树的相关知识。

首先进行的是关联分析,之后利用关联分析的数据建立一个决策树。

1、关联分析

(1)          打开并查看数据文件。利用“可变文件”节点将“Demos”下的“BASKETS1n”添加节点中。然后使用“输出”选项卡下的“表”查看数据,如图 41 所示。这里的数据是某商场中的购买记录,共 18 个字段,1000 条记录,在后面的列中,值“T”表示已购买该商品,值“F”表示没有购买该商品。

 图 41 “表”窗口

(2)          确定关联分析字段。在这里中,需要对购买商品之间进行关联分析,即确定客户购买商品之间是否存在关联性,也就是说客户在购买一种商品时,购买另一种商品的概率是多少。所以,在这里,将选择记录中能够体现是否购买某商品的字段进行关联分析,其中有 fruitveg,freshmeat,dairy,cannedveg,cannedmeat,frozenmeal,beer,wine,softdrink,fish,confectione ry,共 11 个字段。

(3)          读入分析字段的类型。在工作区生成“类型”节点,并双击编辑,将上一步骤选出的 11 个字段的角色设定为“两者”,如图 42。

 图 42“类型”节点编辑窗口(4)添加模型节点。分别在“类型”之后添加“Apriori”模型节点和“Crama”模型节点,如图43 所示。其中,“Apriori”模型是基于“最低支持度”和“最小置信度”进行关联性分析。

 图 43 工作区中的“Apriori”模型和“Crama”模型

(5)          运行并查看“Apriori”关联模型结果。运行“Apriori”模型的数据流,在右上侧生成数据模型,右键查看,如图 44 所示。表中可以看出,客户同时购买 frozenmeal、beer、 cannedveg 的概率很高。因此,商家可以将这三种商品放在相邻的位置,以促进销量。

 图 44 Apriori”模型查看窗口

(6)          运行并查看“Carma”关联模型结果。运行“Carma”模型的数据流,在右上侧生成数据模型,右键查看,如图 45 所示。同样可以看出,客户同时购买 frozenmeal、beer、 cannedveg 的概率很高。

 图 45 “Carma”模型查看窗口

(7)          利用“网络”图进行定性关联分析。选定“类型”节点,双击“图形”选项卡下的“网络”,既可添加“网络节点”。然后,需双击编辑 “网络”节点,将步骤(5)中选择的 11 个字段选定为分析字段。运行该“网络”节点,则右上区域生成关联模型,查看该关联模型,如图 46。从图中表明,两点之间的线越粗,表示两者间相关性越强。同时可以通过调节下面的滑动点,查看相关性。

 图 46 “关联”模型查看窗口

IBM SPSS Modeler 【5】 关联分析相关推荐

  1. 非常值得收藏的 IBM SPSS Modeler 算法简介

    IBM SPSS Modeler以图形化的界面.简单的拖拽方式来快速构建数据挖掘分析模型著称,它提供了完整的统计挖掘功能,包括来自于统计学.机器学习.人工智能等方面的分析算法和数据模型,包括如关联.分 ...

  2. IBM SPSS Modeler通过数据挖掘我们能从股市数据得到什么

    众所周知,在证券投资领域将涉及很多数据,因此,通过简单的处理难以有效地分析各种公司股票之间的关系,而关联规则挖掘可以很好的解决这个问题,它允许投资在大量数据中,发现企业股票的相关性,以进一步研究和分析 ...

  3. 《IBM SPSS Modeler数据与文本挖掘实战》之常用数据挖掘软件

    根据数据挖掘软件的开发目的和用途,一般可以分为专业型和通用型两种.专业型数据挖掘软件一般是针对某个特定领域的问题提供解决方案,在设计算法的时候充分考虑到数据的规模.类型以及研究者的需求等特点,并作了优 ...

  4. php 集成 spss,〖SPSS Modeler〗 IBM SPSS Modeler 整合不同数据库之间的数据

    来自IBM DEVELOPERWORKS 简介 由于目前企业客户的业务量和数据量都在不断的提高,随着企业的发展,很多企业的数据存储都不局限于同一个数据库上,如果要对这些存储在不同数据库上的数据进行处理 ...

  5. 《IBM SPSS Modeler数据与文本挖掘实战》之文本挖掘算法

    随着文档信息的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术.现代文本分类和聚类领域面临巨大的挑战,而且随着学者研究的不断深入,其中的一些深层次问题也逐渐暴露出来,一些问题也已经成为本学科进一 ...

  6. IBM SPSS Modeler使用技巧 ----参数及全局变量的使用

    在使用IBM SPSS Modeler过程中,有一些小技巧可能容易被大家忽略,而它们却是可以帮助我们更加高效.方便地实现我们需要的功能,今天给大家介绍参数及全局变量的使用. 什么时候需要用到参数? 在 ...

  7. IBM SPSS Modeler 【1】 K均值聚类

    一.聚类分析 在数据挖掘中,聚类分析关注的内容是一些相似的对象按照不同种类的度量构造成的群体.聚类分析的目标就是在相似的基础上对数据进行分类. IBM SPSS Modeler 提供了多种聚类分析模型 ...

  8. 使用IBM SPSS Modeler进行随机森林算法预测

    IBM SPSS产品系列最主要的两款软件为IBM SPSS Statistics和IBM SPSS Modeler. IBM SPSS Statistics主要用于统计分析,如均值比较.方差分析.相关 ...

  9. IBM SPSS Modeler 18.1最新版本正式发布 | 附下载

    IBM 数据挖掘分析平台IBM SPSS Modeler在市场上一直占据领导者地位,其专业性及易用性一直受到广大用户的喜爱,该平台也不负众望,我们的研发团队一直致力于不断的技术更新及功能的提升,最新版 ...

  10. IBM SPSS Modeler随机森林算法介绍

    在之前的文章<Bagging 或Boosting让你的模型更加优化>中,我们介绍了可以通过Bagging或Boosting技术,使得模型更加稳定和准确率更高,那么今天要介绍的随机森林算法, ...

最新文章

  1. CF231C To Add or Not to Add(思维,模拟)
  2. QueryBuildRange中的表达式
  3. Linux中几个实用快捷键
  4. 计算机原理转移指令题,转移指令计算机原理.pdf
  5. python之sys库
  6. 基于JAVA+SpringMVC+Mybatis+MYSQL的进销存管理系统
  7. Python--day21--包
  8. 【数据结构】30、hashmap=》hash 计算方式
  9. hive-0.11.0安装方法具体解释
  10. 求二叉树中某结点的父结点(左右孩子表示法)
  11. 港科大教授张晓泉:目前AI多做预测分类,还需经济学发现因果关系
  12. 自动控制原理复习第七章——非线性系统分析
  13. 电脑连接移动设备android驱动程序,手机连接电脑驱动程序下载汇总
  14. FC网络光纤通信 c语言实现,[2018年最新整理]光纤通信实验指导书(含原理).doc
  15. 由中秋抢月饼事件想到的
  16. 如何用计算机进行文件夹整理,如何对电脑文件进行分类整理,试试下面这四个步骤...
  17. Fractional Fourier Image Transformer forMultimodal Remote Sensing Data Classification
  18. vue之打印表格的实现
  19. 7-15 福到了 c语言,7-54 福到了 (15 分)
  20. ios中html怎么横屏,苹果xsmax页面怎么横屏

热门文章

  1. RabbitMq安装Web界面插件报错
  2. 用Discuz 搭建个人论坛
  3. ettercap局域网内DNS欺骗(隔壁的哥们轻一点 ...)
  4. 物联网学习之旅:微信小程序控制STM32(三)--STM32代码编写
  5. 易基因|ChIP-seq技术及其在植物研究领域中的应用
  6. 在线代码编辑器:Codeanywhere介绍
  7. (一)计算机网络的一些概念
  8. 【Python】(1)基础语法笔记
  9. sqlite程序实现
  10. git clone 修改配置 设置代理 加速