- 学习资料

IBM SPSS Modeler 18.0 Applications 第4章

- 应用场景

为每个客户提供合适的报价方案以实现更高收益

- 数据源描述

数据源名称pm_customer_train1.sav

- 应用模型

自动分类器

- 分析思路

通过“自动分类器”节点,为标志(例如某个指定客户是否可能拖欠贷款或者是否对特定的报价做出响应)或名义(集合)目标自动创建多个不同的模型并进行比较排序,选择最有效的模型,然后将它们合并为一个汇总(整体)模型。此方法将自动化操作的方便性与组合多个模型的优势融为一体,从而产生任何单一模型所不能带来的更为准确的预测。

- 设计步骤

1、选取源节点“Statistics文件”,读取外部数据源;
Variable names选择Read names and labels
Values选择Read data and labels

2、添加类型节点
把response的Role设置为Target(输出/目标),Measurement(数据类型)设置为Flag(标志),
把campaign的Role设置为input(输入/预测变量),Measurement(数据类型)设置为Nominal(名义),
对于下列字段,将Role设置为无:CMSomer_id、response_date、purchase、purchase_date、product_id、Rowid 和 X_random(当构建模型时,将忽略这些字段),
其它字段保持不变,
接着点击Read Valuse读取值。

3、定义标签
在campaign字段的行上单机Values列的条目,在下拉列表中选择specify…(指定…),在弹出的指定窗口上,输入设置campaign字段4个值分别对应的标签,点击确定后,就可以通过点击显示字段和值标签工具栏按钮在输出窗口中显示标签



4、为单项活动筛选记录
尽管数据包含有关四项不同活动的信息,但每一次的分析应侧重于其中一项活动。由于 Premium account活动(在数据中编码为 campaign=2)中的记录数最大,因此可以使用Select选择节点实现仅在流中包含这些记录。

5、
附加一个自动分类器节点,然后选择总体准确性作为对模型进行排序的度量,
将要使用的模型数设置为 3,这意味着在执行节点时将构建三个最佳模型,
在“专家”选项卡上,可从最多11种不同模型算法中进行选择,由于在“模型”选项卡上将要使用的模型数设置为 3, 因此节点将计算11个算法的准确性, 并构建包含三个最准确算法的单个模型块。

在“设置”选项卡上, 对于整体方法,选择置信度加权投票(还可以选择最初倾向加权投票/最高置信度当选/平均原始倾向)。此选项确定如何为每条记录生成一个汇总评分。

  • 置信度加权投票

置信度即可靠度,对结果有多少信心保证是正确的概率
使用简单投票方式时,若三个模型中有两个模型均预测“是”,则“是”将以 2 比 1 的投票结果取胜。在使用
置信度加权投票方式时,将基于各模型预测的置信度值进行加权投票。因此,如果一个预测“否”的模型的置信度比另外两个预测的模型“是”合在一起的置信度还高,则“否”取胜。

  • 最高置信度当选

使用最高置信度当选方式时,在各模型中,预测的置信度值最高的模型取胜。因此还是上面的例子,如果一个预测“否”的模型的置信度比另外两个预测的模型“是”的置信度都高,则“否”取胜。

  • 最初倾向加权投票

倾向评分指特定结果或响应的可能性,倾向评分仅适用于有标志目标的模型,并且指示为字段定义的值为真的可能性
计算原始倾向评分,然后基于各模型预测的倾向评分进行加权投票。因此还是上面的例子,如果三个模型预测“是”的倾向评分之和,大于预测“否”的倾向评分之和,则“是”取胜。

  • 平均原始倾向

计算原始倾向评分平均值。因此还是上面的例子,如果三个模型预测“是”的倾向评分的平均值,大于预测“否”的倾向评分的平均值,则“是”取胜。
6、运行

- 结果分析与评估

默认情况下, “自动分类器”节点的“模型”选项卡中选择了总体准确性度量,因此模型将根据此度量进行排序。(还可以选择曲线下面积/利润/增益/字段数)根据这一度量,C51 模型的精确性最高,但 C&R 树和 CHAID 模型的精确性与之相差不大。基于这些结果,您可以决定使用所有这三个最准确的模型。通过结合多个模型的预测,可以避免单个模型的局限性,从而使总体准确性更高。

在模型块后面连接一个“分析”节点。右键单击分析节点,然后选择运行以运行流。由整体模型生成的汇总评分将显示在名为 SXF-response的字段中。根据训练数据进行度量时, 预测值与实际响应(如原始响应字段中的记录所示)相匹配的总体准确性为 92.82%。尽管该准确性低于此个案的三个模型中的最高准确性(C51 为 92.86%),但它们之间的差异非常小,可以忽略不计。一般来说, 在应用到除训练数据之外的数据集时, 整体模型通常更可能具有良好效果。基于总体准确性,“C51”、“C&R 树”和 CHAID 模型对于训练数据效果最佳。

- 补充

上面设计输入模型的记录都是campaign=2时的记录,当我们想把全部记录作为输入的时候,可以在上面的实验中把campaign的Measurement(数据类型)设置为拆分,那么自动分类器将为每个分割(campaign=1、campaign=2、campaign=3、campaign=4)构建模型

SPSS Modeler 自动分类器学习笔记相关推荐

  1. SPSS Modeler C5.0学习笔记

    学习资料 IBM SPSS Modeler 18.0 Applications 第8章 数据源描述 数据源名称:DRUG IN数据文件 应用模型 C5.0 C5.0 节点可以构建决策树或规则集.该模型 ...

  2. java 包装类缺点_Java 自动拆箱和自动装箱学习笔记

    Java 自动拆箱和自动装箱学习笔记 详情参考以下 1. 概述 Java 中的自动装箱和自动拆箱算是一种语法糖,也就是在编译阶段编译器在合适的情况下帮我们的做了自动拆箱和自动装箱. 众所周知,Java ...

  3. 自动控制原理学习笔记系列( 一、自动控制系统的稳定性分析)

    自动控制原理学习笔记系列 第一篇 自动控制系统的稳定性分析 自动控制原理学习笔记系列 一.目的 二.操作步骤 1. 研究高阶系统的稳定性 2.系统根轨迹增益变化对系统稳定性的影响 一.目的 (1) 研 ...

  4. 百度Apollo自动驾驶学习笔记

    Apollo学习笔记 作者:邹镇洪(清华大学车辆学院,个人主页 转到Github项目主页查看持续更新 转到Github项目主页查看持续更新 转到Github项目主页查看持续更新 本文是对百度Apoll ...

  5. 自动控制原理学习笔记---自动控制系统校正与综合

    自控原理学习笔记 自控原理学习笔记专栏 第一章--反馈控制系统的动态模型 第二章--控制系统稳定性分析 第三章--连续时间系统性能分析 第四章--自动控制系统校正与综合 第五章--线性离散系统 自动控 ...

  6. SPSS Modeler KNN分类器(第十七章)

    分类器算法: 积极学习方法:eager learner,是先用数据进行模型训练再进行打分的方法.如前面学到的线性回归和Logistic分析,都是通过训练数据集得到分类模型,再利用训练后的模型对新的测试 ...

  7. 自动控制原理学习笔记(持续更新)

    文章目录 自动控制原理 控制系统的数学模型 非线性特性线性化 传递函数 零极点表示 时间常数表示法 信号流图与梅逊公式 时域分析法 典型输入函数 性能指标 暂态性能指标 稳态性能指标 一阶系统的时域分 ...

  8. 自动控制原理学习笔记(四)

    第四章 控制系统的稳定性及稳态误差 文章目录 第四章 控制系统的稳定性及稳态误差 4.1 基于传递函数的稳定性分析 4.1.1 连续系统稳定性及劳斯判据(书3.8~3.9) 线性定常系统稳定的充要条件 ...

  9. 自动控制原理 学习笔记2

    3 几个基本的概念以及传递函数 前向通道传递函数,顺着系统输入箭头的方向,到达系统输出的通路,且路径中经过的环节不重复. C ( s ) E ( s ) = G 1 ( s ) ⋅ G 2 ( s ) ...

  10. 自动控制原理学习笔记(二)

    第二章 控制系统的简单数学模型 时域:常微分方程 复频域:传递函数 方框图 信号流图(Mason增益公式) 状态空间模型 离散系统:脉冲传递函数 2.1 基本概念 2.1.1 数学模型的定义 描述各变 ...

最新文章

  1. OpenCV代码提取:merge/split函数的实现
  2. Android设备唯一性判断
  3. Python处理正则表达式超时的办法
  4. 文献记录(part60)--高维模型选择方法综述
  5. Java开发环境!java写猜数字小游戏
  6. 关于ubuntu终端命令路径太长的问题
  7. HTML复古游戏官网模板
  8. exif_imagetype() 函数在linux下的php中不存在
  9. 100%防御ARP***
  10. win10pe命令打开计算机,手把手教你如何制作win10PE启动盘
  11. 前沿重器[21] | 聊聊对话系统:概述
  12. X264编码h264
  13. 使用wireshark分析tcp报文
  14. RecyclerView使用中遇到的问题
  15. 您的计算机无法访问dota2服务器,一招解决DOTA2国服客户端无法启动问题
  16. tolist方法python_python中如何使用tolist()方法将数组或者矩阵转换为列表?
  17. Linux源码解析--从开机加电到main函数
  18. [MQ]什么是消息队列?
  19. Julia两天极速入门学习笔记
  20. No silver bullet——没有银弹理论

热门文章

  1. Your application has presented a UIAlertController的解决方法
  2. mongodb一致性协议_Mongodb选举机制
  3. Java练习用Java写双人游戏简单四子棋
  4. 深度学习(PyTorch)——shape、view、reshape用法及其区别
  5. 【LaTeX应用】latex排版中插入参考文献
  6. 【Jquery】文本框校验练习
  7. 网页设计语言html做思维导图,web网页实现思维导图展示
  8. 新一轮支付革命,利楚扫呗的数据库优化之路
  9. 【深度学习】BatchSize设置
  10. 数据链路层(以太网、MTU、ARP协议)