数据的身份:存储类型、测量级别、角色。
Modeler 在读取数据阶段,变量可以分为3种状态:
(1)非实例化:变量的存储类型、取值范围均未知。
(2)半实例化:变量的存储类型已知,取值范围未知。
(3)实例化:变量的存储类型、取值范围均已知。

1. 字段的“类型”功能

改变变量的存储类型→字段中的填充节点
改变变量的测量和角色→字段中的==“类型”==节点

案例:Demos文件下“bank_customer_data.xlsx”的数据文件。

1.1 读取数据文件


1.2 使数据完全实例化

建议:在Modeler读取数据后,对数据进行实例化。另外,当数据源发生变化时,或者对数据进行集成清洗后,对数据重新进行实例化。

1.3 改变字段的测量和角色

2. 字段的“过滤器”功能

设定好变量的身份后,需要对数据进行进一步的处理,比如删除或重命名等。
字段中的“过滤器”节点主要提供数据过滤功能,如删除字段、重命名字段以及匿名化字段等。

案例:Demos文件下“bank_customer_data.xlsx”的数据文件。


SPSS Modeler 数据整理之变量设定 (指南 第三章)相关推荐

  1. 《IBM SPSS Modeler数据与文本挖掘实战》之常用数据挖掘软件

    根据数据挖掘软件的开发目的和用途,一般可以分为专业型和通用型两种.专业型数据挖掘软件一般是针对某个特定领域的问题提供解决方案,在设计算法的时候充分考虑到数据的规模.类型以及研究者的需求等特点,并作了优 ...

  2. 《IBM SPSS Modeler数据与文本挖掘实战》之文本挖掘算法

    随着文档信息的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术.现代文本分类和聚类领域面临巨大的挑战,而且随着学者研究的不断深入,其中的一些深层次问题也逐渐暴露出来,一些问题也已经成为本学科进一 ...

  3. IA-32系统编程指南 - 第三章 保护模式的内存管理【1】

    第三章 保护模式的内存管理[1] [作者:lion3875 原创文章 参考文献<Intel 64 and IA-32 system programming guide>] IA-32保护模 ...

  4. Elasticsearch6.8开发指南-第三章-设置Elasticsearch

    Elasticsearch6.8开发指南-第三章-设置Elasticsearch 本章简介 安装Elasticsearch 使用.zip或安装Elasticsearch.tar.gz 在Windows ...

  5. Python精确指南——第三章 Selenium和爬虫

    3       Selenium 3.1     介绍 网络爬虫在互联网领域有着广泛的应用. Selenium是一个页面自动化控制框架.能够模拟实际操作,自动化获取网站提供的页面资源信息. Selen ...

  6. Java7并发编程指南——第三章:线程同步辅助类

    Java7并发编程指南--第三章:线程同步辅助类 @(并发和IO流) Java7并发编程指南第三章线程同步辅助类 思维导图 项目代码 思维导图 项目代码 GitHub:Java7Concurrency ...

  7. 《数据密集型计算和模型》第三章_内存计算复习

    <数据密集型计算和模型>第三章的有关内容.主要有内存计算的概念.内存计算的硬件结构.内存计算的系统软件.内存数据库等相关内容. 文章目录 一.内存计算的概念 1. 为什么需要内存计算? 2 ...

  8. SPSS Modeler 数据定义(指南 第二章)

    关于SPSS Modeler 中的数据规则: 排列规则:一行一记录(对象),一列一指标(变量). 变量的属性:存储类型.测量级别和角色. 1. 存储类型 存储类型表示变量在计算机中的存储方式. 例如, ...

  9. IBM SPSS Modeler数据库内建模

    IBM SPSS Modeler Server支持对数据库供应商的数据挖掘工具和建模工具进行整合,其中包括IBM Netezza.IBM DB2 InfoSphere Warehouse.Oracle ...

  10. 面向程序员的数据挖掘指南-----第三章:隐式评价和基于物品的过滤算法

    本章会从用户的评价类型开始讨论,包括显式评价(赞一下.踩一脚.五星评价等等)和隐式评价(比如在亚马逊上购买了MP3,我们可以认为他喜欢这个产品). 内容: 显式评价 隐式评价 哪种评价方式更准确? 基 ...

最新文章

  1. 稳压源GWINSTEKGPD3303系列控制软件
  2. C++多线程实现生产者消费者模式
  3. python队列线程池_实例详解:python高级编程之消息队列(Queue)与进程池(Pool)
  4. C语言 读取字符串数组中的字符串并获取字符串的长度
  5. RocketMQ类关系图之NameServer
  6. java lazy loading_java – Spring,@Transactional和Hibernate Lazy Loading
  7. ITK:将图像翻转到指定的轴上
  8. postgres 支持的线程数_为什么 Java 坚持多线程不选择协程?
  9. Linux系统的iptables防火墙、SNAT、DNAT原理与设置规则
  10. 百度SEO emlog虚拟源码商城模板
  11. VB案例:多功能文本处理器
  12. stimwoo大师解释MSDP与MBGP的关系
  13. SQL server无法打开项 UNKNOWN\Components\929B2416EC4102B48A989956983ACF45\1F7B2B09C788E7644A0F08CA9C1D解决办法
  14. 基于51单片机+DS1302时钟模块+LCD1602显示
  15. 替换word模板内容 Java实现
  16. c语言封皮,C语言程序设计封皮.doc
  17. 【verbs】ibv_query_port()
  18. 鸿蒙系统多屏协同,华为EMUI 11支持畅连、多屏协同等功能,与鸿蒙设备实现交互...
  19. chrome单击打开标贴在当前窗口的新标签页设置
  20. PXE系列之一:PXE环境搭建

热门文章

  1. 我在南大的七年(刘未鹏先生)
  2. Android群英传笔记——摘要,概述,新的出发点,温故而知新,可以为师矣!
  3. node.js中模块化开发(Gulp4)
  4. pwnable tw Starbound writeup
  5. CPU使用率和负载区别及分析
  6. css分辨率乱了,css布局:屏幕分辨率问题
  7. 线代 006 克拉默法则 线性方程组求解
  8. 木马克星――Trojan Ender正式国际版 2.0.0
  9. 网络—— 数据链路层,MTU
  10. node.js、React和VUE的纯理论