SPSS MODELER笔记2
常用的统计分析检验
连续变量和连续变量的关系分析
相关分析
先通过散点图来进行观察,考察相关系数r。r介于1到-1之间,r>0,正相关,绝对值越大相关程度越强。0.3333到0为弱相关,0.3333到0.6666为中相关,0.6666-1为强相关
之后需要判断p值是否小于0.05,是否显著,原假设是不存在线性相关
相关系数r为0意思是两个变量间不存在线性关系,但不代表不存在其它关系。相关关系不等于因果关系
节点:Statistics
功能:检查----选择字段
Stastics-----统计指标
相关-------做相关分析的变量
相关设置-----相关强度的设定选项
A.在输出中表示强度:表示出强度
B.按照重要性(1-p):越接近1代表越有相关关系
0到0.9为弱
0.9-0.95为中
0.95-1为强
C.按绝对值定义-----越接近1越强
卡方检验
分类变量与分类变量之间查看相关关系
先通过”分布“节点绘制堆积条形图来进行可视化观察,然后对认为显著的变量进行卡方检验(列联表分析)
拟合优度:考察理论频数与现实频数之间的差别,没有差别卡方值就是0
p值查看与0.05的关系,原假设是相互独立的
矩阵节点
设置--字段:选定就是手动指定,所有标志(true)是所有标志字段纳入,所有数值是所有数值字段纳入。包含缺失值,对缺失值也进行计算(另立一个类别,与同组其他变量同级)。单元格的函数处的交叠字段就是划分类别的地方,分组的地方
外观-----行和列:排序 交叠字段---会使用特殊颜色对前后几个字段进行标记
t检验及方差分析
连续性变量和分类型变量的配对,独立样本,两独立样本等等以及方差分析(大于2种的变量)
平均值节点
设置---在字段对之间:就是进行配对组 在字段的组之间:独立组比较
选项---设定边际值
SPSS MODELER笔记2相关推荐
- SPSS MODELER笔记1----数据基本处理和整体方法概念
基本思路 统计挖掘模型是利用一个或多个输入变量,一般也被称为自变量,通过你和适当的关系式来预测目标变量也被称为因变量的方法. 误差 往往在模型当中也包含了随机误差项,它是指在测试过程中因诸多因素随机作 ...
- SPSS Modeler数据挖掘学习_部分笔记
数据挖掘是一个过程,是一个以数据为中心的循序渐进的螺旋式数据探索过程. ![上图指出,数据挖掘时一个以数据为核心多个环节紧密相连,循环反复且循序渐进的数据探索过程](https://img-blog. ...
- SPSS Modeler ADP自动数据准备学习笔记
学习资料 IBM SPSS Modeler 18.0 Applications 第6章 数据源描述 数据源名称telco.sav 应用模型 ADP自动数据准备 分析思路 ADP可以自动分析数据并识别需 ...
- SPSS Modeler C5.0学习笔记
学习资料 IBM SPSS Modeler 18.0 Applications 第8章 数据源描述 数据源名称:DRUG IN数据文件 应用模型 C5.0 C5.0 节点可以构建决策树或规则集.该模型 ...
- SPSS学习笔记(1)
SPSS学习笔记(1) SPSS是世界上最早的统计分析软件,美国斯坦福大学的三位研究生研制,于20世纪60年代末成立了SPSS公司,并于1975年在芝加哥组建了SPSS总部. 2009年7月28日,I ...
- 非常值得收藏的 IBM SPSS Modeler 算法简介
IBM SPSS Modeler以图形化的界面.简单的拖拽方式来快速构建数据挖掘分析模型著称,它提供了完整的统计挖掘功能,包括来自于统计学.机器学习.人工智能等方面的分析算法和数据模型,包括如关联.分 ...
- oracle从入门到精通_【论文】基于SPSS Modeler和Oracle的学生行为数据分析
张翠轩,曹素丽,王淑梅 (石家庄邮电职业技术学院计算机系,河北 石家庄050021) 摘要: 随着校园信息化程度的日益提高.学校积累了大量的学生数据,如何充分利用这些数据,获取其中蕴藏的价值,已经成为 ...
- SPSS Modeler 18.0 新功能权威解读(文末附下载地址)
在今年,IBM SPSS Modeler发布了新版本18.0,那么在这次新版本的更新中,我们可以看到更新的幅度还是比较大的.接下来,浩彬老撕将给大家介绍18.0版本中一些新的功能,同时也将为大家详细介 ...
- php 集成 spss,〖SPSS Modeler〗 IBM SPSS Modeler 整合不同数据库之间的数据
来自IBM DEVELOPERWORKS 简介 由于目前企业客户的业务量和数据量都在不断的提高,随着企业的发展,很多企业的数据存储都不局限于同一个数据库上,如果要对这些存储在不同数据库上的数据进行处理 ...
最新文章
- mlcc激光雷达与相机外参标定初体验
- 2017 人工智能+内容生产研究报告
- Rsync+inotify搭建实时同步系统
- 把一个项目放到GItHub上
- 如何安装Windows10+CentOS7双系统_自用成功版——注意看评论的注意事项
- wxWidgets 线程示例
- Netty与Spring WebSocket
- 美国计算机科学专业申请要求,美国计算机科学专业申请条件
- Java包装类中的equals方法
- toj 4607 Multiple of 17
- Codeforces 923 B. Producing Snow
- 微软算法面试题(4)
- 4999元起!华为Mate 40今日开启预售:搭载麒麟9000E
- 毕业设计周记(第二篇)
- springmvc跳转到自定义404页面的三种方法
- 《晚明》小说各战役配图
- 旋翼无人机及摄影测量基础
- 静态内部类、静态变量的加载次数-理解静态内部类实现线程安全的单例模式懒加载
- 什么是最长前缀匹配?为什么网络前缀越长,其地址块就越小,路由就越具体?
- H5兼容性问题解决方法