**

SPSS问卷数据处理步骤

**

一. 准备——界面与数据准备工作
1)先处理显示界面问题,改成中文输出,优化操作过程:编辑→选项→
2)数据字典:定义变量属性(几个代表性的)——复制数据属性:数据→定义变量属性(设好以后)→数据→复制数据属性(把几个代表性的数据属性复制给其他)
3)数据验证:
①定义验证规则
数据→验证→定义规则(可以改名称然后之后加入到数据字典里)
性别只有1、2两种编码(→单变量规则【有效值:在列表中】)
年龄规定取值范围(→单变量规则【有效值:在范围内】)
关键题目取值逻辑:哪几个题目不应当同时选择9,否则作为废卷处理(→交叉变量规则→文本框中输入逻辑表达式【A1=9&B6=9&C5=9】
②进行数据验证:数据→验证→验证数据
4)标识异常个案:数据→标识异常个案(可设定异常的个数)
NOTE:
① 原理:建模(两步聚类分析,按照相似程度自动分为对等组)——评分(每个案例与其所属类别的异常度是多少,并计算相应的异常索引,接着降序排列,索引值最高的一部分被标识为异常个案)——列出原因(异常个案的偏差度指标,该指标最大的变量、数值以及对应的标准值会被作为原因列出)
② 不要迷信,这只是一个强有力的辅助工具而已,并不是绝对正确和完全符合需求的
二. 数据录入
1)数据直接从SPSS录入。(暂时不采用)
2)EXCEL数据文件汇入(文件→打开→数据)
NOTES:
1、类型-数值,标签-题目
2、“从第一行读取变量名”&范围
3.EXCEL录入数据:第一行变量名称,每行一份问卷,用1,2,3,4,5等代替答案,最后在SPSS汇入后把标签以及各种属性改了。(数据字典)
三. 计算变量
1、变量的加总和平均,把三个问卷的各个维度以及总的均值(使用MEAN函数)计算出来
2、反向题编码(转换→重新编码)
NOTES:1、“如果”更改旧值与新值 2、在输出数据部分取新变量名称按更改
四. 缺失值的侦测与插补
变量缺失值:分析→描述统计→频率表(描述统计部分)
样本缺失值:转换→计算变量→函数中点选NMISS(选变量取新名字)
插补:转换→替换缺失值(不同缺失值插补法效果不同)
五. 选择与分割观察值
1、数据→选择个案
2、数据→拆分文件
NOTES:
③ 拆分文件后各种分析将会拆成几组做(“比较组”与“分组方式”),不拆文件后记得要回来选择“分析所有个案”。
④ 之后描述性统计分析只用做一次就好了(人口统计学变量部分)。
六. 描述性统计分析
对于连续变量:
分析→描述统计→频率→将类别变量选入对话框→统计量(选中峰度和偏度)
NOTE:记得勾选“将标准化值另存为变量”
对于类别变量:
频率:(对性别、年龄、不同生源地等)或者绘制饼图
交叉表:分析→描述统计→交叉表格(变量选入)→统计量
⑤ 检查两个以上类别变量交叉所占比例
⑥ 检查两个类别之间有无关系(独立性卡方检验、Phi and Cramer s V)
NOTE:卡方检验只告诉我们有没有关系,但是P&C告诉我们关系有多大(0-1)
⑦ 同质性检定(检查不同变量所占比例是否相同)
七. 推论统计
1、差异性描述
1)独立样本T检验
分析→比较均值→独立样本T检验
NOTE:
检验变量框:三个变量总均值及其各维度(一次只做一个变量)
分组变量:性别、是否独生子女
定义组:性别和生源地都是只有两个编码:1和2,组1:1,组2:2
2)单因素方差分析
分析→比较均值→单因素方差分析
因变量:三个总变量均值及其各维度(一次只做一个变量)
因子:父母婚姻状况、不同生源地(一次只能做一个)
选项→方差同质性检验和均值图
八. 相关分析
分析→相关→(先做三个总变量之间的相关4,再做维度之间的相关,一共3*2【父母教养方式】+4【同一性】+2【生命意义感】=12)
结果出来是相关系数矩阵。
九. 回归分析
1、之前已经检验了正态分布(描述统计时)以及方差齐性检验(T/F时)
2、对数据进行标准化处理:在描述统计部分就已经完成
3、预分析用散点图矩阵先查看趋势:之前相关分析已经做了,用的就是标准化的值这一步就省略了。
4、回归分析,分析→回归→线性回归(→统计→选中共线性诊断)做三次
R方也就是拟合度(百分之六十以上),自变量能解释多少的因变量
系数:看显著性,能不能显著预测它,影响系数看正负
多元线性回归(1个方程)除了看系数和R放还要看ANOVA。
共线性诊断:特征根(约为0)和条件指数(>10)可能存在共线性问题→看相关系数矩阵,数值接近1说明可能存在多重共线性。
十. 路径分析[待定]
把维度当作显变量,三个自变量看作潜变量,画图。测量模型是他们大佬每个量表修订分析就做过的因子分析,但是这里并没有用到,否则就变成二阶模型了,那个过于复杂。
0 先绘制潜在和观察变量
1 放资料档
2 抓资料放进图里面
3 存档
4 算盘计算(默认只有非标准化)
5 标准化(在资料旁边有分析属性→OUTPUT→勾选标准化和SMC多元相关平方R方)
非标准化主要看:1、估计值有没有违反估计?2、系数估计有没有显著?
NOTE:
1、⚪上是残差值(必须是正的),观察变量□上是自己的变异数,回归估计主要看显著值(viewtext→output,主要看Estimates and Model Fit[模型配适度摘要:CMIN卡方差异值越小越好、DF越大越好表示模型越精简、P最好不显著与CMIN/DF理想值3-1之间][配适度指标:IFI、TLI、CFI,理想值>0.9甚至0.95],C.R=critical residual临界残差也就是等于spss里的P值,只要>1.96就是显著,相当于p<0.05) C.R的计算方法是Estimates 除以标准误S.E
2、显著性与标准化的值无关,非标准化看显著性,标准化看重要性。
3、残差值是正的,看Variances p显著,没有出现不可接受的值。
• 标准化系数 (-1~1之间)
– 因素负荷量 (测量权重)值为正数并且理想上>0.7, 0.6可接受
– SMC (R方)多元相关平方
• 测量变量的SMC>0.5
• 潜在变量的SMC= 0.19 (small), 0.33 (medium), 0.67(large) – 误差 (1-SMC)
– 变异数值为1
– 回归系数值愈大表示自变量影响力愈大
十一. 在SPSS如何绘制表格?(在此步骤之前已经定义了变量属性)
分析→表→设定表格(表格拖动类似于EXCEL数据透视表的旧对话框)→单击画布上的变量→摘要统计量→
一般来讲,单击或者双击表格内容就可以对其进行元素选择或者编辑
选中相应表格后右击,编辑内容→在阅读器中(嵌套)或者在单个窗口中(新)
工具栏是否出现:视图→工具栏
列宽的更改:视图→网络线
格式→表格外观(另存为可以存储自定义格式)
(改完格式后用)预设模板:系统→编辑→选项→枢轴表→(Academic[三线表模板] )

SPSS问卷数据处理步骤相关推荐

  1. Analyzer脑电数据处理步骤

    Analyzer脑电数据处理步骤 1 简化版流程 2 详细版流程 2.1 设置数据路径的workspace 2.2 转换参考(New Reference 2.3 滤波(Filters) 2.4 ICA ...

  2. 【机器人】激光测距传感器的数据处理步骤

    激光测距传感器FT55-RLAM-800 注:这里针对我们所使用的激光测距传感器FT 55-RLAM-800,不同测距传感器处理方式不完全相同. 问: 怎么从激光测距传感器得到数据并对其测量数据进行处 ...

  3. 海洋磁力数据处理步骤

    ​ (此照片乃航次获奖照片) 前面几个章节介绍了地磁基本知识,由于项目紧急,只能边学习理论, 边处理.经过2个月的努力,基本上掌握了海洋重磁处理的基本方法. 目前,专项的重磁处理都是各单位自己根据规范 ...

  4. 海洋重力数据处理步骤

    ​ (此乃航次获奖照片,形似佛光) (1) 处理导航数据,使用辅助的导航处理功能处理,提取按天提取导航信息 (2) MGDP,列对齐   (3) 转换成儒略日   (4) 提取定位数据,重力预处理(同 ...

  5. spss数据预处理步骤_数据处理之剔除无效问卷

    我们都知道在数据分析前,首先需要对数据进行预处理,检查数据中是否含有存在无效样本.异常值等.如果同一样本中存在大量漏填数据或相似答案过多的情况这样的样本都应该算作无效样本来处理. 无效样本的常见使用场 ...

  6. spss数据预处理步骤_数学建模准备必备的十个数据分析软件(数学建模从入门到精通)...

    前几天咋们聊了很多关于数学建模的干货,比如怎么样去前期准备学习数学建模,又比如数学建模需要哪些疾病软件?再比如数学建模论文摘要写作技巧.昨天那篇更是直接把数学建模常用的思维导图.流程图软件全部统统介绍 ...

  7. 【云端大数据实战】大数据误区、大数据处理步骤分析

    1.背景              首先感谢这次博客的主办方CSDN以及在初赛为我投票的网友们,你们的支持是Garvin前进的动力.本文思路的依据来源于本次天猫大数据竞赛长达三个月的参赛体验.博主作为 ...

  8. SPSS问卷缺失值【011-1期】

    在这里插入代码片 在日常工作及科学研究中,当处理样本较大的群体调查时,由于多种原因可能会导致所收集的数据不完整,这时的初始数据中就含有缺失值.缺失值带来许多负面影响.比如:含缺失值的观测可以看作是正常 ...

  9. spss非线性回归分析步骤_SPSS与简单线性回归分析

    对数据进行简单线性回归分析常按照以下步骤: 1根据研究目的确定因变量和自变量 现研究某服装店销售额和客流量的关系,销售额为因变量,客流量为自变量,共计36条数据. 2 判断有无异常值 判断方法:⑴通过 ...

  10. spss与python和sql区别_Python/Excel/SPSS/SQL数据处理方法比较之2 - 数据查看

    继续这个系列.我们导入了数据,接下来做一下基本的查看. Python 我们的处理对象依然是DataFrame对象df. 首先使用head()函数(或tail()函数)查看最前(最后)的5条记录,获取粗 ...

最新文章

  1. 2016 只剩最后一个月 你的 技术债务 还清了吗?
  2. ROS编程: 一些Tips
  3. 在让元宇宙“圆梦”这条路上,交互技术卡在哪里了?
  4. 从动力学角度看优化算法:一个更整体的视角
  5. 批量修改linux换行格式,linux中sed命令批量修改
  6. android二级菜单实现,Android编程实现二级下拉菜单及快速搜索的方法
  7. Helpful C Tools:source、executables、debugging and performance tuning
  8. 企业级 SpringBoot 教程 (十四)在springboot中用redis实现消息队列
  9. 深度学习自学(三十三):通过结构正则化深度聚类解决无监督域自适应问题
  10. 视频监控市场发展潜力大 六个阻碍待突破
  11. 地图下载区 哪家好用
  12. IT软件开发人员必去的10个社区
  13. 基于Java的网络教学系统
  14. MiniGUI源码分析:GDI(1)-- GDI概览及Surface
  15. scrapy抓取的中文结果乱码解决办法
  16. 网关是什么,一文带你快速入门腾讯技术工程
  17. linux考试不及格反思100字,考试不好的检讨书100字(精选7篇)
  18. JavaWeb-10 (项目案例7 文件上传与富文本编辑器)
  19. 新IT:催生教育新世界
  20. python界面编程-thinker

热门文章

  1. 量化小科普【什么是量化?常用的股票量化指标、如何搭建量化交易系统】
  2. 实例:python 实现有向图找环(反洗钱、资金流)
  3. HTML代码实现简易购物车-web前端教程
  4. 【历史上的今天】9 月 30 日:“计算机之父”争夺战;Microsoft Excel 诞生;百度推出百度地图
  5. uniapp手机号码正则验证
  6. NMEA的GPGGA数据包解析 字符转数字
  7. 一天入门51单片机教程
  8. 51单片机系列封装库
  9. SPSS实现两变量偏相关分析
  10. Java 多态性理解