SPSS-描述统计与图示分析
1. 描述统计
1.1 连续性变量
统计指标需要反映的是数据以下几方面的特征:
SPSS描述统计中有多项可以展示最大值、最小值等,这里重点介绍频率:
点击统计之后出现:
(后验分布可以认为是分布特征指标)
自行选择指标之后,得到分析结果:
偏态系数为负-0.212,分布左偏,即大部分样本数据集中靠右,长尾在左。反之,系数为正,分布右偏,长尾在右。一般0.51.0或-0.5-1.0之间为中等程度的偏斜。标准正态分布的偏态系数为0。利用直方图能够很好地观察偏度。
Z 分数(Z_Scores):相对位置的测度(一个数值距离平均值有多远)
1.2 分类变量
相对于连续变量,分类变量的统计描述指标体系比较简单,主要是对各个类别取值进行各自的频数和比例计算,主要的分析任务为
• 频数分布
• 多个分类变量的联合描述
• 多选项统计描述
1.2.1 交叉列联表分析
多个分类变量的联合描述:对两个,甚至多个分类变量的频数分布进行联合观察和汇总分析——交叉列联表分析 Crosstabulation。
例如分析当前居住的房子类别于购房需求之间是否存在联系。
行对应类别,显示百分比更利于比较。
282名受访者; 租房有200(70.9%);自有房82(29.1%);样本分布情况:未来购房预期中,增加,不变和减弱的人数分别为61(21.6%),175(62.1%),46(16.3%) ; 整体分析,大部分人观望,其次是有购买意愿者;整体态势是保守但有一定的积极性。
横向:对不同居住类型的人购房意愿的差异分析
租房200,预期增强43(21.5%),不变134(67%), 减弱23(11.5%);
自有房82,预期增强18(22.0%),不变41(50%) ,减弱23(28%);
1.2.2 分组条图
运用分组条图观察交叉列联表:
在报告中点开图表之后可以设置数字标签:
可见对于不同居住类型的人,未来的住房预期大部分人不变。租房者预期增强者显著高于减弱者,刚性需求;自有房者,减弱者略高于增强者。据这一结果推测,两种不同类型受访者购房预期之间存在一定差异。
1.2.3 总结
以上结论基于描述统计的频数分析的推测,但是不同“居住现状”的人的“购房预期”是否存在关联,还需要对“居住现状”与“购房预期”进行相关性分析(卡方检验)才能下定论。
交叉列联分析可以帮助我们了解多个变量的分布特征,在此基础上再进行变量的相互影响和关系的探索。
1.3 图示分析
除常见的各种图表之外,SPSS还有两个特殊的图表:P-P图和Q-Q图,可以检验数据的正态分布。
P-P图是根据变量的累积比例与指定分布(正态)的累积比例之间的关系所绘制的图形。
通过P-P图可以检验数据是否符合指定的分布。
当数据符合指定分布时,P-P图中各点近似呈一条直线。
如果P-P图中各点不呈直线,但有一定规律,可以对变量数据进行转换,使转换后的数据更接近指定分布。
Q-Q图是一种散点图,对应于正态分布的Q-Q图,就是由标准正态分布的期望值为纵坐标,样本值观察值为横坐标的散点图.
1.3.1 对非正态变量进行转换
如下图所示,对激素水平这一项进行分析,观察其是否符合正态分布。
首先绘制出其频率分布图,观察其具体分布:
数据长尾在右,这是明显的右偏数据。
绘制出其P-P图和Q-Q图:
如果符合选择的检验分布,点的分布应当拟合于图中直线,但是显然“激素水平”字段的数值很不拟合。同理,可以绘制出Q-Q图。
对“激素水平”字段进行对数转换:
从图可以看出转换后的数据更符合正态分布。
1.3.2 思考
为什么需要对数据进行转换?数据不应该求真吗?
**数据变换的目的在于使数据的呈现方式接近我们所希望的前提假设,从而更好的进行统计推断。**更详细的细节见 帖子。
1.3.3 箱线图
偏离值:距离盒长的1.5倍以上被认为是偏离值Outliers
极端值:距离盒长3倍以上为极端值Extremes
极端值与偏离值越多,代表偏离情形越严重。
选择因变量并置可以将箱线图绘制在同一张图表上,进行对比分析。
不同的箱线图之间进行对比,可以分析变量处理前后分布的变化。
对于箱线图,多用于对分类变量某个指标的分布进行对比分析。
2. 图示技术
2.1 柱状图(条形图)
柱状图x轴是分类变量,直方图多为连续变量。
2.1.1 频率条形图
2.1.2 群集条形图
2.1.3 堆积条形图
2.1.4 3D条形图
越复杂蕴涵的维度越多,图包含的内容也就越多。
2.1.5 误差条形图
误差条形图适用于展示自变量不同分类下,连续或有序分类变量的差异。自变量可以是二分类、有序多分类或无序多分类。误差条形图通常用于展示独立样本t检验和单因素方差分析结果。
2.2 折线图
2.3 面积图
2.4 饼图
2.5 点图
从垂线图中可以看出,无论何种学历,离异的现状指数都是比较低的。
从散点图中可以看出不同指标之间的拟合关系。
3D图可以展示同一题项不同小题之间的分布关系。
SPSS-描述统计与图示分析相关推荐
- 8种 骨干级 架构设计模式 图示 分析 优缺点 总结
8种 骨干级 架构模式 图示 分析 总结 文章目录 8种 骨干级 架构模式 图示 分析 总结 单库单应用模式 内容分发模式 查询分离模式 微服务模式 多级缓存模式 分库分表模式 弹性伸缩模式 多 ...
- PSM倾向性评分分析介绍、spss进行倾向性评分分析示例
PSM倾向性评分分析介绍.spss进行倾向性评分分析示例 目录 PSM倾向性评分分析介绍.spss进行倾向性评分分析示例 PSM倾向性评分分析
- IBM SPSS Statistics的生存分析寿命表如何使用
寿命表分析,一般目的是为了通过数据,制作寿命表和对应的生存函数图,以此分析出在不同时间的对应生存率.它的优点在于对生存时间的分布没有过多限制,可估算某生存时间的生存率,可比较不同处理组的生存率,可考察 ...
- SPSS编程在Ridit分析中的应用
SPSS编程在Ridit分析中的应用 多样本有序分类资料(或等级资料)我们一般采用非参数检验--H检验(Kruskal-Wallis法),但其结论只得出三组或多组间总的有差别,若要知道两两间是否有差别 ...
- 基于SPSS的经典统计学分析与偏度峰度等常用统计学指标计算
本文所述数据经典统计学分析包括计算数据的极值.平均值.中位数.标准差.方差.变异系数.偏度与峰度等常用统计学指标. 首先,打开SPSS软件. 第一步需要将数据导入SPSS中.选择" ...
- spss相关性分析看结果_利用spss做Pearson相关性分析步骤详解
有蛮多的学生私信老徐问如何利用spss做相关性分析,其实相关性分析应该是spss分析中较为基础的一个功能应用,很多学生可能是因为跨专业或者对统计软件了解较少,在没有经过系统学习的前提下,感觉云里雾里. ...
- 使用SPSS进行曲线估算分析
回归分析是处理数据.分析数据特征和关系的一种重要方法,在各个领域的数理统计分析中都非常有用.回归分析中有多种分析方法,接下来我们要介绍的是IBM SPSS Statistics中的曲线估算分析方法. ...
- spss进行多元线性回归并分析表格(转载)
1.如何使用spss进行多元线性回归. 2.分析生成结果,并判断回归是否可行. 一.使用spss进行多元线性回归: 1.输入数据 二.表格结果分析: R方是检验回归是否成功的重要要素之一,DW是残差独 ...
- SPSS多元线性回归残差分析的基本方法
写这篇博客,也是觉得网上很多人没有把这个讲清楚.据这个网页中的网友介绍: 残差分析包括以下内容: ①残差是否服从均值为零的正态分布: ②残差是否为等方差的正态分布: ③残差序列是否独立: ④借助残差探 ...
- SPSS教程之生存分析的Cox回归模型(比例风险模型)
最近有同学问师兄,"最近我要做生存分析,可是我不太会,也不太懂,师兄能不能教教我",好吧,今天开一贴,讲讲这个.有同样的问题的同学可以一起来看看,毕竟在临床.科研上,这方面知识还是 ...
最新文章
- file的open()和read()
- 网站设计常用技巧收集
- leetcode - Single Number
- first level cache check - User parameter /UI2/CACHE_DISABLE
- java 打包zip下载_java web 将文件打包成 .zip后 肿么自动弹出下载框提示并下载?
- Windows 11 预览版 Build 22000.168 发布
- Redis和DB数据一致性解决方案
- mysql 排序num_MySQL 实现row_number() 分组排序功能
- 各科老师的语言风格一览,太真实了哈哈哈哈哈哈
- 第一次作业源于计科一班的王相博
- centeros mysql_center os 7 Mysql 安装
- 简单搭建es6编译环境
- 对天敏电视精灵I老版播放器的修改和分析
- 虚拟机安装教程win7_vm16虚拟机|vmware16安装教程
- 项目中Makefile写法的一种参考
- Edge 浏览器的收藏夹文档位置——最新版windows10和edge
- 大数据金融,这个“跨界整合”会带来什么
- 大型客服外包公司和小型客服外包公司的不同
- 2021年G1工业锅炉司炉考试平台及G1工业锅炉司炉作业考试题库
- 实现卷积神经网络:吴恩达Course 4-卷积神经网络-week1作业 pytorch版
热门文章
- [渝粤教育] 西南科技大学 行政法学与行政诉讼法学 在线考试复习资料(1)
- MAC docker 使用阿里加速器
- pytest文档71-pytest+yaml实现接口自动化框架
- 2021华硕秋季新品发布会:每一幕,都精彩
- c++ SIMD AVX2比较 例子
- 如何利用ICEPAK进行热仿真分析,简单易学
- 10道经典java面试题_实习生必问(java基础)
- python计算iv值_python计算IV值
- 基于TI CC2540汽车检测蓝牙4.0 BLE方案
- 黑马程序员 python 数据分析 代码_2020年最新版 5.0程序员 黑马python人工智能数据分析机器学习软件测试全栈开发...