SPSSAU入门---浅谈问卷设计到数据分析之间的联系
前言
笔者于2021年暑假在家准备数学建模竞赛,准备过程中由于缺少数据处理工具,且以往的项目与统计类论文中同样急需数据处理的知识与工具,笔者于这个暑假在家浅浅学习了数据分析的相关知识,熟悉了SPSS与SPSSAU,与大家分享。
一、SPSSAU是什么
SPSSAU是一个智能化在线统计分析平台,隶属于北京青丝科技有限公司旗下网站。SPSSAU即SPSS+automatic,网页使用简洁清晰的模块与选择按键,并配有便利的使用手册,对新手极为友好。
二、浅谈数据分析基础概念理解
官网给我们提供了很方便的《帮助手册》,作为数据分析的新手,通过《帮助手册》熟悉网站操作方式、清晰定类与定量两种变量的区别、了解数据分析常用方法的用途、清晰各种方法对应研究的数据的种类(定类-定类、定量-定量、定类-定量、定量-定类),学会利用要研究的方向结合分析方法确定问卷题目的类型与内容。
⭐⭐⭐⭐⭐⭐浅谈问卷问题、定量与定类两种变量与各个方法之间的选择⭐⭐⭐⭐⭐⭐
在我们研究的过程中,大概流程为设计问卷,收集数据,处理数据和结论成文几个步骤。
几个过程看似独立,但其中有着必然的关系,想要做好一项好的研究结果,一定要结合几者,了解他们之间的形成关系,通过正逆两方面做准备与分析。
1、问卷设计:问卷问题类型主要有:单选题、多选题、量表题、填空题。问卷问题通常以个人信息为开始,调查个人信息,此处多为单选题进行调查;接着通常有一些个人对某件事情或某一方面问题的看法与态度,通常利用单选题或多选题进行调查;然后进行的大多是对个人态度或喜恶的程度调查,这一类型题目叫做量表题,量表题通过数字区间值选择来衡量受访者的态度,选择范围从极端态度到相反的极端态度;最后可能带有一些填空题,但在设计问卷的过程中,我们要尽量避免填空题的出现,一是填写人的时间与精力占用太多导致问卷质量下降,二是在数据分析的过程中,我们难以将其量化,因此在设计过程中,我们要尽量把可能出现的选项考虑全面来,通过选择题或量表题来设计问卷,而这一过程就需要设计人积攒大量的经验并结合数据分析的知识来设计出合理的问卷,需要读者多多动手实践积累。
2、变量对应数据的分类:在数据分析的过程中,SPSSAU将数据分为了定类与定量两种数据。
术语 | 说明 | 举例 |
---|---|---|
定量数据 | 数字大小具有比较意义 | 您对天猫的满意度情况(非常不满意,比较不满意,中立,比较满意,非常满意) |
定类数据 | 数字大小代表分类 | 性别(男和女),专业(文科、理科、工科) |
通过以上的定义我们可以联想到问卷中不同的问题类型,定量数据指的是有意义的的数字,可以表示大小,正好对应着量表题中的“程度”,因此量表题所统计出的数据均为定量数据,其他问卷中的统计收入、支出、人数等数字信息同样可以归为定量数据;而定类数据顾名思义,我们可以联想到问卷中的单选题与多选题。
3、研究两种变量之间的关系,利用两个变量的数据类型来选定研究方法。
数据分析无非是研究某一变量的分布情况、数据的可信度(信度),可用还是不可用(效度)、两个变量之间的差异、两个变量之间的相关性、两个变量之间的相关公式、评价填写数据、降低变量维度研究问题等等……
但变量所对应的数据类型的差异导致了不同方法的选择,具体对应关系如下表,读者要多多熟悉方法对应的数据类型和方法的用途,在使用的时候才能得心应手,信手拈来。
分析方法 | 功能介绍 | 一句话说明 | 数据类型 |
---|---|---|---|
频数 | 百分比 | 男女比例分别多少 | 定类 |
交叉(卡方) | 差异关系 | 不同性别【 X 】人群是否抽烟【 Y 】的差异情况 |
X(定类) Y(定类) |
描述 | 平均值 | 平均身高,量表数据平均得分等 | 定量 |
分类汇总 | 差异关系 | 不同城市的销售额情况 |
X(定类)【 可选 】 Y(定量/定类) |
相关 | 相关关系 | 身高【 X 】和体重【 Y 】有没有关系 |
X(定量)【 可选 】 Y(定量)【 可选 】 |
回归 | 影响关系 | 身高【 X 】影响体重【 Y 】吗? |
Y(定量) X(定量/定类) |
聚类 | 人群分类 | 300个人分成几类? | 定量 |
因子 |
浓缩 权重 |
30句话概述成5个关键词(因子) 5个关键词(因子)分别代表30句话的信息比重? |
定量 |
主成分 |
浓缩 权重 |
30句话概述成5个关键词(成分) 5个关键词(主成分)分别代表30句话的信息比重? |
定量 |
信度 | 可靠性 | 数据真实吗? | 定量 |
效度 | 有效性 | 数据有效吗? | 定量 |
项目分析 | 区分度 | 设计的量表题目是否有区分度? | 定量(量表题) |
熵值法 | 权重 | 研究项的权重比例如何? | 定量 |
方差 | 差异关系 | 不同收入【 X 】群体的身高【 Y 】是否有差异? |
X(定类) Y(定量) |
t 检验 | 差异关系 | 不同性别【 X 】群体的身高【 Y 】是否有差异?【 X 仅2个类别比如男和女】 |
X(定类) Y(定量) |
多重响应(多选/单选-多选/多选-单选/多选-多选) | 百分比 | 多选题的选择比例情况如何 |
X(定类)【 可选 】 多选题选项 |
事后多重比较 | 差异关系 | 不同收入【 X 】群体的身高【 Y 】详细差异情况?【 X 两两组别之间差异对比】 |
X(定类) Y(定量) |
单样本t 检验 | 差异关系 | 身高是否明显等于1.8 | 定量 |
配对t 检验 | 差异关系 | 注射新药和没有注射的两组老鼠,血压一样吗? |
配对1(定量) 配对1(定量) |
逐步回归 | 影响关系 | 帮我自动找出影响身高 Y的因素 X |
Y(定量) X(定量/定类) |
分层回归 | 影响关系 | 身高【 X,分层1】对于体重【 Y】的影响,再加入饮食习惯【 X,分层2】,看看饮食习惯对体重的影响有多严重 |
Y(定量) 分层1(定量/定类) 分层2(定量/定类) 分层3(定量/定类) 分层4(定量/定类) |
正态性检验 | 正态检验 | 数据正态吗? | 定量 |
非参数检验 | 差异关系 | 身高数据不正态时,我想研究收入【 X 】与身高【 Y 】的差异关系 |
Y(定量) X(定类) |
双因素方差 | 差异关系 | 性别【 X 】和地区【 X 】对于身高【 Y 】的差异 |
Y(定量) X(定类,2个) |
二元Logit | 影响关系 | 哪些因素【 X 】影响人们是否购买电影票【Y 】 |
Y(定类,2项) X(定量/定类) |
多分类Logit | 影响关系 | 哪些因素【 X 】影响人们购买不同类型电影票【 Y 】 |
Y(定类,2+项) X(定量/定类) |
散点图 | 数据关系 | 身高【 X 】和体重【 Y 】的关系情况,并且区分性别【颜色区分】 |
Y(定量) X(定量) 颜色区分(定类) |
直方图 | 正态性 | 身高数据是否正态分布 | X(定量) |
箱线图 | 数据分布 | 身高数据的分布情况 | X(定量) |
词云图 | 数据展示 | 热点城市房价指数展示 |
X(定量) 加权项(可选) |
总结
以上就是今天要讲的内容,本文仅仅简单介绍了笔者对从问卷设计到数据分析之间的联系,而SPSS又是数据分析的重要工具,作为新手可以大胆尝试,通过经验的积累,相信我们能共同进步,做出一套好的答卷。
SPSSAU入门---浅谈问卷设计到数据分析之间的联系相关推荐
- 计算机中用户的分类有哪些,用户分类浅谈交互设计 -电脑资料
说到网络产品,离不开的话题就是用户,就像传统行业的消费者, 不分类不好定位, 好的用户分类让我知道了我在追求哪些人,满足哪些人,影响哪些人.但分不好类又会错位,更糟,那怎样才能对某一款产品的用户群进行 ...
- 浅谈数据库设计技巧(上)
浅谈数据库设计技巧(上) 说到数据库,我认为不能不先谈数据结构.1996年,在我初入大学学习计算机编程时,当时的老师就告诉我们说:计算机程序=数据结构+算法.尽管现在的程序开发已由面向过程为主逐步过渡 ...
- 【转】 机器学习入门——浅谈神经网络
[转] 机器学习入门--浅谈神经网络 本文转自:https://blog.csdn.net/bitjoy/article/details/50464989 先从回归(Regression)问题说起.我 ...
- 第十五届智能车入门浅谈
@TOC第十五届智能车入门浅谈 写博客原因 这次第十五届全国智能车大赛已经结束了,对于我而言,确实是我大学中一个不可多得的经历,我希望我的这段经历可以保存下来通过博客的形式,同时可以对于其他人有帮助, ...
- 中鸣循迹机器人_浅谈机器人设计方法
浅谈机器人设计方法 摘要: 机器人是人类完成智能化中非常重要的工具, 随着时代的发展, 机器 人已经在世界有了一定的发展,甚至很多国家机器人已经运用到实际的生活中 去. 而机器人的设计方法无疑是很多人 ...
- 浅谈工厂设计--java必备技能
浅谈工厂设计–java必备技能 说到工厂,我就联想到了亚洲的大工厂富士康–接过订单然后按照固定的模板生产商品,其实java中工厂类中的工厂方法也是一样,接过参数,根据参数来生产需要的商品: 今天我们一 ...
- 浅谈购物中心设计之外立面设计注意点
购物中心的主体定位中,可以通过外立面设计充分的发挥和展现个性,吸引八方游客,从而使购物中心的商圈辐射超越了地区的界限.具体来说,购物中心外立面设计需要注意哪些方面呢?我们今天就来浅谈购物中心设计之外立 ...
- 浅谈UML类图中类之间的5种关系
什么是UML类图? 类图显示了一组类.接口.协作以及他们之间的关系.在UML中问题域最终要被逐步转化,通过类来建模,通过编程语言构建这些类从而实现系统.类加上他们之间的关系就构成了类图,类图中还可以包 ...
- [UWP]浅谈按钮设计
一时兴起想谈谈UWP按钮的设计. 按钮是UI中最重要的元素之一,可能也是用得最多的交互元素.好的按钮设计可以有效提高用户体验,构造让人眼前一亮的UI.而且按钮通常不会影响布局,小小的按钮无论怎么改也不 ...
- 我的家乡网页设计_Graphic Design|康石石浅谈LOGO设计在作品集中的创作方法
写在前面的话 平面设计范畴极广,其领域不仅限于常见的版式设计.海报设计.LOGO设计.VI设计.书籍装帧.广告设计.网页设计.在艺术留学申请过程中,学习平面设计的同学们需依据目标院校对作品集项目及页数 ...
最新文章
- 易点租加速电脑租赁市场布局
- android 蓝牙 不休眠_全新便携蓝牙键盘 雷柏XK100带来高效办公新体验
- 德勤发布《中国智能制造分析报告》
- 广州自由自在进口食品休闲消费的趋势
- redis管道的使用
- RabbitMQ是如何运转的?
- 原来sync.Once还能这么用
- linux中java 里面启动 重启 停止jar 的 shell
- webpack——一站到底一
- VB.Net - 环境设置
- 2019液晶电视机质量排名前十名
- keil5 调试不进主函数一直卡在0x1FFFF3B2 F8D01808 LDR r1,[r0,#0x808]
- 畅捷通李鲲:云让自然语言处理在企业更快落地
- The Nicest Word(io优化)
- 关于先有鸡还是先有蛋,终于有正确答案了 1
- 阿里云国际版云服务器自助诊断系统-Unirech
- POI设置excel样式
- redis集群介绍和搭建 (3个主机,6个实例)
- 【三种常见架构开发模式:MVC、MVP、MVVM】
- 深度学习数学基础——矩阵微分篇
热门文章
- FYI| Free online events
- 产品设计学习(三)——用户画像与特征工程
- html 给表格添加背景颜色,HTML表格标记教程(7):背景颜色属性BGCOLOR
- 手机端获取外网IP方法
- 荣耀手机环比倍增,小米有点受伤
- linux 活动主分区,主引导扇区(MBR),分区表(DPT)及活动分区(DBR) | 技术部落
- 微信公众号,图文编辑超链接中,没有外部链接只能增加公众号链接是什么情况?
- word2007删除某一页的页眉横线
- python分组统计excel数据_在python中对数据进行分组并与excel进行比较
- 一键打开 macOS Mojave 的黑暗模式