数据描述:Cosmetic surgery(整形手术)

In the USA, there was a 1600% increase in cosmetic surgical and non-surgical treatments between 1992 and 2002, and 65,000 people in the UK underwent privately and publicly funded operations in 2004 (Kellett, Clarke, & McGill, 2008). With the increasing popularity of this surgery, many people are starting to question the motives of those who want to go under the knife. There are two main reasons to have cosmetic surgery: (1) to help a physical problem, such as having breast reduction surgery to relieve back ache; and (2) to change your external appearance, for example by having a face-lift. Related to this second point, one day cosmetic surgery might be performed as a psychological intervention: to improve self-esteem (Cook, Rosser, & Salmon, 2006; Kellett et al., 2008). Our first example looks at the effects of cosmetic surgery on quality of life. The variables in the data file are

Post_QoL: This variable is a measure of quality of life after the cosmetic surgery(整形手术后的生活质量).

Base_QoL: Quality of life before the surgery.

Surgery: This dummy variable specifies whether the person has undergone cosmetic surgery (1) or whether they are on the waiting list (0).

Clinic: This variable specifies which of 10 clinics the person attended to have their surgery.

Age: This variable tells us the person’s age in years.

BDI: People volunteering for cosmetic surgery (especially when the surgery is purely for vanity) have different personality profiles than the general public (Cook, Rosser, Toone, James, & Salmon, 2006). In particular, these people might have low self-esteem or be depressed. When looking at quality of life it is important to assess natural levels of depression, and this variable used the Beck Depression Inventory (BDI) to do just that(BDI抑郁量表).

Reason: This dummy variable specifies whether the person had/is waiting to have surgery purely to change their appearance (0), or because of a physical reason (1).

Gender: This variable specifies whether the person was a man (1) or a woman (0).

本数据集有.sav(用于SPSS)与.dat(用于R)两种格式,你在答题过程中只允许使用一种格式的数据,例如,如果你首先使用了.dat格式的数据,你在答题过程中将不可以再使用.sav格式的数据,若答题中需要在SPSS中分析本数据集,你必须通过R的数据管理方法将.dat格式的数据导出到可以被SPSS导入的格式,并在答题中显示以上步骤。若违反此规定,你使用第二种格式数据集所解答的问题将不予计分。

以下全部问题,你可使用SPSS或者R甚至两者混合进行解答,但每种工具至少要被独立使用解决一个问题(小题)。

  • (25分) 任选数据集中的三个定类变量,完成以下问题:
  1. (15分)请运用推断统计方法,分析此三个变量中任意两个变量之间的关系,基于此给出上述变量间的关系,给出你的操作的过程并说明理由及实际意义;

答:我选用诊所(clinic)、性别(Gender)和外科(Surgery)三个变量。

设:

H0:不同性别间接受过整容手术的情况无差别

H1:不同性别间接受过整容手术的情况有差别

操作步骤:分析—描述统计—交叉表,将“Gender”选入“行变量”,“Surgery”选入“列变量”,在“统计”中勾选“卡方”“相关性”,点击确定。

输出结果如下图:

表1是统计概要说明,表明有效数据有276个,系统缺失值为0个。

表2是交叉表。

表3为卡方检验表,标下的注释解释了有0个单元格的期望频次小于5,满足实验要求,卡方检验是有效的。其中皮尔逊卡方值为24.941,皮尔逊卡方值的检验的显著性水平为0.000,小于0.05,因此接受原假设H0,拒绝备择假设H1。说明不同性别间接受过整容手术的情况有显著差异。结合表2交叉表,可以看出女性在是否接受整形手术的情况上等待的人数占比要高于男性,说明女性在是否接受整形手术方面相比较于男性更纠结,或者说更加难以决定。

  1. (10分) 针对你选择的三个变量,用统计作图方法描述展示三个变量间的关系,并基于此描述统计给出目标数据的特点分析。

操作步骤:打开spss文件,点击菜单栏“分析”—“描述统计”—“频率”,将“性别”“年龄”选入变量框中,在“图表”选项中勾选“条形图”,“图表值”选择“频率”。

输出结果:

统计

Age

Cosmetic Surgery

Gender

个案数

有效

276

276

276

缺失

0

0

0

众数

35

0

0

标准 偏差

11.095

.500

.496

方差

123.099

.250

.246

范围

47

1

1

最小值

18

0

0

最大值

65

1

1

Age

频率

百分比

有效百分比

累积百分比

有效

18

2

.7

.7

.7

19

2

.7

.7

1.4

20

5

1.8

1.8

3.3

21

2

.7

.7

4.0

23

6

2.2

2.2

6.2

24

7

2.5

2.5

8.7

25

12

4.3

4.3

13.0

27

9

3.3

3.3

16.3

28

9

3.3

3.3

19.6

29

8

2.9

2.9

22.5

31

10

3.6

3.6

26.1

32

14

5.1

5.1

31.2

33

15

5.4

5.4

36.6

35

20

7.2

7.2

43.8

36

14

5.1

5.1

48.9

38

10

3.6

3.6

52.5

40

10

3.6

3.6

56.2

41

13

4.7

4.7

60.9

43

12

4.3

4.3

65.2

45

10

3.6

3.6

68.8

46

9

3.3

3.3

72.1

48

14

5.1

5.1

77.2

50

14

5.1

5.1

82.2

51

14

5.1

5.1

87.3

53

6

2.2

2.2

89.5

55

6

2.2

2.2

91.7

57

6

2.2

2.2

93.8

59

7

2.5

2.5

96.4

61

5

1.8

1.8

98.2

63

4

1.4

1.4

99.6

65

1

.4

.4

100.0

总计

276

100.0

100.0

Cosmetic Surgery

频率

百分比

有效百分比

累积百分比

有效

Waiting List

145

52.5

52.5

52.5

Cosmetic Surgery

131

47.5

47.5

100.0

总计

276

100.0

100.0

Gender

频率

百分比

有效百分比

累积百分比

有效

Female

157

56.9

56.9

56.9

Male

119

43.1

43.1

100.0

总计

276

100.0

100.0

以上的图表展示的是年龄、外科手术与性别三个变量之间的频数关系。下面进行描述统计分析。

步骤:打开spss文件,点击菜单栏“分析”—“描述统计”—“描述”,将“性别”“年龄”“外科手术”选入变量框中,在“选项”选项中勾选“方差”,“图表值”选择“频率”,点击确定。结果如下:

描述统计

N

最小值

最大值

均值

方差

Cosmetic Surgery

276

0

1

.47

.250

Age

276

18

65

39.17

123.099

Gender

276

0

1

.43

.246

有效个案数(成列)

276

在输出结果中,变量是按照选择的顺序排列的。由于3个变量都没有缺失值,所以有效数据均为276个。以年龄为例,年龄的最小值为18,最大值为65,平均值为39.17,方差为123.099.

  • (35分) 自行选择本数据集中的若干变量,回答以下问题:
  1. (8分) 选择一个尺度变量,分别利用描述及推断统计方法判断其是否服从正态分布;

答:我选择年龄(age)来说明。

首先通过描述统计方法说明。操作步骤是打开spss文件,点击菜单栏“分析”—“描述统计”—“频率”,将“年龄”选入变量框中,在“图表”选项中勾选“条形图”,“图表值”选择“频率”。输出如下:

直观看,年龄服从正态分布。

接下来进行推断统计方法。设

H0:年龄服从正态分布

H1:年龄不服从正态分布

点击分析-非参数检验-1sample K-S,从左侧选择age进入对话框,点击确定。

输出结果如下:

单样本柯尔莫戈洛夫-斯米诺夫检验

Age

个案数

276

正态参数a,b

平均值

39.17

标准 偏差

11.095

最极端差值

绝对

.101

.101

-.066

检验统计

.101

渐近显著性(双尾)

.000c

a. 检验分布为正态分布。

b. 根据数据计算。

c. 里利氏显著性修正。

从图中看出,检验统计的值为0.101,双尾检验的显著性水平为0.000,小于0.05.因此应拒绝总体的年龄服从正态分布的假设。

  1. (12分) 除了正态性,通常参数检验方法还需要数据满足哪几类前提条件;

答:(1)单因素方差分析前提条件
正态性检验,独立性检验,方差齐性
(2)多因素方差分析前提条件
正态性检验,独立性检验,方差齐性
(3)简单相关分析
A参数方法(Pearson方法)
要求所有变量均服从正态分布
B非参数方法(Spearman方法)
适用于不服从正态分布的变量
ps:偏相关分析和复相关分析均要求服从正态分布(Pearson方法)
(4)线性回归分析的前提条件
A自变量之间相互独立
检验方法:多重共线性检验,检验指标为容许度(Tolerance)和方差膨胀因子(VIF)
B残差独立且服从正态分布
检验方法:一是作图法,二是DW(Durbin-Watson)检验,三是Runs检验
C自变量和因变量之间的关系是线性的
检验方法:一是作图法,二是t检验,三是F检验与可决系数

  1. (15分) 通过检索数据集形成一个数据子集,要求此子集中仅包含:术后生活质量高于55,年龄小于35的女性患者的信息;同时,此数据子集中不许包含诊所信息及BDI指数;请将这个子集存为单独的数据文件提交。

答:具体文件提交为“第2题第3问输出文件”。

  • (40分)  任选数据集中的变量进行线性回归分析,并回答以下问题:
  1. (8分)假设你建立的线性模型是由一个尺度变量和一个定类变量组成,根据以往学习内容请分辨二者谁是因变量/自变量,简要阐述分析二者关系所用的方法的原理及使用此方法时数据需要满足的前提条件;

答:定类变量是自变量,尺度变量是因变量。线性回归(Linear Regression)是利用称为线性回归方程的最小平方函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。这种函数是一个或多个称为回归系数的模型参数的线性组合(自变量都是一次方)。只有一个自变量的情况称为简单回归,大于一个自变量情况的叫做多元回归。

前提条件:(1)自变量与因变量是否呈直线关系。(2)因变量是否符合正态分布。(3)因变量数值之间是否独立。(4)方差是否齐性。

其实如果正规地来说,应该是看残差(residual)是否正态、独立以及方差齐。

  1. (16分)不考虑上一问,建立你自己的线性回归模型,简述你的操作的过程,并描述此模型的实际意义;

以Post_QoL(后生活质量)为因变量,年龄(age)、Base_QoL(基本生活质量)为自变量进行多元回归分析。

操作过程:首先将“年龄”“基本生活质量”设置为数值变量。点击分析—回归—线性,将“后生活质量”填入因变量框,将“年龄”和“基本生活质量”填入自变量框。在统计中选择“模型拟合”“R2”“描述”“共线性诊断”,回归系数选择“估算值”,在“图”中勾选“直方图”和“正态概率图”,点击确认。

输出结果如下:

其中,系数回归表如下:

系数a

模型

未标准化系数

标准化系数

t

显著性

相关性

共线性统计

B

标准错误

Beta

零阶

部分

容差

VIF

1

(常量)

37.703

3.797

9.930

.000

Age

.088

.042

.140

2.062

.041

.220

.156

.138

.967

1.034

Baseline Quality of Life

.353

.054

.443

6.508

.000

.468

.447

.436

.967

1.034

a. 因变量:Quality of Life After Cosmetic Surgery

由此可知,Baseline Quality of Life(基本生活质量)的回归系数B=0.353,显著性为0,小于0.05,说明随着基本生活质量的增加,后生活质量随之提高,结果有统计学意义。

而年龄的回归系数仅为0.088,显著性为0.041,小于0.05,说明年龄对后生活质量的影响不是很显著,结果也具有统计学意义。

所以回归模型为:

Post_QoL=37.703+0.088Age+0.353Base_QoL

  1. (16分)请给出模型有效性分析。

根据2题输出结果。结果分析:

模型摘要b

模型

R

R 方

调整后 R 方

标准估算的错误

更改统计

德宾-沃森

R 方变化量

F 变化量

自由度 1

自由度 2

显著性 F 变化量

1

.488a

.238

.229

6.0302

.238

26.598

2

170

.000

1.948

a. 预测变量:(常量), Baseline Quality of Life, Age

b. 因变量:Quality of Life After Cosmetic Surgery

ANOVAa

模型

平方和

自由度

均方

F

显著性

1

回归

1934.404

2

967.202

26.598

.000b

残差

6181.733

170

36.363

总计

8116.137

172

a. 因变量:Quality of Life After Cosmetic Surgery

b. 预测变量:(常量), Baseline Quality of Life, Age

共线性诊断a

模型

特征值

条件指标

方差比例

(常量)

Age

Baseline Quality of Life

1

1

2.951

1.000

.00

.01

.00

2

.041

8.463

.05

.99

.07

3

.008

19.202

.95

.01

.93

a. 因变量:Quality of Life After Cosmetic Surgery

(1)由R2=0.238,可知,该回归模型拟合良好。

(2)由ANOVA方差分析可知,F=26.598,显著性为0.000小于0.01,可知数据呈正态分布,符合回归分析要求。

(3)由共线性诊断结果可知,特征值=2.951,说明自变量间不存在共线性问题。

(4)由残差图和累计概率图可知,残差基本呈正态分布,模型拟合良好。

SPSS考试操作题试卷相关推荐

  1. 协税员计算机考试题,2017年计算机等级考试基础题试卷「附答案」

    2017年计算机等级考试基础题试卷「附答案」 一.单选题 1.信息可以通过声.图.文等信息传播媒体在空间传播是指信息的___C_____性. A.失效 B.可识别 C.传递 D.存储 2.激光唱盘对音 ...

  2. 用计算机考试不保存直接提交,计算机一级考试操作题没储存,然后就交卷,系统会自动储存答案吗?有...

    计算机一级考试操作题没储存,然后就交卷,系统会自动储存答案吗?有以下文字资料是由(历史新知网www.lishixinzhi.com)小编为大家搜集整理后发布的内容,让我们赶快一起来看一下吧! 计算机一 ...

  3. 2013河北省职称计算机应用能力考试操作题答案,2013河北省职称计算机应用能力考试操作题步骤详解(部分).doc...

    2013河北省职称计算机应用能力考试操作题步骤详解(部分) 2013河北省职称计算机应用能力考试操作题步骤详解PAGE PAGE - 11 - 共 NUMPAGES 11页操作题PPT 1-5PPT操 ...

  4. 计算机期末考试操作题简单,计算机期末考试操作题及答案计算机期末考试操作题及答案.doc...

    计算机期末考试操作题及答案计算机期末考试操作题及答案 计算机期末考试操作题及答案 雾仔 2008-11-21 12:31 二. 操作题 1.请在考生文件夹下完成如下操作: 1) 在考生文件夹下建立&q ...

  5. 某高校计算机系举办了一场,国家二级MS+OFFICE高级应用机试(操作题)-试卷25

    国家二级MS OFFICE高级应用机试(操作题)-试卷25 (总分:6.00,做题时间:90分钟) 一. Word字处理软件的使用(总题数:1,分数:2.00) 1.请在"答题"菜 ...

  6. 2013河北省职称计算机应用能力考试操作题答案,(2013河北省职称计算机应用能力考试操作题步骤详解PPT部分.doc...

    (2013河北省职称计算机应用能力考试操作题步骤详解PPT部分 操作题PPT 1-5 PPT操作练习一 打开PPT文件夹下的"PPT_1.PPT"演示文稿文件,然后进行如下操作: ...

  7. 计算机二级考试操作题outlook,2017年计算机考试二级考试操作题.doc

    2017年计算机考试二级考试操作题 Table "as guiding ideology, conscientiously implement the party's sixteen and ...

  8. 计算机学业水平测试初中生操作题,初中学业水平考试信息技术考试操作题常见题型及作答方法...

    初中信息技术考试操作题常见题型及作答方法 牛角寨乡初级中学 信息技术考试已经有两年了,通过这两年的考试情况来看,我认为,要想在信息技术考试中取得一个好的成绩,操作题是一个很重要的环节,从这两年的情况来 ...

  9. 一级计算机上字处理题的替换题步骤,一级计算机练习题计算机一级计算机基础及+MS+OFFICE+应用(操作题)-试卷6...

    计算机一级计算机基础及 MS OFFICE 应用(操作题)-试卷6 (总分:14.00,做题时间:90分钟) 一.基本操作题(总题数:1,分数:2.00) 1.1.在考生文件夹下CCTVA文件夹中新建 ...

最新文章

  1. .net 导出excel和word
  2. 深度学习100例-卷积神经网络(VGG-16)猫狗识别 | 第21天
  3. php 数组美化_php 打印数组格式化显示
  4. QML基础类型之palette
  5. MS SQL Server中的CONVERT日期格式化大全
  6. dubbo protocol port 消费者端_Dubbo 优雅停机演进之路
  7. pip 清华大学镜像_pip源很慢,更改成清华的镜像地址
  8. 词性标注-隐马尔可夫模型
  9. Python3 函数参数
  10. 《一页纸项目管理》读书笔记
  11. 基于Java+SpringBoot+vue+node.js的智能农场管理系统详细设计和实现
  12. 玩转STM32(4)学会目录分类
  13. C++之 Eigen-3.4.0 全方位教程:Chapter02-矩阵篇
  14. WIN SERVER 2008安装VS2015踩坑小结
  15. Mysql出现Table 'performance_schema.session_status' doesn't exist
  16. 调整bandizip压缩参数获得最大压缩效果
  17. 2017最新淘宝高转化详情页排版技巧(转载)
  18. 关于iOS推送中点击通知的几点备忘
  19. android view.isshown,关于android:View getVisibility()isShown()返回不正确的可见性
  20. 弘玑|数字员工赋能金融转型,迈向更加高效灵活的运营模式

热门文章

  1. object-UI之基础动画
  2. eclipse配置hadoop2.7.2开发环境并本地跑起来
  3. 单片机,51红外通信代码,详细注释【普中科技】【350行】【原创】
  4. Android Octa源码编译和下载过程详细记录
  5. 【(高职专科组)第十一届蓝桥杯省模拟赛答案】小明非常不喜欢数字 2,包括那些数位上包含数字 2 的数。如果一个数的数位不包含数字 2,小明将它称为洁净数。
  6. android x86小白安装教程,电脑上安装Android 10小白教程,大屏Android用起来
  7. 腰椎间盘突出症的自我疗法
  8. BB基础知识概念汇总和常见问题[最新补充JDE JDK主题
  9. ccf-星际旅行(80分)
  10. Python用Turtle画美国国旗