最近刚刚学习了因子分析的方法,今天来利用《多元统计分析》书中所给的例子与数据,对这个方法进行练习。

中心城市的综合发展是带动周边地区经济发展的重要动力。在我国经济发展进程中,各个中心城市一直是该地区经济和社会发展的“引路者”。因而,分析评价全国35个中心城市的综合发展水平,无论是对城市自身的发展,还是对周边地区的进步,都具有十分重要的意义。因而,本文应用因子分析作出评价。

因子分析法是研究相关矩阵内部的依存关系,寻找出支配多个指标(可观测)相互关系的少数几个公共的因子(不可观测)以再现原指标与公因子之间的相关关系的一种统计方法。这些公因子是彼此独立或不相关的,又往往是不能够直接观测的。在所研究的问题中,以公因子(新变量)代替原指标(原变量)作为研究对象,并要求不损失或很少损失原指标所包含的信息,用公因子代替原指标所作的分析会比较简单和清楚。通常,这种方法需要求出因子结构和因子得分模型。前者通过相关系数来反映原指标与公因子之间的相关关系,后者是以回归方程的形式将指标表示为因子的线性组合。具体步骤如下:

1)对原始数据进行标准化变换,求出各指标间的相关系数矩阵;

2)建立因子模型,并确定因子贡献率及累计贡献率;

3)对因子载荷矩阵进行变换和旋转,并计算因子得分。

对于由因子模型矩阵得到的初始因子载荷矩阵,如果因子载荷之间相差不大,对因子的解释就不是很明确,因此要通过旋转因子坐标轴,使每个因子载荷在新坐标系中能按列和行向0或1两极分化。一般采取方差最大正交旋转法就能得到明确的分析结果。

 

接下来是具体的操作与分析。

一、指标解释

选取反映城市综合发展水平的11个指标,其中7个社会指标,分别为:x1——非农业人口数(万人);x2——工业总产值(万元);;x3——批发零住宿餐饮业从业人数(万人);x4——地方政府预算内收入(万元);x5——城乡居民年底储蓄余额(万元);x6——在岗职工人数(万人);x7——在岗职工工资总额(万元)。

4个城市公共设施水平的指标,分别为:x8——人均居住面积(平方米);x9——每万人拥有公共汽车数(辆);x10——人均拥有铺装道路面积(平方米);x11——人均公共绿地面积(平方米)。

指标的选取参考《中国城市统计年鉴中》指标的设置。原始数据来源于《中国城市统计年鉴(2004)》。

 

 

 

 

二、操作过程:公共因子的提取与计算

 

首先先将所获取的数据标准化后,导入SPSS软件,如图所示:

     接着,采用SPSS中的因子分析命令,使用主成分法来提取公共因子,并按照特征根大于1的原则,选取公共因子。从图中可以看出,提取三个公共因子,累计方差贡献率达到了大约87.9%,另外也保存相应的因子荷载阵、碎石图和成分矩阵,如下图所示。

此时,虽然能够得到公共因子及其成分,但其实际意义并不好解释,很难进行分析,因此,要对公共因子进行方差最大化正交旋转。结果如下:

为了便于分析,在保存荷载矩阵时,选择按其系数大小进行排列,,将在同一个公共因子上具有较高荷载的变量排在前面,结果如下图所示:

最后,计算各因子的得分,并以各因子的方差贡献率的比重作为权重进行加权,计算出个城市的综合得分F(当然,这个综合评价方法似乎有些争议,但也算是应用比较多的方法,故在此尝试使用)

结果如下:

以因子得分为x轴,因子得分为y轴,画出个城市的因子得分图

在进行完对公因子的计算和提取后,需要对所获得结果进行合理解释,并应用于城市经济发展评价当中去。

三、分析与解释

由旋转后的因子载荷矩阵可以看出,公共因子F1在城乡居民年底储蓄余额,在岗职工工资总额,在岗职工人数,地方政府预算收入,非农业人口等变量上载荷值都很大。非农业人口数、在岗职工人数、在岗职工工资总额这几个变量是反映城市规模的指标;工业总产值是反映城市工业发展规模的指标;批发零售住宿餐饮业从业人数是反映城市第三产业的发展规模的指标;地方政府预算内收入是政府作为国家的管理者和国有资产的所有者而获得收入,在一定程度上反映城市了居民的收入水平,而在我国现今的收入分格局下,政府和居民是在分配收入的获得大户,因而,政府预算内收入和城乡居民年底储蓄余额这两个变量在一定程度上反映了城市的国民收入水平,因而F1是反映城市规模及经济发展水平的公共因子,在这个因子上的得分越高,城市经济发展水平越高,城市规模越大。

公共因子F2由于在每万人拥有公共汽车数,人均拥有铺装路道面积和人均公共绿地面积上的载荷较大,是反映城市的基础设施水平的公共因子,在此因子上的得分则反映了一个城市的基础设施水平。公共因子F3仅在人均居住面积上有较大的载荷,是反映城市居民住房条件的公共因子。

有了对各个公共因子合理的解释,结合各个城市在三个公共因子上的得分和综合得分,就可对各中心城市的综合发展水平进行评价了。

首先对表现城市规模及经济发展水平的因子F1进行排序,结果如下:

在城市经济规模因子F1上得分最高的前五个城市依次是北京、上海、广州、天津和重庆,其中,北京的得分为3.75,上海为3.35,远高于其他城市,这就是说,就城市经济发展规模而言,上海、北京是我国最大的城市,而其规模远大于其他城市。而西宁,银川,海口等不发达、规模小的城市,在F1上的得分较低,这与现实情况相符。

接下来对城市基础建设因子F2进行比较:

深圳、广州和南京在F2上的得分较高,而重庆、武汉的得较低,说明深圳、广州、南京的城市基础设施在全国是较好的,而重庆等城市的基础设施相对较差,还需要大力改善。

最后,对居住条件因子F3进行比较:

上海、重庆、深圳等城市在F3上的得分较高,说明居民在居住条件上比别的城市好,而北京由于人口流量过大的缘故,导致居民的居住条件较差。(当然,2004年北京的房价还没有升上去,是不是这一数据在某种程度上预示着会有与居民住房有关的发展政策,进而房价会上涨?)

最后,根据综合得分就可综合评价城市的发展水平。

综合得分前五名的城市依次是上海、北京、深圳、广州和天津;综合得分最低的五个城市依次是西宁、银川、呼和浩特、海口和兰州。再结合各因子得分进行分析,可以大致认为,截止2003年底,北京在城市规模及经济发展水平、基础设施建设方面均位于前列,但是在居民住房面积上的得分较低,因此,需在这方面加大改善力度(后来房价就涨上去了……),上海在城市规模、经济发展水平及居民住房上得分最高,在基础设施方面得分不太理想,这可能是因为上海人口比较多。

综合得分较低的城市,在经济发展水平上的各项因子得分都较低(所谓“马太效应”,不行的地方就什么都不行),因此在城市发展战略上,应秉持着“经济发展是第一要务”的原则,只有经济发展了,城市设施水平及其他方面才能搞上去。

另外,因子得分图分析表明,就城市规模而言,历史悠久的城市大于新兴城市;就城市设施水平而言,南方城市普遍好于北方城市,新兴城市好于老城市;综合来讲,东部地区城市发展水平高于西部地区城市。上海、北京、深圳三城市综合发展水平较接近,上海规模大,但基础设施水平较低;北京规模大,基础设施水平较高,但是居民人均住房较小;深圳规模不大,但是基础设施水平较高,人均住房面积较大。

此外,综合的分值大于零的城市还有广州、天津、重庆、南京、青岛、成都、杭州等,但是这些城市与上海、北京及深圳有一定的差距。其他城市综合得分都小于零,在因子得分图中大致位于原点附近,城市综合发展水平较低,发展格局也较详尽,其中有十几个城市位于因子得分图的第三象限,即经济发展慢、规模小、且基础设施建设较差,这些城市都位于中西部地区。因而,如何加快这些城市的发展以带动周边地区的进步,是影响我国整体经济发展的重要课题。(“西部大开发”战略?)

参考文献:

[1]方开泰,张尧庭. 多元统计分析引论. 北京:科学出版社,1982

[2]王国梁。何晓群. 多变量经济数据统计分析. 西安:陕西科学出版社,1993

[3]方开泰. 实用多元统计分析. 上海:华东师范大学出版社,1989

[4]M.肯德尔. 多元分析. 北京:科学出版社,1999

[5]Bryan F.J.Manly. MultivariateStatistical Methods: A Primer. Chapman and Hall, 1986

多元统计分析作业:中心城市综合发展水平的分析评价相关推荐

  1. 生物群落数据分析最常用的统计方法:回归和混合效应模型、多元统计分析技术及结构方程等数量分析方法

    原文>>>R语言生物群落数据统计分析应用 R 语言作的开源.自由.免费等特点使其广泛应用于生物群落数据统计分析.生物群落数据多样而复杂,涉及众多统计分析方法.本内容以生物群落数据分析 ...

  2. 【多元统计分析】因子分析——SPSS上机实验(过程+结果分析)

    实验数据来自于何晓群<多元统计分析>第五版例题6.3 数据获取请关注公众号:321红绿灯 回复:例6.3 即可获得 区域公用事业的发展是地区綜合发展的重要组成部分,是促进社会发展的重要因素 ...

  3. 多元统计分析何晓群_多元统计分析第四章作业

    关注公众号,更多资源分享 回复关键词:多元统计分析 即可获取更多详细其他章节答案 <多元统计分析>课后答案||何晓群版(第二章) <多元统计分析>第一章课后答案(何晓群编第五版 ...

  4. 《多元统计分析与R语言》大作业

    <多元统计分析与R语言>大作业 免责声明:答案仅供参考. 现收集2002-2020湖南省交通事故相关数据,如下表 时间 交通事故发生数总计(起) 交通事故死亡人数总计(人) 交通事故受伤人 ...

  5. spss典型相关分析_R语言实战 多元统计分析Day10— —典型相关分析

    R语言实战多元统计分析Day10-- 典型相关分析 01 前言 典型相关分析是用于分析两组随机变量之间的相关性程度的一种统计方法,它能够有效的揭示两组随机变量之间的相互线性依赖关系,这种方法是由Hot ...

  6. 【多元统计分析】Python实现对应分析

    (一)题目要求 数据集包含地区生产总值的四个相关指标:x1劳动者报酬,x2生产税净额,x3固定资产折旧,x4营业盈余.对各个地区生产总值进行对应分析,揭示不同地区的生产总值构成特征.要求:画出对应分析 ...

  7. 【多元统计分析】一、多元统计分析概述

    〇.前情提要 b站看[厦门大学MOOC]多元统计分析,因为老师很好看. 参考: [厦门大学MOOC]多元统计分析 https://www.bilibili.com/video/BV1v7411E7PB ...

  8. 【多元统计分析】均值向量和协方差阵的检验——spss上机实验

    均值向量和协方差阵的检验--spss上机实验 #参考书目为<多元统计分析>(第五版)--何晓群.中国人民大学出版社 #如有错误,请指正!谢谢~ #关注公众号搜索同名文章获取数据~ 习题2. ...

  9. 多元统计分析及R语言建模(王斌会)第八、九、十章答案

    1)试述主成分分析的基本思想 主成分分析是利用降维的思想,将多个变量转化为少数几个综合变量(即主成分),其中每个主成分都是原始变量的线性组合,各主成分之间互不相关,从而这些主成分能够反映始变量的绝大部 ...

  10. python 多元线性回归_多元统计分析之多元线性回归的R语言实现

    多元统计分析之多元线性回归的R语言实现 多元统计分析--multivariate statistical analysis 研究客观事物中多个变量之间相互依赖的统计规律性.或从数学上说, 如果个体的观 ...

最新文章

  1. 黑色星期五c语言,求黑色星期五问题~
  2. javascript 权威指南第7版_免费领书 | 气相色谱与质谱实用指南(原著第2版)
  3. Distributed locks with Redis--官方
  4. m5310模组数据上传至onenet_硬核干货!基于M5310-A的NB-IoT水表通信模块软件业务逻辑分享...
  5. 51nod 1770 数数字 找规律,注意进位,时间复杂度O(n)
  6. iOS 证书错误 Certificates下面的 App Store and Ad Hoc是灰的?? 点不了
  7. 台湾邮政历史常设展重新开幕
  8. LeetCode 815. 公交路线(最少换乘,BFS)
  9. quartz集群重复调度的解决
  10. 论文笔记_S2D.05-2012-ECCV-从立体图像中提取与场景一致的三维对象和深度
  11. 盘点:2022年10款比较火的项目管理软件
  12. 基于Pipeline的CI/CD在趣头条的应用实践
  13. uniapp 二维码生成器 uQRCode
  14. 面向对象版学员管理系统 Python
  15. autojs免root脚本引擎开发的QQ空间说说点赞源码
  16. 银行从业资格考试通过后如何申请证书
  17. http url get方式传递数组参数
  18. 销售中提问的技巧 PPT培训资料
  19. 〖全域运营实战白宝书 - 运营角色认知篇⑥〗- 不同企业的 “运营“ 不一样
  20. MOS管符号识别MOS管不同功能MOS管与寄生电容

热门文章

  1. 【Java -- 设计模式】UML 统一建模语言
  2. 如何区别文本是BIG5还是GB
  3. 计算机应用基础第四版答案周南岳,计算机应用基础周南岳答案.docx
  4. 串口调试更方便-安卓串口调试工具(附底层USB源码)
  5. 怎样在电脑桌面上显示计算机,怎样在电脑桌面上显示天气 - 卡饭网
  6. 常用正则表达式匹配(中文字符)
  7. 教你轻松又简单的绘制地铁线路图
  8. Centos7下载安装教程【图文详解】
  9. CentOS7版本下载地址发布 附正确下载CentOS各个版本镜像
  10. ngod规范_[转载]NGOD一些感悟