基于等分线性回归方法的城乡收入差距因素比较分析——以广东省为例
广东外语外贸大学
叶泉君 金融学院 ,何玮珠 经贸学院 ,林华丽 数统学院,罗东凯 金融学院 ,卡德尔丁 商学院
内容提要:本文通过对广东省2013年第四季度至2021年第一季度各季度数据样本的实证分析,采用等分线性回归模型分析财政支出规模、第一产业占比、融资规模、工业增加值、农村最低生活保障资金占比、GDP累计同比增速对城乡收入差距的影响程度。研究结果发现:城乡收入差距主要取决于第一产业占比与融资规模,较小程度取决于工业增加值和农村最低生活保障资金占比,而与财政支出规模和GDP累计同比增速无关。为缩减城乡收入差距,政府可推出相关政策促进更多第一产业在农村发展,并与银行合作有原则地放宽融资,同时要确保农村居民最低生活保障的合理制定,实现农村最低生活保障制度的可持续发展。
关键词:城乡收入差距;等分线性回归;
- 前言
改革开放30多年来,我国在经济快速发展、人民生活水平不断提高的同时,贫富差距也在逐步扩大,尤其是城乡居民收入差距。中国的城乡发展不平衡已经成为制约经济均衡发展的重要因素也引起了越来越多的经济学家的关注。社会群体之间的收入差距超出合理的范围,不仅严重影响农业、农村经济和整个国民经济的持续健康发展,而且还有可能演变成社会问题和政治问题。由于国家政策支持以及人才回流乡镇促进乡村发展,城乡居民收入差距进一步缩小。本研究将以广东省为例,围绕“是什么缩小了城乡收入差距”这一问题展开,运用等分线性回归法,进一步研究城乡收入差距的影响因素对缩小城乡收入差距的影响力。
- 分析方法
- 等分线性回归
线性回归是一种常用并且重要的预测方法,可以用来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,在目前的学术研究中运用非常广泛,尤其是多元线性回归,可以用于分析多个变量对一个因变量的影响,可以避免出现主次关系不清的情况,可以使分析更加全面。如吕露露(吕露露,2021[1])运用多元线性回归对京东进行2020~2024年的营业年收入预测,可以有效的为京东未来发展提供预测依据;王琰(王琰等,2021[2])等人运用多元线性回归方法对地面沉降量进行预测分析,用以为城市地下水开采引起的地面沉降问题研究提供思路和参考。
但多元线性回归也有弊端,在现实研究中,数据通常会有一些极端值,而这些极端值是研究者们应该特别关注的数据,但是,如果使用线性回归模型以其平均值的概念来概括这些极端值,那么必然会使研究结果失真。目前解决极端值数据的模型多用Koenker(Koenker,1978)的分量回归模型,但分位数的概念对于大多数人来说比较陌生,分位数回归模型难以广泛使用,并且不易理解。因此,潘文超教授(Pan,2017[3])提出了另外一种新的回归方式——等分线性回归。
等分线性回归是基于一般线性回归之上而提出的新方法,目的是为了防止数据中的极端值因为取平均值而受到影响,从而导致最后研究结果失真而提出的全新研究方法,也称为“等分线性回归模型”(equal part linear regression model, EPLRM)。等分线性回归的做法是将数据以若干等分方式进行线性回归建模,如此便可以独立观察每一等分模型的趋势,并且与一般线性回归模型做比较,从而可以更加精确的得出两者相关程度以及影响趋势变化。
- 研究设计
本研究以城乡收入差距为被研究变量,运用等分线性回归的方法研究不同变量对城乡收入差距的影响程度。本研究将会对收集到的数据按照时间梯度三等分,并且利用R语言中的等分回归程序进行分析与研究。
在本研究过程中,先运用简单线性回归的方法得到多元回归模型,再进行等分线性回归分析得到三等分的模型,根据模型估计结果对影响城乡收入差距进行预测;随后将等分线性回归模型逐步平移,纪录每一次平移后回归估计所得的系数和置信区间上下限,绘制出线性回归等分线,从而得到此次等分线性回归的置信区间。另外,本研究采用 F 检验得到不同等分间样本数据的差异性,帮助研究结果的进一步分析。
- 指标选择
- 研究设计
城乡收入差距受多方面因素的影响,但其中具体联系还先需要通过具体数据进行分析。城乡收入差距指的是城镇人均可支配收入和农村人均可支配收入的差距,要想全面考虑城乡收入差距的影响因素,那么应该从以下几个角度考虑:政府相关政策;整体资金规模;第一产业规模;GDP变化趋势;投资规模。
- 研究范围及限制
本研究以整个广东省的城乡收入差距为研究对象,收入差距局限于人均可支配收入差距,没有以总收入为研究对象,因为需要考虑到城乡人数占比的因素,所以用人均可支配收入所受影响会更小。本研究的数列设置为时间数列数据,采用了2013年到2021年前半年的每季度数据。
- 变量说明
1.自变量的选取
自变量 |
测量因子 |
说明 |
财政支出规模 |
一般公共预算指出/GDP |
验证政府的预算占比对于城乡收入差距的影响。 |
第一产业占比 |
农、林、牧、渔业总产值/GDP |
第一产业是乡村特有产业。 |
融资规模 |
社会融资规模增量/GDP |
社会融资对于整体经济发展有重大影响。 |
工业走向 |
工业增加值 |
工业是城镇特有产业。 |
农村最低生活保障资金占比 |
农村最低生活保障资金/农村与城市最低生活保障资金之和 |
农村最低生活保障资金与乡村政策有关。 |
GDP变化趋势 |
GDP累计同比增速 |
GDP与人均可支配收入有直接关系。 |
3.样本描述统计
- 实证分析——等分线性回归部分
- 数据来源
读取数据后进行简单线性回归分析,得出r2=0.53。由于广东省逐季度城乡收入差距与其影响因素在近八年内存在个别极端值,将30份原始数据进一步分成三个第一等分(model1C)、第二等分(model2)、第三等分(model3)、各含10组数据的等分区间进行等分线性回归分析,在第一和第二等分区间上r2值均明显高于多元线性回归,说明采用等分线性回归方法解释力更强。得出数值整理汇总如下。
表 1等分线性回归运行结果
LRM R2=0.526 |
EPLRMτ=1 R2=0.943 |
EPLRMτ=2 R2=0.914 |
EPLRMτ=3 R2=0.482 |
||||||||||
Stat. |
Conf. |
T |
Sig. |
Conf. |
T |
Sig. |
Conf. |
T |
Sig. |
Conf. |
T |
Sig. |
|
X1 |
0.374 |
0.604 |
— |
0.928 |
1.189 |
— |
-0.791 |
-0.444 |
— |
-1.234 |
-0.184 |
— |
|
X2 |
-5.991 |
-3.711 |
*** |
-7.517 |
-3.611 |
** |
-4.203 |
-1.539 |
— |
-9.258 |
-0.723 |
— |
|
X3 |
-0.291 |
-1.861 |
* |
-0.062 |
-0.214 |
— |
-1.755 |
-3.781 |
** |
-0.311 |
-0.348 |
— |
|
X4 |
-0.015 |
-2.067 |
* |
0.016 |
0.648 |
— |
0.051 |
0.997 |
— |
-0.021 |
-1.261 |
— |
|
X5 |
-8.572 |
-2.524 |
** |
-27.957 |
-1.225 |
— |
-33.216 |
-1.775 |
— |
-0.279 |
-0.007 |
— |
|
X6 |
0.004 |
0.878 |
— |
0.065 |
0.962 |
— |
-0.056 |
-0.428 |
— |
0.003 |
0.237 |
— |
|
注 1:“-”表示在0.1的显著性水平下不显著;“*”表示在0.1的显著性水平下显著:“**”表示在0.5的显著性水平下显著;“***”表示在0.01的显著性水平下显著。
由表1可知,LRM中X2有99%显著水平,X5有95%显著水平,X3,X4具有90%显著水平。第一等分区间上X2有95%显著水平,第二等分区间上X3有95%显著水平,第三等分区间上均不显著。即在第一等分区间上X2(第一产业占比)对Y(广东省城乡收入差距)有较强的解释能力,在第二等分区间上X3(融资规模)对Y有较强的解释能力。
- 平移模型
对等分样本点数据逐次向右平移,得到如下模型。
其中,红色虚线代表标准线性回归线,贴近红色虚线的两条黑色虚线之间为标准线性回归线的置信区间,黑色粗实线为等分线性回归线,灰色区域为等分线性回归线的置信区间。由图可知,X1(财政支出规模),X2(第一产业占比)在第三等分处若采用标准线性回归会被明显低估;X3(融资规模)总体上被高估,其中,在第三等分处会被明显高估;X4(工业增加值)在第一和第二等分处被略微低估;X6(GDP累计同比增速)总体上被略微高估;X5(农村最低生活保障资金占比)的等分线性回归与标准线性回归无明显差异。
这说明,在财政支出规模和第一产业占比较高的情况下,财政支出规模的扩大和第一产业产值的增加能显著缩小城乡收入差距。在工业增加值较低的情况下,工业增加值的扩大对缩小城乡收入差距有一定影响。总体上看,广东省GDP累计同比增速放缓对缩小城乡收入差距并无太大影响。此外,农村最低生活保障资金占比和社会融资规模的增大对城乡收入差距的缩小并没有显著影响。即社会融资规模、农村最低生活保障资金占比和GDP累计同比增速并不是影响广东省城乡收入差距的主要原因。
- F检验
表 2三等分中的原始资料差异性F-test
变项 |
τ1-τ2 |
τ1-τ3 |
τ2-τ3 |
|||
F_value |
Sign. |
F_value |
Sign. |
F_value |
Sign. |
|
X1 |
4.2355 |
** |
4.9404 |
** |
1.1664 |
|
X2 |
0.8807 |
1.4818 |
1.6826 |
|||
X3 |
4.0980 |
** |
0.4882 |
0.1191 |
*** |
|
X4 |
1.6354 |
0.0469 |
*** |
0.0286 |
*** |
|
X5 |
1.6436 |
0.3445 |
0.2096 |
** |
||
X6 |
1.6659 |
0.0036 |
*** |
0.0022 |
*** |
注 2:“-”表示在0.1的显著性水平下不显著;“*”表示在0.1的显著性水平下显著:“**”表示在0.5的显著性水平下显著;“***”表示在0.01的显著性水平下显著。
从表2中可发现,X1和X3第一等分和第二等分相比差异显著;X1和X4在第一与第三等分中存在显著差异性;X3、X4、X5和X6在第二等分和第三等分的对比中,差异性均显著。
表 3三等分中线性回归系数差异性的 F-test
变项 |
τ1-τ2 |
τ1-τ3 |
τ2-τ3 |
|||
F_value |
Sign. |
F_value |
Sign. |
F_value |
Sign. |
|
X1 |
0.1450 |
0.0053 |
** |
0.0362 |
* |
|
X2 |
2.4332 |
0.1728 |
0.0710 |
|||
X3 |
0.7570 |
0.0804 |
0.1063 |
|||
X4 |
0.4266 |
72.3973 |
** |
169.7104 |
** |
|
X5 |
3.8772 |
1.1328 |
0.2922 |
|||
X6 |
6.2683 |
23.4173 |
* |
3.7358 |
注 3:“-”表示在0.1的显著性水平下不显著;“*”表示在0.1的显著性水平下显著:“**”表示在0.5的显著性水平下显著;“***”表示在0.01的显著性水平下显著。
由表3可知,所有自变量的线性回归系数在第一等分和第二等分中均无显著性差异;X1的回归系数在第一等分和第三等分对比中、在第二等分和第三等分的对比中都有显著性的差异;X4在第一等分和第三等分的对比中以及在第二等分和第三等分的对比中均有显著性差异;X6则在第一和第三等分对比中差异显著。
- 结论和政策建议
本研究选取了6个变量,分别是财政支出规模(X1)、第一产业占比(X2)、融资规模(X3)、工业增加值(X4)、农村最低生活保障资金占比(X5)、GDP累计同比增速(X6),研究者利用R对数据进行简单线性回归、等分回归、运用平移模型、使用F检验测试样本数据以及对平移模型回归系数的f检验,通过对数据图表的分析得出以下结论:(以广东省为例)
1.第一产业占比增大对城乡居民收入差距的缩小影响最大,融资规模扩大的影响力其次;
2.工业增加值的增加和农村最低生活保障资金占比的增大对城乡居民收入差距的缩小有影响,但影响不显著;
3.乡镇财政支出规模的增加和GDP累计同比增速的加快与城乡居民收入差距的缩小无关。
为此,研究者提出以下建议:
1.促进更多第一产业落于农村,随后也要推出相关政策促进第一产业在农村的发展,切不可目光短浅,只顾着第一产业的数量而不顾其未来发展的质量;
2.与银行商谈适度放宽农村企业或集体融资要求,推进农村经济发展;
3.合理制定农村居民的最低生活保障,实现农村最低生活保障制度的可持续发展[4]。
参考文献:
[1]吕露露.基于指数平滑和多元线性回归对京东收入预测[J].中国储运,2021(06):94-95.
[2]王琰,吕航,谷复光.多元线性回归方法在地面沉降量预测中的解析及应用[J].安全与环境工程,2021,28(03):156-161.
[3]Pan W T. A newer equal part linear regression model: A case study of the influence of educational input on Gross National Income[J]. Eurasia Journal of Mathematics, Science and Technology Education, 2017, 13(8): 5765-5773.
[4]王倩,毕红霞.我国农村最低生活保障标准研究[J]. 国家统计局统计科学研究所. 2016(1).
[5]林玉娜,许丹纯,廖悦梅,聂丽轩,许洁欣.大学生选修课堂参与度影响因素分析——基于等分线性回归方法.广东外语外贸大学.2018.
[6]广东省统计年鉴.2020.
基于等分线性回归方法的城乡收入差距因素比较分析——以广东省为例相关推荐
- 基于c#的相关性分析_基于数字高程模型的城市地貌与地名相关性分析——以兰州市为例...
江西地名研究 基于数字高程模型的城市地貌与地名 相关性分析--以兰州市为例 文/张鹏丽,李育 提要:以兰州市为例,使用 ASTER 30米分辨率的数字高程模型DEM并提取了兰州市周边所有地名信息:通过 ...
- 基于大数据方法的经济研究:前沿进展与研究综述 | 特别推荐
基于大数据方法的经济研究:前沿进展与研究综述 李华杰 史丹 马丽梅 摘要: 随着数据挖掘和分析技术的不断提高,基于大数据方法对经济的研究日益增多,大数据对经济研究和应用具有重要的现实意义.本文梳理了近 ...
- 基于多元线性回归的房价预测
基于多元线性回归的房价预测 摘要 市场房价的走向受到多种因素的影响,通过对影响市场房价的多种因素进行分析,有助于对未来房价的走势进行较为准确的评估. 多元线性回归适用于对受到多因素影响的数据进行分析的 ...
- 贝叶斯线性回归方法的解释和优点
本文对比了频率线性回归和贝叶斯线性回归两种方法,并对后者进行了详细的介绍,分析了贝叶斯线性回归的优点和直观特征. 我认为贝叶斯学派和频率学派之间的纷争是「可远观而不可亵玩」的学术争论之一.与其热衷于站 ...
- 隐含社交信任度和基于情感的方法的推荐系统
FROM 2015 ELSEVIER Expert System With Application 摘要 获取信任朋友在推特微博对商品的短评数据来搭建框架. 本系统计算推荐等级的三个主要工作: 1.测 ...
- 人工智能之基于多变量线性回归的房屋销售价格预测详细解决方案
人工智能之基于多变量线性回归的房屋销售价格预测详细解决方案 一.目的 学习多变量线性回归模型与梯度下降算法设计机器学习程序,理解并掌握特征归一化,多变量的梯度下降以及正规方程方法,对房屋销售价格进行预 ...
- 基于多元线性回归算法的5G基站能耗模型
[摘 要]5G基站能耗高,对运营商的网络运营成本带来较大的压力.优化了5G基站能耗测试方法和业务加载方法,获取了大量现网5G基站能耗和无线利用率关系的实测基础数据.基于多元线性回归算法,构建了不同场 ...
- 城乡收入不平等及其动态演化模型构建——中国城乡收入差距变化的理论机制
摘要:借鉴贝克尔的"家庭收入不平等及世代之间的变动性"理论,从要素投入的角度,将物质资本.人力资本和政府投入作为基本变量来分析我国城乡收入差距产生及其动态演变的理论机制.主要结论: ...
- 基于多元线性回归的股票分析与预测——R语言
基于多元线性回归的股票分析与预测 一.数据来源 1.自变量 2.因变量 二.多元线性回归 1. 初步建立多元线性回归模型 (1)数据集划分 (2)建立回归模型 2. 多元线性回归模型的优化 3.模型误 ...
- 南航数据分析与挖掘课设1(上)——基于多元线性回归模型,ARIMA序列的中国GDP增长影响因素研究及预测(R语言)
基于多元线性回归模型,ARIMA序列的中国GDP增长影响因素研究及预测 摘要 在国民经济发展的过程中,国内生产总值(GDP)是指按国家市场价格计算的一个国家(或地区)所有常驻单位在一定时期内生产活动的 ...
最新文章
- 带你学python基础:字符串
- ecs服务器数据迁移_如何非常方便地从Windows文件服务器把数据完整地迁移到ONTAP Select...
- Inno Setup 打包安裝判斷是否安裝.net freamework 3.5 和 access2007的數據連接
- 2013计算机一级考试综合试题答案,2013全国计算机等级考试试题题库及答案.doc
- media player的显示模式 winform
- 【Python成长之路】词云图制作
- 【spingboot基础知识】相关问题汇总
- echars x轴单位_pyecharts 之神奇的轴索引
- BAT 鼎立格局被打破,2019 年这些互联网公司是程序员跳槽首选!
- 蓝桥杯2016年第七届C++省赛B组第一题-煤球数目
- 如何将数据渲染到页面上?
- 项目启动时 xml报错:Could not find SQL statement to include with refid 'mbgl.panDuanZbsfkxg'
- 开源日志审计系统_详解mysql数据库审计特点、实现方案及审计插件部署演示
- 招募贴:Hadoop专业解决方案招募义务翻译人员
- Atitit json序列化工具 JsonParserAtiver 参考 Atitit json序列化原理 序列化是将一个对象变成json格式的字符串,而反序列化是将json格式的字符串变
- 14-微信小程序商城 产品详情页布局(微信小程序商城开发、小程序毕业设计、小程序源代码)(黄菊华-微信小程序开发教程)
- 关于计算机审计建议,商业银行计算机审计存在问题与建议
- 离开公司你什么都不是
- JavaSE:GUI编程入门到游戏实战
- mysql怎么改gm_MySQL修改密码的几种方式
热门文章
- Python爬取《你好,李焕英》电影影评并制作词云图
- 重装系统蓝屏,电脑开机蓝屏解决方法记录
- TL431-2.5v基准电压芯片几种基本用法
- 使用模板快速编写测试用例
- 手把手教你如何用VBA统计问卷调查表
- 零差检测,外差检测 以及 激光雷达中的零差探测和外差探测
- 【Microsoft Azure 的1024种玩法】六十三.通过全局 VNet 对等互连实现同一区域不同网段的虚拟网络实时打通
- 《计算机科学概论(第12版)》—第1章1.3节海量存储器
- win7下安装python库的若干问题
- sql2008服务器运行哪个,SQL SERVER 2008R2 暂用服务器内存直到服务器死机。