数据

表2 2003-2012某省运输业相关数据

年份

投资总额

(亿元)

从业人数

(万人)

能源投入

(万吨标准煤)

地区GDP

(亿元)

CO2排放量

(万吨)

2003年

320.1

166.37

487.82

6867.7

1216.14

2004年

373.87

180.37

509.12

8553.79

1269.24

2005年

468.35

187.29

649.93

10587.42

1620.28

2006年

568.4

188.9

673.04

12362.79

1677.89

2007年

426.06

198.65

772.28

15012.46

1925.29

2008年

389.43

204.46

802.43

18407.78

2000.46

2009年

484.44

207.7

875.72

19480.46

2183.17

2010年

661.88

213.14

1340.6

23092.36

3342.12

2011年

784.37

217.8

1288.68

26931.03

3212.68

2012年

896.8

222.77

1418.56

29599.31

3536.47

将以上excel表格进行简单处理,并保存为txt文本格式,存放在C盘的Data文件夹内。表2为2003-2012某省运输业相关数据,保存时命名为zongti.txt。代码中出现的invest,worker,energy,gdp,carbon等词语分别代表表格中的投资总额、从业人数、能源投入地区GDP、CO2排放量。

一元线性回归分析

相关分析只能得出两个变量之间是否相关,但是不能回答两个变量之间存在相关关系时是如何联系的,即无法找出刻画它们之间因果关系的函数关系,回归分析就可以解决这一问题。根据表2中投资总额和地区GDP这两项数据,分别设为变量X和Y。代码如下:

setwd("c:\\Data\\")

zongti

x

y

lm.r

summary(lm.r)

调用函数lm()可以非常方便求解回归方程,以下为运行的结果:

Call:

lm(formula = y ~ 1 +

x)

Residuals:

Min 1Q Median 3Q Max

-5833.7

-2645.0 358.8 1810.6 6595.9

Coefficients:

Estimate Std. Error t value

Pr(>|t|)

(Intercept)

-2080.606 4064.682 -0.512 0.62257

x 35.674 7.174 4.973 0.00109 **

---

Signif.

codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘

’ 1

Residual standard error: 4074

on 8 degrees of freedom

Multiple

R-squared: 0.7556, Adjusted R-squared: 0.725

F-statistic: 24.73 on 1 and 8

DF, p-value: 0.00109

从上面输出的结果中的p值可以看出回归方程通过回归参数的检验与回归方程的检验,由此得到的一元线性回归方程为:

Y= -2080.606+35.674X

多元回归分析

很多实际问题中,影响响应变量的因素不止一个,因此综合需要考虑与之相关的其他变量,此类回归分析为多元回归分析。也就是说多元回归分析是对随机变量Y与n个自变量X1、X2…Xn之间存在的线性相关关系。

根据表2中投资总额、从业人数和能源投入以及地区GDP这两项数据,分别设为变量X1、X2、X3和Y。代码如下:

setwd("c:\\Data\\")

zongti

y

x1

x2

x3

B

lm.r

lm.s

summary(lm.s)

同样调用lm()函数进行的回归分析,由于考虑的变量很多,用step()函数进行变量筛选,结果如下:

Start: AIC=148.59

y ~ x1 + x2 + x3

Df Sum of

Sq RSS AIC

- x1 1 718520

13475687 147.14

12757167 148.59

- x3 1 5873190 18630357

150.38

- x2 1 25535839 38293006 157.58

Step: AIC=147.14

y ~ x2 + x3

Df Sum of

Sq RSS AIC

13475687 147.14

- x3 1 18222037 31697724 153.69

- x2 1 24818088 38293775 155.58

> summary(lm.s)

Call:

lm(formula = y ~ x2 + x3)

Residuals:

Min 1Q Median 3Q Max

-2192.72 -757.01 60.92 1017.12 1538.74

Coefficients:

Estimate Std. Error t value

Pr(>|t|)

(Intercept) -39030.90 10382.08 -3.759 0.00708

**

x2 235.96 65.72 3.591 0.00885 **

x3 10.46 3.40 3.077 0.01790 *

---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’

0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 1387 on 7 degrees of

freedom

Multiple R-squared:

0.9752, Adjusted R-squared: 0.9681

F-statistic: 137.6 on 2 and 7 DF, p-value:

2.406e-06

若选择全部的变量构造回归方程,效果不一定好。R语言提供了获得最优回归方程的方法,逐步回归法的计算函数step(),它以Akaike信息统计量为准则(AIC)通过选择最小的AIC信息统计量,来达到删除或者增加变量的目的。也就是说它是以AIC作为评价指标来判断一个变量是否应该加入模型。

从上面运行的结果来看,如果去掉变量X1,AIC的值为147.14;如果如果去掉变量X2,AIC的值为157.58;如果去掉变量X3,AIC的值为150.38;如果选用所有的变量构造方程,AIC的值为148.59。所以可以考虑去掉变量X1。

去掉变量X1后,由于用于回归方程检验的F统计量的p值和用于回归系数检验的t统计量的p值都小于0.05,因此回归方程与回归系数的检验都是显著的,最优的多元回归方程为:

Y= -39030.90+235.96X2+

10.46X3

rstudio线性回归_R语言统计分析(一元线性回归和多元线性回归)相关推荐

  1. R语言使用lm函数拟合多元线性回归模型、假定预测变量没有交互作用(Multiple linear regression)

    R语言使用lm函数拟合多元线性回归模型.假定预测变量没有交互作用(Multiple linear regression) 目录

  2. R语言使用lm函数拟合多元线性回归模型、假定预测变量之间有交互作用、R语言使用effects包的effect函数查看交互作用对于回归模型预测响应变量的影响

    R语言使用lm函数拟合多元线性回归模型.假定预测变量之间有交互作用.R语言使用effects包的effect函数查看交互作用对于回归模型预测响应变量的影响 目录

  3. 预测分析:R语言实现2.3 多元线性回归

    2.3 多元线性回归 只要有多于一个输入特征,并且要构建一个线性回归模型,我们就处于多元线性回归的领域了.具有k个输入特征的多元线性回归模型的一般方程如下所示: y=kxk+k-1xk-1+-+1x1 ...

  4. python多元线性回归代码_Python实现梯度下降算法求多元线性回归(一)

    预备知识及相关文档博客 学习吴恩达机器学习课程笔记,并用python实现算法 python numpy基本教程: numpy相关教程 数据来自于UCI的机器学习数据库: UCI的机器学习数据库 pyt ...

  5. c++多元线性回归_五种优化算法实现多元线性回归

    实现多元线性回归的要求及假设条件: '''线性回归的假设条件:1.样本独立,即每个预测样本之间没有依赖关系:2.残差e要服从正态分布,即y_true-y_pred的残差需要服从高斯分布:3.特征之间独 ...

  6. 简单线性回归(Simple Linear Regression)和多元线性回归(Multiple Regression)学习笔记

    简单线性回归(Simple Linear Regression) 0.前提介绍: 为什么需要统计量? 统计量:描述数据特征 0.1集中趋势衡量 0.1.1均值(平均数,平均值) (mean):(求和除 ...

  7. 多元线性回归dw值_SPSS教程10:多元线性回归

    1多元线性回归简介 简单线性回归是一个自变量对一个因变量的预测,而多元线性回归是多个自变量对一个因变量的联合预测能力.比如说检验乐观.自我效能感对学习投入的预测能力,那不论是乐观还是自我效能感的单个预 ...

  8. rstudio线性回归_R语言线性回归

    回归分析是一个广泛使用的统计工具,用于建立两个变量之间的关系模型. 这些变量之一称为预测变量,其值通过实验收集. 另一个变量称为响应变量,其值来自预测变量. 在线性回归中,这两个变量通过一个等式相关联 ...

  9. R语言JAVA对比_R语言统计分析应用与SAS、SPSS的比较

    能够用来做统计分析的软件和程序很多,目前应用比较广泛的包括:SPSS, SAS.R语言,Matlab,S-PLUS,S-Miner等.下面我们来看一下各应用的特点: SPSS: 最简单的,都是菜单操作 ...

最新文章

  1. Jenkins 无法捕获构建脚本错误问题
  2. matlab软件moran值,用matlab求moran并作图的具体步骤
  3. PMP 第七章 项目成本管理
  4. 基于TCP/IP的文件服务器编程一例
  5. 图像处理 --- 二、数字图像处理基础
  6. python+unittest框架整理(一点点学习前辈们的封装思路,一点点成长。。。)
  7. 转行做产品经理需要学什么?
  8. 汇编语言:实验10 根据材料编程—3.数值显示,编程,将data段中的数据以十进制形式显示出来
  9. 2018-11-17 js的this引起的血案
  10. 2019 ICPC中国邀请赛(南昌)暨国际丝绸之路程序设计竞赛-网络赛题解
  11. Spring WebFlux – SpringReact式编程
  12. linux删除文件密码不奏效,Linux运维知识之linux_无秘登录问题(不生效)
  13. tomcat修改端口号
  14. oracle定时任务定时无效
  15. 如何解决局域网共享报错0x80004005
  16. 解决IDEA 打开Springboot项目提示 Unmapped Spring configuration files found.
  17. 深度 | 蚂蚁金融科技全面开放战略背后的“硬实力”
  18. 如何将自己开发的网站部署到小鸟云服务器上?
  19. python中char是什么意思_MySQL中char和varchar的区别是什么
  20. .net/C# 实现汉字到拼音转换

热门文章

  1. mAPI(商户用API) v1.1发布
  2. OPC通讯开发——客户端开发工具WTopcclient说明手册部分翻译及个人补充
  3. C++用winhttp实现https访问服务器
  4. pip安装pymssql出现ERROR: Cannot unpack file……报错解决
  5. OneNMP路由器、交换机监控
  6. 工人级无人机,现在和未来可能都不会有垄断者出现
  7. AnyConnect 安卓系统的使用教程
  8. AJAX都有哪些优点和缺点
  9. Unsupported major.minor version 51.0 (unable to load class
  10. arduino 土壤温湿度传感器_【教程】教你玩转Stduino之土壤湿度传感器模块