R的基本统计模型与回归分析

这一节,也是这一分享合辑基础篇的最后一节,后续会有一些进阶篇,关于更进一步的模型,例如广义线性模型,分层线性模型,交互效应模型以及相关模型结果的可视化表达。这一节主要关注最基本的线性回归模型(Linear Regression Model)

线性模型的设定与假设

线性回归模型,其一,是一种回归模型;其二,变量间呈线性关系,基本数学方程如下
Y=β0+β1X1+β2X2+...+βnXn+εY = \beta_0 + \beta_1X_1 + \beta_2X_2 +... +\beta_nX_n + \varepsilonY=β0​+β1​X1​+β2​X2​+...+βn​Xn​+ε
在OLS估计中,LRM需要满足几个假设:
1、随机误差不相关,数学期望为0,方差相等
2、误差项服从正态分布,随机误差彼此独立
3、自变量之间没有线性相关

LRM的R实现

iris数据为例

> reg <- lm(Sepal.Length ~ Sepal.Width, data = iris)
> summary(reg)
Call:
lm(formula = Sepal.Length ~ Sepal.Width, data = iris)Residuals:Min      1Q  Median      3Q     Max
-1.5561 -0.6333 -0.1120  0.5579  2.2226 Coefficients:Estimate Std. Error t value Pr(>|t|)
(Intercept)   6.5262     0.4789   13.63   <2e-16 ***
Sepal.Width  -0.2234     0.1551   -1.44    0.152
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1Residual standard error: 0.8251 on 148 degrees of freedom
Multiple R-squared:  0.01382,   Adjusted R-squared:  0.007159
F-statistic: 2.074 on 1 and 148 DF,  p-value: 0.1519

我们使用lm()函数来构建OLS回归模型,因变量放在左侧,中间以~连接,自变量放在右侧,然后加上数据集,将这一方程赋值给某个对象,并使用summary()函数来展示这个模型中的各项参数。

回归结果会显示经典统计回归的p值以及相应的星星,还有模型的判定系数(调整R2R^2R2),F统计量,自由度等

模型预测

模型建立好以后,可以用来进行预测

pre <- predict(reg, interval = " ")

模型预测的interval参数有两种基本取值:“confidence"和"prediction”。前者是置信区间,后者是预测区间,预测区间的预测误差范围要比置信区间的大。

正如LRM的数学方程所示,它不仅仅是预测一个变量与一个变量之间的关系,也可以进行多元回归,对于回归结果,我们也可以进行相应的可视化操作,使结果不再是简单的数字堆砌。

此外,由于期刊发表的需要,我们要将结果输出成一般期刊所采用的格式,stargazer package可以帮助我们实现。这个package可以输出latex、html和text格式的表格,对表格的内容可以使用不同的参数进行控制。

> library(stargazer)
> stargazer(reg, type = "text")
===============================================Dependent variable:    ---------------------------Sepal.Length
-----------------------------------------------
Sepal.Width                   -0.223           (0.155)          Constant                     6.526***          (0.479)          -----------------------------------------------
Observations                    150
R2                             0.014
Adjusted R2                    0.007
Residual Std. Error      0.825 (df = 148)
F Statistic             2.074 (df = 1; 148)
===============================================
Note:               *p<0.1; **p<0.05; ***p<0.01

从零开始学R(十)——基本统计:线性回归模型(LRM)相关推荐

  1. 从零开始学R(四)——常用命令:帮助,文件导入与导出与基本操作

    R的常用命令 R的命令非常多,但是有一些命令是非常常用的,在这里我做一个汇总,便于大家使用.(Tips:关于下载和安装R的package以及工作目录的获得与设置命令在第二篇已经聊过,此时就不再赘述了, ...

  2. R语言构建多元线性回归模型

    R语言构建多元线性回归模型 对比一元线性回归,多元线性回归是用来确定2个或2个以上变量间关系的统计分析方法.多元线性回归的基本的分析方法与一元线性回归方法是类似的,我们首先需要对选取多元数据集并定义数 ...

  3. r语言中矩阵QR分解_从零开始学R语言Day4|向量、矩阵和数组

    从零开始学R语言Day4|向量.矩阵和数组 1.1向量 1.1.1向量 在Day2中我们提及过用和c()函数来构建向量,具体实例如下. 我们还可以采用vector("类型",长度) ...

  4. plor 回归的r方_简单线性回归模型

    点击"蓝字"关注我们吧 1 导言 回归分析是一个古老的话题.一百多年前,英国的统计学家高尔顿(F. Galton,1822-1911)和他的学生皮尔逊(K. Pearson,185 ...

  5. R语言构建多元线性回归模型预测汽车的耗油效率

    目录 确定研究目的以及确定因变量和自变量 数据预处理 缺失值处理 异常值处理 估计回归模型参数,建立模型 判断数据是否满足多重线性回归假设条件 (1).线性 (2).独立性 (3).正态性 (4).方 ...

  6. R语言实现多线性回归模型预测时间序列数据 MLR models in R

    <!-- #此文主要针对统计基础比较薄弱(比如博主)利用多个模型言针对时间序列数据做预测用之MLR/多线性回归模型: --> <!--定义:人话就是给定一组数据集data={(x1, ...

  7. r语言python0基础_万丈高楼平地起,从零开始学R语(生信分析向,R语言基础)...

    一.R语言的安装 我所做的R语言学习主要是为应对工作上的生信分析,如果你是往这个方向走,那么这篇文章很大可能会帮助你.如果你也是有python基础的话,那我写的可能会更対你口味. 不过现在看到这篇文章 ...

  8. 从零开始学R(三)——基本计算

    R的基本计算 作为一款统计软件,R最重要的功能就是进行统计计算,这一节就和小伙伴聊一聊R的基本计算语句. 数学运算 R运行代码时,会调用计算机运行内存完成计算任务,因此R也可以实现常用的数学四则运算以 ...

  9. R语言解读一元线性回归模型

    R的极客理想系列文章,涵盖了R的思想,使用,工具,创新等的一系列要点,以我个人的学习和体验去诠释R的强大. R语言作为统计学一门语言,一直在小众领域闪耀着光芒.直到大数据的爆发,R语言变成了一门炙手可 ...

最新文章

  1. Spring Boot 最最最常用的注解梳理
  2. 独家 | 带你认识HDFS和如何创建3个节点HDFS集群(附代码案例)
  3. OpenCV中的CV_IMPL是什么意思?
  4. UDP千兆以太网FPGA_verilog实现(五、以太网帧的结构)
  5. python函数加括号于不加括号的区别
  6. angular实现select的ng-options
  7. ElasticSearch 中的中文分词器该怎么玩?_03
  8. 【数据结构与算法】二叉查找树的Java实现
  9. atomic原子类实现机制_反射机制实现两个类的复制
  10. iOS开发--Runtime知识点整理
  11. 精简版NovoNotes 3DX for Mac - 顶尖3D音频制作插件
  12. [PHP] PHP源码中的条件编译定义
  13. U盘镜像刻录(制作U盘启动盘)
  14. 2019深圳杯获奖论文_我校研究生喜获2019年“深圳杯”数学建模挑战赛决赛三等奖...
  15. 演绎与归纳,双管齐下
  16. 【高等数学】常用函数的n阶导数
  17. 使用MATLAB App Design 工具设计一个 简易App
  18. 科研人必备图像处理软件—ImageJ
  19. JAVA经典算法大全
  20. 【BZOJ1645】[Usaco2007 Open]City Horizon 城市地平线 离散化+线段树

热门文章

  1. 分享:Corel Painter IX.5序列号产生办法
  2. 电脑设置护眼色的方法
  3. KMP(转载来自Matrix67原创)
  4. vue基础v-moder修饰符( number, trim, lazy )
  5. 视觉机器学习20讲-MATLAB源码示例(6)-贝叶斯学习算法
  6. groupby 的妙用(注意size和count)
  7. C语言入门练习— —累乘与累加混合计算
  8. Django开发基础 -李杰-专题视频课程
  9. /[^\d]/g 是什么意思
  10. 大道至简-灵活的软件工程