线性回归:R语言实战 简单线性回归

如果直线形式的线性回归不够准确,可以多加一个二次项,构成多项式回归,变成一条曲线来提高拟合的精度。

多项式回归:R语言实战笔记 多项式回归

如果预测变量不止一个,就变成了多元线性回归。

其实线性回归主要还是作为一个验证手段,下面举个多元线性回归的例子。

> library(car)
> states<-as.data.frame(state.x77[,c("Murder","Population","Illiteracy","Income","Frost")])
> scatterplotMatrix(states,spread=FALSE,lty.smooth=2,main="Scatter Plot Matrix")

由上面的散点图矩阵,我们可以得出很多结论,比如谋杀率随着人口和文盲率的增加而增加,随着收入水平和结霜天数增加而下降。

> fit<-lm(Murder~Population+Illiteracy+Income+Frost,data=states)
> summary(fit)

可见我们之前的观察没有错,文盲率上升1%,谋杀率将上升4.14%,它的系数在p<0.001的水平下显著不为0。

总的来看,所有预测变量解释了各州谋杀率57%的方差。

上面分析没有考虑预测变量的交互项,

交互项说明响应变量与其中一个预测变量的关系依赖于另一个预测变量的水平。

> fit<-lm(Murder~Population+Illiteracy+Income+Frost,data=states)
> summary(fit)

正在上传…重新上传取消

可见,马力与车重的交互项是显著的,这意味着每加仑汽油行驶英里数与汽车马力的关系依车重不同而不同。

没有effects包的先下载一个

> install.packages("effects")> library(effects)
> plot(effect("hp:wt",fit,xlevel=list(wt=c(2.2,3.2,4.2))),multiline=TRUE)

正在上传…重新上传取消

显然,随着重量(wt)增加,马力(hp)与每加仑汽油行驶的英里数(mpg)的关系减弱。

当总量(wt)达到4.2,mpg甚至都不随着hp的变化而变化。

拟合了回归模型,相当于提出了一个假设,下一节就是对我们的统计假设进行检验。

R语言 OLS回归中的几种回归方法相关推荐

  1. R语言White’s检验实战:检验回归模型中是否存在异方差性(heteroscedasticity)、发生了异常差(heteroscedasticity)问题如何解决

    R语言White's检验实战:检验回归模型中是否存在异方差性(heteroscedasticity).发生了异常差(heteroscedasticity)问题如何解决 目录

  2. 数据分享|R语言用主成分PCA、 逻辑回归、决策树、随机森林分析心脏病数据并高维可视化...

    全文链接:http://tecdat.cn/?p=22262 在讨论分类时,我们经常分析二维数据(一个自变量,一个因变量)(点击文末"阅读原文"获取完整代码数据). 但在实际生活中 ...

  3. r语言在java中的实现_R语言在现实中的应用

    R语言在现实中的应用有哪些?主要有以下几种 - 1.数据科学 "哈佛商业评论"将数据科学家命名为"21世纪最性感的工作". Glassdoor将其命名为2016 ...

  4. R语言数据可视化中颜色设置

    R语言数据可视化中颜色设置 最近在学统计学,使用的是R语言,为了更好的掌握这门语言,就把学到的零碎知识记录下来. 下面全是R语言的颜色的内容: 一.颜色的种类: 一共有颜色种类657种 colors( ...

  5. 【生信】R语言在RNA-seq中的应用

    R语言在RNA-seq中的应用 文章目录 R语言在RNA-seq中的应用 生成工作流环境 读取和处理数据 由targets文件提供实验定义 对实验数据进行质量过滤和修剪 生成FASTQ质量报告 比对 ...

  6. R语言在散点图中添加lm线性回归公式

    R语言在散点图中添加lm线性回归公式 1. 简单的线性回归 2. 使用ggplot2展示 3. 提取线性回归p值 1. 简单的线性回归 函数自带的例子(R 中键入?lm),lm(y ~ x)回归y=k ...

  7. R语言可视化图像中最常用的点样式(pch、plot characters)列表、ggpubr::show_point_shapes可视化最常用的点样式(pch)

    R语言可视化图像中最常用的点样式(pch.plot characters)列表.ggpubr::show_point_shapes可视化最常用的点样式(pch) 目录

  8. R语言e1071包中的支持向量机:构建nu-classification类型的支持向量机SVM并分析不同nu值惩罚下模型分类螺旋线型(sprials)线性不可分数据集的表现

    R语言e1071包中的支持向量机:构建nu-classification类型的支持向量机SVM并分析不同nu值惩罚下模型分类螺旋线型(sprials)线性不可分数据集的表现 目录

  9. R语言e1071包中的支持向量机:仿真数据(螺旋线性不可分数据集)、简单线性核的支持向量机SVM(模型在测试集上的表现、可视化模型预测的结果、添加超平面区域与原始数据标签进行对比分析)、如何改进核函数

    R语言e1071包中的支持向量机:仿真数据(螺旋线性不可分数据集).简单线性核的支持向量机SVM(模型在测试集上的表现.可视化模型预测的结果.添加超平面区域与原始数据标签进行对比分析).如何改进核函数 ...

最新文章

  1. 坑系列 —— 缓存+哈希=高并发?
  2. 【2019.7.16 NOIP模拟赛 T1】洗牌(shuffle)(找环)
  3. 9.11排序与查找(三)——给定一个排序后的数组,包括n个整数,但这个数组已被旋转过多次,找出数组中的某个元素...
  4. mac 安装nvm和nvm常见的命令
  5. oracle故障一例,工作中遇到的oracle故障分析和处理一例
  6. 【hash】Seek the Name, Seek the Fame
  7. ~~试除法判定质数 (附模板题)
  8. Java应用服务器对比:TomcatJettyGlassFishWildFly
  9. NOR Flash、NAND Flash、SPI Flash、CFI Flash
  10. 桌面计算机最小化,电脑不显示最小化窗口怎么办win7
  11. MongoDB从入门到高级的实战操作
  12. 一WAN多拨(一号多拨)实验
  13. 【python】详解multiprocessing多进程-Pool进程池模块(二)
  14. 很有意思的几个考验知识广度的问题
  15. 基于web的员工信息管理系统
  16. 1第一个Chisel模块
  17. openstack九大模块
  18. 菜狗杯Misc抽象画wp
  19. Unicode简介和使用
  20. 找不到web的服务器ip地址,请进来看看,web服务器不能绑定ip地址的问题。谢谢!...

热门文章

  1. C++ 类模板(template)详解
  2. UML交互图(顺序图和交互图)
  3. MATLAB里面size什么意思,简述Matlab中size()函数的用法
  4. 【大前端】使用html/css/javascript开发移动端(安卓,IOS)与桌面端(Win,mac,Linux)应用程序
  5. imtool和imshow的区别
  6. Java异常机制的最佳实践
  7. 中国联通山东济南国家数据中心IDC机房介绍
  8. 小程序wx.chooseImage和wx.chooseVideo 上传多张图片和视频
  9. vuepress博客搭建(一)导航栏与侧边栏
  10. 免疫检查点 PD-1 与中枢神经系统(CNS)的生理学关系 | MedChemExpress