《深入浅出数据分析》第十章第十一章
文章目录
- R语言
- 一、散点图
- 二、补充
R语言
从上一章开始,就都涉及到R语言的内容了,在这记录一下,就当给自己做的笔记。
一、散点图
这次要绘制的是散点图,并且求出它的回归方程。
- 首先,还是加载csv文件。和上一个一样就不多写了。
- 之后就可以直接绘制散点图了。
这个图主要是比较职员期望的加薪幅度和实际的加薪幅度,并且依据数据建立回归模型,用来分析加薪幅度,以便获取大幅度的加薪。
plot(x, y)
最后图片长这样。
- 计算相关系数r
r用来量度变量的相关性。r的范围为-1~1,0表示无相关性,1和-1则表示这两个变量完全相关。
cor(x, y)
- 创建回归方程
每当R创建一个线性模型,R就会在记忆库里创建一个对象,这个对象有一长串属性,其中包括回归方程的系数。知道了系数就能写出回归方程咯。
myLm <- lm(x~y, data=你加载出来的数据)
myLm$coefficients
- 对该对象进行汇总
summary(myLm)
这里出现均方根误差(又称机会误差或σ),这是第十一章的内容。
在使用回归方程进行预测的时候,难免会出现误差,我们可以用均方根误差来定量表示残差分布,即表现出观察结果相对于回归线的平均偏移量。
也可以直接通过代码语句直接查看均方根误差的值。
summary(myLm)$sigma
- 分割数据
从上面的散点图可以看出来,左侧的数据误差很小,二右侧的数据误差较大。所以直接计算出来的回归方程的误差就会较大。因此为了减小误差,我们选择分割数据,将左侧和右侧的数据分割开,分别计算各自的回归曲线及均方根误差。
这里就直接展示拆分后对比了。
二、补充
- lm函数
lm函数用于拟合回归模型,是拟合回归模型里面最基本的函数。
格式如下:
lm(formula, data)
formula指要拟合的数据模型;
data指用于拟合的数据。
之后返回的对象中包含该拟合模型的信息。
- plot()
plot(x=x轴数据,y=y轴数据,main="标题",sub="子标题",type="线型",xlab="x轴名称",ylab="y轴名称",xlim = c(x轴范围,x轴范围),ylim = c(y轴范围,y轴范围))
《深入浅出数据分析》第十章第十一章相关推荐
- 《深入浅出数据分析》第十二章——R语言lattice数据包
文章目录 R语言 一.lattice数据包 二.jitter() R语言 这章比较重要的点就是lattice数据包. 然后就着重写一下这里. 一.lattice数据包 lattice包是一个非常强大的 ...
- 《javascript设计模式》笔记之第十章 和 第十一章:门面模式和适配器模式
第十章:门面模式 一:门面模式的作用 简化已有的api,使其更加容易使用 解决浏览器的兼容问题 二:门面模式的本质 门面模式的本质就是包装已有的api来简化操作 三:门面模式的两个简单例子 下面这 ...
- 《深入浅出数据分析》为读者送上了章回小说的精彩
2010年2月,春节将至,我向博文视点的某个邮箱寄出了一封请求参加翻译任何一本图书的邮件.很快,有人回信,内容简单明了:请下载并试译第1章1~17页内容.落款是博文视点编辑徐定翔.于是我试译,寄出,然 ...
- 《深入浅出数据分析》样章下载
序言 真难以相信,他们竟把这些东西写进讲数据分析的书里了. 本节回答一个热门问题:"作者为什么非要把这些东西写进一本讲数据分析的书里?" 谁适合阅读本书? 请先回答几个问题: 1. ...
- 《深入浅出数据分析》第九章——R语言
文章目录 记录第一次接触R语言 一.R语言下载安装 二.运行 三.补充 1.加载csv文件 2.hist函数 记录第一次接触R语言 <深入浅出数据分析>第九章讲到R语言,在这记录一下,就当 ...
- 【哈工大软件构造】学习笔记10 第十章、第十一章、第十二章
目录 第十章 面向可维护性的构造技术 1 软件维护和演化 2 可维护性的度量 3 模块化设计和模块性准则 模块划分的五个准则 模块设计的五个原则 耦合度和聚合度 4 OO设计准则:SOLID SRP ...
- stm32官方例程在哪找_正点原子Linux第十一章模仿STM32驱动开发格式实验
1)资料下载:点击资料即可下载 2)对正点原子Linux感兴趣的同学可以加群讨论:935446741 3)关注正点原子公众号,获取最新资料更新 第十一章模仿STM32驱动开发格式实验 在上一章使用C语 ...
- 鸟哥的Linux私房菜(服务器)- 第二十一章、文件服务器之三: FTP 服务器
第二十一章.文件服务器之三: FTP 服务器 最近更新日期:2011/08/08 FTP (File Transfer Protocol) 可说是最古老的协议之一了,主要是用来进行档案的传输,尤其是大 ...
- 数字图像处理:第十一章基于特征向量的变换
第十一章基于特征向量的变换 目录 1. 主分量分析(PCA).K-L变换(Hotelling变换) 2. 奇异值分解(SVD) 3. DCT与K-L变换的关系 1. 主分量分析(PC ...
最新文章
- 专设AI周会 高管悉数到场 微软CEO有多重视人工智能?
- 深入理解 RPC : 基于 Python 自建分布式高并发 RPC 服务
- 网站SEO优化可通过哪些数据分析来解决问题?
- python matplotlib模块——绘制三维图形、三维数据散点图
- Spring-学习笔记04【Spring的常用注解】
- livebos--iframe使用
- 使用Spring Cloud HystrixCommands的功能Hystrix
- linux suse11 nfs,suse11 nfsserver服务安装
- mysql etl工具有哪些_常见ETL工具一览,你知多少?
- c++结构体嵌套结构体_Go学习每日一问(13)-结构体嵌套
- 读书笔记—《销售铁军》随记8
- Luogu1783 海滩防御
- Lingo 11安装教程
- 邮件营销如何“爆增”潜在客户?
- 数据库网页搭建教程(一)——数据准备
- 非阻塞套接字及select模型 select(0,fread,NULL,NULL,timeOut);
- 《正念领导力》承诺14:创造共赢
- 企业市场推广之网络营销运营策略探讨
- 核心概念——节点/边/Combo——内置Combo——内置Combo总览
- Authentication failed for 解决办法
热门文章
- 生日快乐程序_祝肖战1005生日快乐-用R给他画个蛋糕爱心吧
- java html api 百度云,Javase-6.0_中文API_HTML(最新更新)
- linux系统 qt调试,Linux下Qt Creator远程调试(redhat5+mini6410)
- java上传音频到服务器_Java 客户端向服务端上传mp3文件数据的实例代码
- 《DSP using MATLAB》Problem 6.20
- python函数里面,一个*是可变参数的元祖,两个*是可变参数的字典
- 【TensorFlow】:解决TensorFlow的ImportError: DLL load failed: 动态链接库(DLL)初始化例程失败...
- 【图像缩放】双立方(三次)卷积插值
- Debian耳机声音问题
- 数据库原理----学习目标