原标题:基于R语言进行Box-Cox变换

作者简介

作者:吴健中国科学院大学 R语言、统计学爱好者,尤其擅长R语言和Arcgis在生态领域的应用分享

个人公众号:统计与编程语言

Q:

为什么要进行Box-Cox转换?

A:

Box-Cox是一种广义幂变换,统计建模中常用的变换,用于连续响应变量不满足正态时的情况。Box-Cox的一个显著的有点是通过求变参数λ来确定变换形式,而这个过程完全基于数据本身而无需任何先导信息,这比凭经验的对数,平方根变换更客观。

Box-Cox变换公式如下:

y必须取正值,y值为负,首先y+a,对不同的λ所做的变换不同。λ=0对数变换;λ=-1倒数变换;λ=0.5平方根变换。

下面本文将介绍基于R语言进行Box-Cox转换。

STEP1:加载程序包并读取数据

library(readxl)#此包可以读取电子表格数据

library(moments)#此包可进行偏度锋度计算

library(MASS)#基于此包进行box-cox转换

data

STEP2:构建线性模型并检查残差是否满足正态分布

r1

hist(r1$residuals)#绘制残差频率分布图

skewness(r1$residuals)#计算偏度 结果1.89

通过残差频率分布图和偏度值可以发现残差并不满足正态分布。

STEP3:进行Box-Cox转换,确定λ值

b

b

lambda

lik

bc

bc[order(-lik),]#结果λ=-0.3时lik值最大,因此λ取值-0.3

STEP4:依据步骤3确定的λ值进行转换,并检查残差的正态性

r2

hist(r2$residuals)

skewness(r2$residuals)#结果-0.89

通过上述转换,可以看出残差分布已经近似正态了。

文中数据

链接:

https://pan.baidu.com/s/123pM4Z3rXeGKI1DSOtgTPQ

提取码:fj8h

复制这段内容后打开百度网盘手机App,操作更方便哦返回搜狐,查看更多

责任编辑:

r语言boxcox异方差_基于R语言进行Box-Cox变换相关推荐

  1. r语言boxcox异方差_如何检测异方差并纠正它?

    线性回归一个重要的假设就是残差没有异方差性.简单来说就是残差的方差不会随着响应变量的拟合值而增加.在本篇文章,我会解释为什么检测异方差性是重要的?如何检测模型的异方差性?如果存在,如何通过R代码来纠正 ...

  2. r语言boxcox异方差_R语言异方差回归模型建模:用误差方差解释异方差

    在社会科学中将OLS估计应用于回归模型时,其中的一个假设是同方差,我更喜欢常误差方差.这意味着误差方差没有系统的模式,这意味着该模型在所有预测级别上都同样差. 异方差性是同方差性的补充,不会使OLS产 ...

  3. r语言boxcox异方差_R语言讲义(包括各种回归).pptx

    R 语言讲义;免费(没有权力和铜臭)资源公开, 可改变代码(不是黑盒子,也不是吝啬鬼, 透明是防止"腐败"的最好方式) 容易学习.可编程以实行复杂的课题可扩展: 通过数千个网上提供 ...

  4. r 多元有序logistic回归_基于R的有序分类资料logistic回归分析

    cosoft@163.com 基于 R 的有序分类资料 logistic 回归分析 韦杰,曾萍 (贵阳中医学院 基础医学院,贵州贵阳,550002) 摘 要: 本文描述有序分类资料的 logistic ...

  5. c语言编写订货系统,学位论文_基于c语言的仓库订货系统的仿真.doc

    学位论文_基于c语言的仓库订货系统的仿真 本科毕业论文(设计.创作) 题目: 基于C语言的仓库订货系统的仿真 学生姓名: 学号: 所在系院: 信息与通信技术系 专业: 电子信息工程 入学时间: 201 ...

  6. TIA博途_基于SCL语言制作模拟量输入输出全局库的具体方法

    TIA博途_基于SCL语言制作模拟量输入输出全局库的具体方法 一. 模拟量输入块:创建FB,定义块的接口,如下图所示: 程序中包含了高报警,低报警,一般上位机报警需要这个变量. 极性选择,适合更广的应 ...

  7. arima 数据预处理_基于R语言的ARIMA模型

    A IMA模型是一种著名的时间序列预测方法,主要是指将非平稳时间序列转化为平稳时间序列,然后将因变量仅对它的滞后值以及随机误差项的现值和滞后值进行回归所建立的模型.ARIMA模型根据原序列是否平稳以及 ...

  8. bartlett方差齐性检验_基于R实现统计中的检验方法方差分析

    作者:徐涛,19年应届毕业生,专注于珊瑚礁研究,喜欢用R各种清洗数据. 知乎: https://www.zhihu.com/people/parkson-19/posts 前言 方差分析(均数的显著性 ...

  9. canoco5主成分分析步骤_基于R语言的主成分分析

    基于R语言的主成分分析 加入的SPSS群里有人问,怎么用SPSS进行主成分分析.确实没有注意到这种操作.很好奇,于是翻了翻孙振球的<医学统计学>,发现主成分分析这一块,竟使用了SAS!后来 ...

最新文章

  1. chrome 禁用https限制http_HTTP协议走过29年漏洞百出:Firefox可直接禁用
  2. svn Web管理svnadmin
  3. 理解Android系统的进程间通信原理(二)----RPC机制
  4. Faster_RCNN 4.训练模型
  5. Windows Server 2016与旧版本系统比较
  6. c++ new, operator new, placement new
  7. python中如何统计元组中元素的个数_Python:count直到列表中的元素是一个元组
  8. (原创)c#学习笔记10--定义类成员01--成员定义03--定义属性
  9. 一个牛人给java初学者的建议
  10. android百度在线音乐api,百度音乐免费API接口
  11. Content not from webpack is served from ‘/Users/xxxx/xxxx/xxxx/xxxx/public‘ directory
  12. 未明学院:都知道智商、情商、逆商,可你知道“搜商”吗?
  13. c 获取本地计算机ip,C++如何获取本机的IP地址
  14. Jquery判断动态表格中行数据是否重复
  15. 如何使用Node.js来制作电子音乐-和弦
  16. Caché 变量大全
  17. linux 命令例子
  18. 03.JavaScript-数据类型和数据类型转换
  19. 多模型的ROC曲线绘制
  20. PyQt5蟒蛇计算器V2

热门文章

  1. 产品读书《用户体验要素》
  2. 智能汽车操作系统哪家强?黑莓QNX领跑,中兴/华为撑起中国方案
  3. opencv人体识别技术汇总
  4. 整理一些ps4的DNS
  5. vlookup匹配值不唯一_十大Vlookup常见错误!
  6. 南华大学计算机科学学院,万亚平
  7. 大学生python期末解答题_大学mooc2020年用Python玩转数据期末考试大全答案
  8. 实录 | 计算未来轻沙龙:人工智能前沿与应用研讨会(PPT下载)
  9. Django中的跨域解决办法 基于后端的跨域解决方案
  10. Centos7 安装 ftp服务器 --失败了 妈蛋的