原文链接:http://tecdat.cn/?p=14850

原文出处:拓端数据部落公众号

回归分析是一种十分常见的数据分析方法,通过观测数据确定变量间的相互关系.传统回归分析以点数据为研究对象,预测结果也是点数据,而真实数据往往在一定范围内变动的.基于置信度可以形成置信区间,一定程度弥补了预测值为单点的不足,但将点数据作为研究对象,以点带表某范围内的所有数据,往往存在信息丢失的问题.

区间回归分析是一种以区间数为研究对象的数据分析方法.区间数能反映出数据的变动范围,更符合现实情况.区间型符号数据是区间数的一种,通过"数据打包"形成,因此除具有区间端点信息外,还具有区间内部散点信息.

本文将做一个简短的解释说明如何使用R在有区间的情况下提取上下限值。让我们从生成数据开始,


X=rnorm(n)
Y=2+X+rnorm(n,sd = .3)

假设现在我们不再观察变量x,而只是观察一个类(我们将创建八个类,每个类有八分之一的观察值)


Q=quantile(x = X,(0:8)/8)
Q[1]=Q[1]-.00001
Xcut=cut(X,breaks = Q)

例如,对于第一个值,我们有


as.character(Xcut[1])
[1] "(-0.626,-0.348]"

要提取有关这些边界的信息,我们可以使用下面的小代码,该代码返回区间的下限,上限和中值

lower = c(lower1,lower2)
lower=lower[!is.na(lower)]
upper = c(upper1,upper2)
upper=upper[!is.na(upper)]
mid = (lower+upper)/2
return(c(lower=lower,mid=mid,upper=upper)

extrai(Xcut[1])
lower mid upper
-0.626 -0.487 -0.348

可以看到,我们可以在数据库中创建三个变量(具有下限,上限和中值信息)


B$lower=B2[1,]
B$mid =B2[2,]
B$upper=B2[3,]

我们可以比较4个回归(i)我们对8个类别进行回归,即我们的8个因子(ii)我们对区间的下限进行回归,(iii)对区间的“平均值”值进行回归(iv)对上限


regF=lm(Y~X,data=B)
regL=lm(Y~lower,data=B)
regM=lm(Y~mid,data=B)
regU=lm(Y~upper,data=B)

我们可以将预测与我们的四个模型进行比较

更进一步,我们还可以比较模型的AIC,


AIC(regF)
[1] 204.5653
AIC(regM)
[1] 201.1201
AIC(regL)
[1] 266.5246
AIC(regU)
[1] 255.0687

如果下限和上限值的使用不是确定性的,则在此处应注意,使用区间的平均值会比使用8个因子略好。


参考文献

1.用SPSS估计HLM层次线性模型模型

2.R语言线性判别分析(LDA),二次判别分析(QDA)和正则判别分析(RDA)

3.基于R语言的lmer混合线性回归模型

4.R语言Gibbs抽样的贝叶斯简单线性回归仿真分析

5.在r语言中使用GAM(广义相加模型)进行电力负荷时间序列分析

6.使用SAS,Stata,HLM,R,SPSS和Mplus的分层线性模型HLM

7.R语言中的岭回归、套索回归、主成分回归:线性模型选择和正则化

8.R语言用线性回归模型预测空气质量臭氧数据

9.R语言分层线性模型案例

拓端tecdat|R语言区间数据回归分析相关推荐

  1. 拓端tecdat|R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险

    最近我们被客户要求撰写关于冠心病风险的研究报告,包括一些图形和统计输出. 相关视频:R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险 逻辑回归Logistic模型原理和R语言分类预测冠 ...

  2. 拓端tecdat|R语言用LOESS(局部加权回归)季节趋势分解(STL)进行时间序列异常检测

    最近我们被客户要求撰写关于LOESS(局部加权回归)的研究报告,包括一些图形和统计输出. 这篇文章描述了一种对涉及季节性和趋势成分的时间序列的中点进行建模的方法.我们将对一种叫做STL的算法进行研究, ...

  3. 拓端tecdat|R语言向量误差修正模型 (VECMs)分析长期利率和通胀率影响关系

    最近我们被客户要求撰写关于向量误差修正模型的研究报告,包括一些图形和统计输出. 向量自回归模型估计的先决条件之一是被分析的时间序列是平稳的.但是,经济理论认为,经济变量之间在水平上存在着均衡关系,可以 ...

  4. 拓端tecdat|R语言线性回归和时间序列分析北京房价影响因素可视化案例

    最近我们被客户要求撰写关于北京房价影响因素的研究报告,包括一些图形和统计输出. 目的 房价有关的数据可能反映了中国近年来的变化: 人们得到更多的资源(薪水),期望有更好的房子 人口众多 独生子女政策: ...

  5. r ridge回归_R语言区间数据回归分析

    原文链接:http://tecdat.cn/?p=14874 通常,GLM的连接函数可能比分布更重要.为了说明,考虑以下数据集,其中包含5个观察值 x = c(1,2,3,4,5)y = c(1,2, ...

  6. 拓端tecdat|bilibili视频流量数据潜望镜

    最近我们被客户要求撰写关于bilibili视频流量的研究报告,包括一些图形和统计输出. 最新研究表明,中国有超过7亿人在观看在线视频内容.Bilibili,被称为哔哩哔哩或简称为B站,是中国大陆第二个 ...

  7. 用R语言把数据玩出花样

    用R语言把数据玩出花样 数据处理 R 去重 数据可视化 阅读759  R语言作为统计学一门语言,一直在小众领域闪耀着光芒.直到大数据的爆发,R语言变成了一门炙手可热的数据分析的利器.随着越来越多的工程 ...

  8. 拓端tecdat荣获掘金社区入驻新人奖

    2021年7月,由掘金发起了"入驻成长礼"颁奖活动.本次活动邀请到知名开发者.服务机构代表等业界人士. 据了解,掘金社区"新入驻创作者礼"主要对已经积累了一定历 ...

  9. R语言进行数据聚合统计(Aggregating transforms)计算滑动窗口统计值(Window Statistics):使用R原生方法、data.table、dplyr等方案、计算滑动分组统计

    R语言进行数据聚合统计(Aggregating transforms)计算滑动窗口统计值(Window Statistics):使用R原生方法.data.table.dplyr等方案.计算滑动分组统计 ...

  10. R语言进行数据聚合统计(Aggregating transforms)实战:使用R原生方法、data.table、dplyr等方案、计算分组均值并添加到可视化结果中

    R语言进行数据聚合统计(Aggregating transforms)实战:使用R原生方法.data.table.dplyr等方案.计算分组均值并添加到可视化结果中 目录

最新文章

  1. NLP:词向量与ELMo模型笔记
  2. SpringBatch 写文件JSON(JsonFileItemWriter)用法(十二)
  3. 【网站】Bing每日壁纸API分享
  4. 【Kafka】KafkaConnection to 1002 was disconnected before the response was read
  5. SpringMVC框架----RequestMapping注解
  6. HIVESQL中ROW_NUMBER() OVER语法以及示例
  7. Deep Learning Notes: Chapter 1 Introduction
  8. matlab 暴雨强度公式,利用MATLAB推导城市暴雨强度公式
  9. catia如何测量毛料尺寸_CATIA建模规定
  10. Mac/Linux/Windos下仿站工具,基于Python的仿站工具,earnp/imitation仿站工具发布
  11. python爬取妹子图(复制即可用)
  12. 阳光点歌系统服务器说明书,天行阳光机顶盒点歌系统安装及配置说明
  13. Android应用内存管理机制
  14. itest考试切屏能检测出来吗_itest测试
  15. win10查看电池损耗
  16. 长 三 角 制 造 - 香 港 服 务
  17. 巧妙利用DZ自有功能实现豆丁网在线文档功能
  18. Alex网络结构解析
  19. 石墨笔记,为知笔记, Effie ,哪个更适合写稿爱好者?
  20. 扬帆优配|2600亿汽车巨头闪崩近9%,汽车股惊现“冰火两重天”!

热门文章

  1. 旧项目如何切换到Entity Framework Code First
  2. 如何安装和_彻底卸载MySQL
  3. 4月19 ubuntu防火墙
  4. Stanford CoreNLP - 自然语言软件
  5. 关于梯度下降法、牛顿法、高斯-牛顿、LM方法的总结
  6. 凸优化第四章凸优化问题 4.5 几何规划
  7. eclipse实用编辑快捷键
  8. iOS Crash文件的解析
  9. DELPHI 文件压缩加密
  10. SQL Server 通过发布订阅 实现数据库同步