原文链接:http://tecdat.cn/?p=18550

原文出处:拓端数据部落公众号

我根据泊松Poisson回归、GAM样条曲线模型对一个十字路口的骑自行车者的数量进行预测,

str(base)
'data.frame': 214 obs. $ 日期    : chr  "1-Apr" "2-Apr" "3-Apr7" "4-Apr" ...$ 最高温度  : num  46 62.1 63 51.1 63 48.9 48 55.9 66 73.9 ...$ 最低温度   : num  37 41 50 46 46 41 43 39.9 45 55 ...$ 降雨量  : num  0 0 0.03 1.18 0 0.73 0.01 0 0 0 ...$ 数量: int  606 2021 2470 723 2807 461 1222 1674 2375 3324 ...$ 温差  : num  9 21.1 13 5.1 17 7.9 5 16 21 18.9 ......

使用Poisson回归预测周日、周一有多少骑自行车的人,天气情况是温度85F-70F没有下雨。我们创建一个预测数据框。

newbase = data.frame(DAY=as.factor(最高温度=c(85,85),最低温度=c(70,70,降雨量=c(0,0))

让我们创建一个包含所有解释变量的模型。

我们还添加一个虚拟变量来指示不下雨的日子,

summary(reg) Coefficients:Estimate Std. Error z value Pr(|z|)
(Intercept)         6.8844970  0.0110463 623.241   2e-16 ***
最高温度              0.0210950  0.0003133  67.328   2e-16 ***
最低温度              -0.0114006  0.0003351 -34.024   2e-16 ***
降雨量            -0.6570450  0.0071899 -91.384   2e-16 ***
I(降雨量 == 0)TRUE  0.1303908  0.0033283  39.176   2e-16 ***---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1(Dispersion parameter for poisson family taken to be 1)Null deviance: 70021  on 213  degrees of freedom
Residual deviance: 26493  on 203  degrees of freedom
AIC: 28580Number of Fisher Scoring iterations: 4

所以变量似乎都显著。如果我们要检查非线性效应,可以将样条曲线放在所有连续变量上

gam(数量~bs(最高温度)+bs(最低温度)+bs(降雨量)+I(降雨量==0),poisson

最高温度或最低温度

以及下面的降雨量曲线,最大观测值(3)与之前观测值(1.8)之间的线性平滑

我们还可以回归最小温度,以及最大和最小温度之间的温差(在线性模型中,模型是等效的,但是通过非线性变换,可以更简单地给出差异)

现在,我们可以比较这四个模型及其预测。例如,对于线性模型(虚拟变量表示没有下雨),

 predict(reg,newdata=newbase,type="response se.fit=TRUE

对于星期一,我们获得λ的95%置信区间

P$fit[1]+c(-2,2)*P$se.fit[1]
[1] 3349.842 3401.395

对于星期日,95%置信区间为

[1] 2987.497 3033.861

我们可以可视化四个模型的置信区间

而周日,我们有

换句话说,通过更改模型,我们对预测的置信区间进行了更改(有时区间完全不相交)。


最受欢迎的见解

1.R语言多元Logistic逻辑回归 应用案例

2.面板平滑转移回归(PSTR)分析案例实现

3.matlab中的偏最小二乘回归(PLSR)和主成分回归(PCR)

4.R语言泊松Poisson回归模型分析案例

5.R语言回归中的Hosmer-Lemeshow拟合优度检验

6.r语言中对LASSO回归,Ridge岭回归和Elastic Net模型实现

7.在R语言中实现Logistic逻辑回归

8.python用线性回归预测股票价格

9.R语言如何在生存分析与Cox回归中计算IDI,NRI指标

拓端tecdat|R语言用泊松Poisson回归、GAM样条曲线模型预测骑自行车者的数量相关推荐

  1. R语言用泊松Poisson回归、GAM样条曲线模型预测骑自行车者的数量

    全文链接:http://tecdat.cn/?p=18550 我根据泊松Poisson回归.GAM样条曲线模型对一个十字路口的骑自行车者的数量进行预测(点击文末"阅读原文"获取完整 ...

  2. 拓端tecdat|R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险

    最近我们被客户要求撰写关于冠心病风险的研究报告,包括一些图形和统计输出. 相关视频:R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险 逻辑回归Logistic模型原理和R语言分类预测冠 ...

  3. 拓端tecdat|R语言用LOESS(局部加权回归)季节趋势分解(STL)进行时间序列异常检测

    最近我们被客户要求撰写关于LOESS(局部加权回归)的研究报告,包括一些图形和统计输出. 这篇文章描述了一种对涉及季节性和趋势成分的时间序列的中点进行建模的方法.我们将对一种叫做STL的算法进行研究, ...

  4. 拓端tecdat|R语言向量误差修正模型 (VECMs)分析长期利率和通胀率影响关系

    最近我们被客户要求撰写关于向量误差修正模型的研究报告,包括一些图形和统计输出. 向量自回归模型估计的先决条件之一是被分析的时间序列是平稳的.但是,经济理论认为,经济变量之间在水平上存在着均衡关系,可以 ...

  5. 拓端tecdat|R语言线性回归和时间序列分析北京房价影响因素可视化案例

    最近我们被客户要求撰写关于北京房价影响因素的研究报告,包括一些图形和统计输出. 目的 房价有关的数据可能反映了中国近年来的变化: 人们得到更多的资源(薪水),期望有更好的房子 人口众多 独生子女政策: ...

  6. R语言plotly可视化:使用plotly可视化模型预测真阳性率(True positive)TPR和假阳性率(False positive)FPR在不同阈值(threshold)下的曲线

    R语言plotly可视化:使用plotly可视化模型预测真阳性率(True positive)TPR和假阳性率(False positive)FPR在不同阈值下的曲线(TPR and FPR at e ...

  7. R语言与数据分析练习:使用ARIMA模型预测网站访问量

    R语言与数据分析练习:使用ARIMA模型预测网站访问量 使用ARIMA模型预测网站访问量 一.实验背景: 随着流量的增大,某网站的数据信息量也在以一定的幅度增长 基于该网站2016年9月~2017年2 ...

  8. R-GIS: 如何用R语言实现GIS地理空间分析及模型预测

    前言:随着地理信息系统(GIS)和大尺度研究的发展,空间数据的管理.统计与制图变得越来越重要.R语言在数据分析.挖掘和可视化中发挥着重要的作用,其中在空间分析方面扮演着重要角色,与空间相关的包的数量也 ...

  9. R语言地理空间分析、可视化及模型预测

    随着地理信息系统(GIS)和大尺度研究的发展,空间数据的管理.统计与制图变得越来越重要.R语言在数据分析.挖掘和可视化中发挥着重要的作用,其中在空间分析方面扮演着重要角色,与空间相关的包的数量也达到1 ...

  10. R语言泊松Poisson回归模型分析案例

    这个问题涉及马蹄蟹研究的数据.研究中的每只雌性马蹄蟹都有一只雄性螃蟹贴在她的巢穴中.这项研究调查了影响雌蟹是否有其他男性居住在她附近的因素.被认为影响这一点的解释变量包括雌蟹的颜色(C),脊椎状况(S ...

最新文章

  1. php 无限查找下级业绩_php如何查找会员无限分类的所有上级和所有下级
  2. python numpy中stack(),hstack(),vstack()函数解释
  3. 水印铺满_一张人民币水印纸的“争气”之路
  4. 【CentOS Linux 7】【Linux系统及应用---调研报告】
  5. python矩阵旋转函数_Python3算法之十:矩阵旋转
  6. C#时间格式转换、日期操作函数、常用转换语法
  7. 用代码的方式增加servlet mapping定义
  8. python三角形判断白盒测试的代码_进化的测试 软件测试,自动化测试,白盒测试,Python...
  9. python 为什么动态语言_Python动态语言
  10. 最优化方法:三、线性规划
  11. uniapp引入font-awsome字体图标-疑难解决
  12. 教你如何设置电脑保护色来保护眼睛
  13. BZOJ3161: 孤舟蓑笠翁
  14. 通用的产品功能设计方法
  15. 发展智慧城市,需要重点解决哪三大问题?
  16. 周志明:《凤凰架构:构建可靠的大型分布式系统》
  17. 《嫌疑人X的献身》读书笔记
  18. 雷神之锤源码linux,雷神之锤3 的源代码查看
  19. python动物识别系统(仅有识别功能)
  20. 【转】当你 林俊杰 歌曲链接(支持QQ空间)

热门文章

  1. discuzX 数据库操作类
  2. RAW socket使用
  3. 为什么B+树适合做索引
  4. zookeeper分布式原理实战解析
  5. Swift常用第三方库
  6. MySQL grant、revoke 用户权限注意事项
  7. 如何在没有域的环境中搭建AlwaysOn(一)
  8. 《自己动手做交互系统》——第1章 欢迎来到有形交互的世界 1.1 项目简介和背景知识...
  9. 在Spring+Hibernate项目中使用原生SQL进行查询和执行SQL处理
  10. php如何判断是否为json数据(格式)