原文链接:http://tecdat.cn/?p=14139

原文出处:拓端数据部落公众号

我们已经看到了如何考虑风险敞口,计算包含风险敞口的多个数量(经验均值和经验方差)的非参数估计量。让我们看看如果要对二项式变量建模。

这里的模型如下:

  • 未观察到该期间的索赔数量 
  • 索偿的数量  

考虑一种情况,其中关注变量不是索偿的数量,而仅仅是索偿发生的标志。然后,我们希望将事件模型对比,解释为不发生发生。鉴于我们只能观察vs   。利用泊松过程模型,我们可以获得

这意味着在一年的前六个月中没有索赔的概率是一年中没有索赔的平方根。假设可以通过一些链接函数(使用GLM术语)表示为一些协变量来解释没有索赔的概率,

现在,因为我们确实观察到  而不是  

我们有

我们将使用的数据集

> T1= contrat$nocontrat[I==FALSE]
> nombre2 = data.frame(nocontrat=T1,nbre=0)> sinistres = merge(contrat,nombre)
> sinistres$nonsin = (sinistres$nbre==0)

我们可以考虑的第一个模型基于标准的逻辑回归方法

很好,但是很难用标准函数处理。尽管如此,始终有可能通过数值计算给定的最大似然估计量。

> optim(fn=logL,par=c(-0.0001,-.001),
+ method="BFGS")
$par
[1] 2.14420560 0.01040707
$value
[1] 7604.073
$counts
function gradient 42       10
$convergence
[1] 0
$message
NULL

现在,让我们看看基于标准回归模型的替代方案。例如对数线性模型(Logistic回归算法)。因为暴露数是年概率的幂,所以如果是指数函数(或  对数链接函数)  ,因为

现在,我们对其进行编码,

Error: no valid set of coefficients has been found: please supply starting values

尝试了所有可能的方法,但是无法解决该错误消息,

> reg=glm(nonsin~ageconducteur+offset(exposition),
+ data=sinistresI,family=binomial(link="log"),
+ control = glm.control(epsilon=1e-5,trace=TRUE,maxit=50),
+ start=startglm,
+ etastart=etaglm,mustart=muglm)
Deviance = NaN Iterations - 1
Error: no valid set of coefficients has been found: please supply starting values

所以我决定放弃。实际上,问题出在接近1 的事实。因为

其中接近0,所以我们可以用泰勒展开,

在这里,暴露数不再显示为概率的幂,而是相乘。如果我们考虑对数链接函数,那么我们可以合并暴露数的对数。

现在可以完美运行了。

现在,要查看最终模型,我们回到Poisson回归模型,因为我们确实有概率模型

现在我们可以比较这三个模型。我们还应该包括没有任何解释变量的预测。对于第二个模型(实际上,它运行时没有任何解释变量),我们运行

>  regreff=glm((1-nonsin)~1+offset(log(exposition)),
+ data=sinistres,family=binomial(link="log"))

预测

> exp(coefficients(regreff))
(Intercept) 0.06776376

可与逻辑回归比较,

> 1-exp(param)/(1+exp(param))
[1] 0.06747777

但是与泊松模型有很大的不同,

(Intercept) 0.07279295

我们产生一个图表比较那些模型,

> lines(age,1-yml1,type="l",col="purple")
> abline(h=exp(coefficients(regreff)),lty=2)

在这里观察到这三个模型是完全不同的。实际上,使用两个模型,可以进行更复杂的回归分析(例如使用样条曲线),以可视化年龄对发生或不发生交通事故概率的影响。如果将泊松回归(仍为红色)和对数二项式模型与泰勒展开进行比较,我们得到


参考文献

1.R语言多元Logistic逻辑回归 应用案例

2.面板平滑转移回归(PSTR)分析案例实现

3.matlab中的偏最小二乘回归(PLSR)和主成分回归(PCR)

4.R语言泊松Poisson回归模型分析案例

5.R语言回归中的Hosmer-Lemeshow拟合优度检验

6.r语言中对LASSO回归,Ridge岭回归和Elastic Net模型实现

7.在R语言中实现Logistic逻辑回归

8.python用线性回归预测股票价格

9.R语言如何在生存分析与Cox回归中计算IDI,NRI指标

拓端tecdat|R语言逻辑回归和泊松回归模型对发生交通事故概率建模相关推荐

  1. 拓端tecdat|R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险

    最近我们被客户要求撰写关于冠心病风险的研究报告,包括一些图形和统计输出. 相关视频:R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险 逻辑回归Logistic模型原理和R语言分类预测冠 ...

  2. 拓端tecdat|R语言用LOESS(局部加权回归)季节趋势分解(STL)进行时间序列异常检测

    最近我们被客户要求撰写关于LOESS(局部加权回归)的研究报告,包括一些图形和统计输出. 这篇文章描述了一种对涉及季节性和趋势成分的时间序列的中点进行建模的方法.我们将对一种叫做STL的算法进行研究, ...

  3. r ridge回归_R语言逻辑回归和泊松回归模型对发生交通事故概率建模

    原文链接 http://tecdat.cn/?p=14139 我们考虑风险敞口,计算包含风险敞口的多个数量(经验均值和经验方差)的非参数估计量.如果要对二项式变量建模. 这里的模型如下: 未观察到该期 ...

  4. matlab reff,R语言逻辑回归和泊松回归模型对发生交通事故概率建模

    我们已经看到了如何考虑风险敞口,计算包含风险敞口的多个数量(经验均值和经验方差)的非参数估计量.让我们看看如果要对二项式变量建模. 这里的模型如下: 未观察到 该期间的索赔数量  索偿的数量  考虑一 ...

  5. 拓端tecdat|R语言线性回归和时间序列分析北京房价影响因素可视化案例

    最近我们被客户要求撰写关于北京房价影响因素的研究报告,包括一些图形和统计输出. 目的 房价有关的数据可能反映了中国近年来的变化: 人们得到更多的资源(薪水),期望有更好的房子 人口众多 独生子女政策: ...

  6. 拓端tecdat|R语言向量误差修正模型 (VECMs)分析长期利率和通胀率影响关系

    最近我们被客户要求撰写关于向量误差修正模型的研究报告,包括一些图形和统计输出. 向量自回归模型估计的先决条件之一是被分析的时间序列是平稳的.但是,经济理论认为,经济变量之间在水平上存在着均衡关系,可以 ...

  7. 数据分享|R语言逻辑回归、线性判别分析LDA、GAM、MARS、KNN、QDA、决策树、随机森林、SVM分类葡萄酒交叉验证ROC...

    全文链接:http://tecdat.cn/?p=27384 在本文中,数据包含有关葡萄牙"Vinho Verde"葡萄酒的信息(点击文末"阅读原文"获取完整代 ...

  8. R语言广义线性模型函数GLM、广义线性模型(Generalized linear models)、GLM函数的语法形式、glm模型常用函数、常用连接函数、逻辑回归、泊松回归、系数解读、过散度分析

    R语言广义线性模型函数GLM.广义线性模型(Generalized linear models).GLM函数的语法形式.glm模型常用函数.常用连接函数.逻辑回归.泊松回归.系数解读.过散度分析 目录

  9. R语言使用broom包将回归模型(线性回归、逻辑回归、比例风险回归)的结果整理成dataframe并导出到excel等文件中:基于mtcars和colon数据集

    R语言使用broom包将回归模型(线性回归.逻辑回归.比例风险回归)的结果整理成dataframe并导出到excel等文件中:基于mtcars和colon数据集 目录

  10. R语言逻辑回归Logistic回归分析预测股票涨跌

    最近我们被客户要求撰写关于逻辑回归的研究报告,包括一些图形和统计输出. 视频:R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险 逻辑回归Logistic模型原理和R语言分类预测冠心病风 ...

最新文章

  1. .NET Framework 4.0的新特性
  2. 企业如何提升管理能力,让企业协作更顺畅?
  3. html接收model数据,QAbstractTableModel数据返回要显示的html代码
  4. CSS样式学习-CSS 背景
  5. 【django】使用django-crontab执行django自定义指令
  6. c语言是如何实现泛型链表
  7. 文件服务器 选型,文件服务器选型
  8. 如何判断NSMutableDictionary是否有某个key
  9. android壁纸服务,android壁纸服务流程浅析
  10. 什么是javaEE、什么是JavaSE、什么是javaME?
  11. 如何vista中使用netmeeting
  12. 穷建站(二):在DnsPod中为申请的tk域名进行域名解析
  13. 恭喜这2所高校,喜提“电子土豆大学”“四川土豆大学”称号
  14. 基于Java毕业设计游戏销售系统源码+系统+mysql+lw文档+部署软件
  15. 安装liunx出现Entering emergency mode
  16. 科大讯飞输入法android离线语音,讯飞输入法Android5.0.1752 离线语音更轻快的表达...
  17. 33.Redis详解
  18. 基于Django框架的视频播放器设计
  19. 2020最新版前端学习路线图--让前端学习变得美如画
  20. 关于TCP/IOCP构架中出现的假死连接解决方案

热门文章

  1. OC基础--关键字@property 和 @synthesize
  2. 一键将RHEL的YUM源更换为CentOS源
  3. 2012年参加油田象棋比赛的几盘棋
  4. c#的is,as,强制类型问题
  5. ucosiii 钩子函数
  6. python基础--列表,元组
  7. idea2017显示maven Project菜单
  8. 这么多年都白学了,原来是方法没有用对
  9. 【欧洲AI复兴】马克龙:法国AI要赶美超中!
  10. gradle 关于repository配置