原文链接:http://tecdat.cn/?p=13944

原文出处:拓端数据部落公众号

我们已经很自然地认为,不仅可以用一些协变量来解释单个索赔的频率,而且可以用单个成本来解释。

当然,在考虑到一些协变量的情况下,应该考虑使用适当的族对成本的分布进行建模。以下是我们将使用的数据集,

通常用来模拟成本的族是Gamma分布或逆高斯分布或对数正态分布(它不在指数族中,但是可以假设成本的对数可以用高斯分布建模)。在这里仅考虑一个协变量,例如汽车的寿命,以及两个不同的模型:一个Gamma模型和一个对数正态模型。

> age=0:20
> reggamma.sp <- glm(cout~agevehi,family=Gamma(link="log"),
+ data=couts)
> Pgamma <- predict(reggamma.sp,newdata=data.frame(agevehi=age),type="response")

对于Gamma回归,这是一个简单的GLM,因此并不困难。对于对数正态分布,应该记住对数正态分布的期望值不是基础高斯分布的指数。应该进行更正,以便在这里获得平均费用的无偏估算,

我们可以在一张图上绘制这两个预测,

> plot(age,Pgamma,xlab="",ylab="",col="red",type="b",pch=4)
> lines(age,Pln,col="blue",type="b")

也可以使用样条曲线,因为年龄没有可能以可乘的方式出现在这里

在这里,两个模型非常接近。但是,Gamma模型对大额索赔可能非常敏感。另一方面,通过对数正态模型的对数转换,可以看出该模型对大额索赔不太敏感。实际上,如果我使用完整的数据集,则回归如下:

即,具有对数正态分布的平均成本随着汽车的使用年限而降低,而随着Gamma模型的增长而增加。

> couts[which.max(couts$cout),]cout exposition zone puis agevehi ageconduct
7842  4024601       0.22    B         9          13            19marque carbur densi region
7842      2         E      93     24

一名年轻司机带着一辆13岁的汽车索赔400万美元。这是Gamma回归的异常值,显然会影响估计值(如果只有第二个,则第二大)。由于大额索赔对平均成本的估算有明显影响,因此自然的想法可能是删除那些大额索赔。或者也许将它们视为与正常索赔不同:正常索赔可以通过一些协变量来解释,但也许这些大索赔不仅应在其自己的类别内,而且应在投资组合中的所有被保险人内共享。为了使这个想法正式化,我们可以写

蓝色部分与正常大小的声明相关联,而大号部分对应于红色部分。然后,有可能进行三种回归:一个针对正常大小的索赔,一个针对大的索赔,以及一项针对具有索赔的指标(假设发生索赔)。大笔索款超过10,000美元

> s= 10000
> couts$normal=(couts$cout<=s)
> mean(couts$normal)
[1] 0.9818087

在我们的数据集中占2%的索赔。我们可以进行3组回归,并根据汽车的寿命进行平滑回归。第一个模拟大额索赔个人成本的模型,


> ypB=predict(regB,newdata=data.frame(agevehicule=age),type="response")
> ypB2=mean(couts$cout[indice])

第二个模型正常索赔个人成本,


> ypA=predict(regA,newdata=data.frame(agevehicule=age),type="response")
> ypA2=mean(couts$cout[indice])

最后,考虑到发生了索赔,提出了第三种索赔的可能性

> ypC=predict(regC,newdata=data.frame(agevehicule=age),type="response")
> ypC2=predict(regC2,newdata=data.frame(agevehicule=age),type="response")

在下图上,我们绘制了

在这里,将Gamma回归(包括样条曲线)作为平均成本,而逻辑回归(也包括样条曲线)被视为对概率进行建模。

应进行调整以获得足够的溢价水平。即

更进一步,可能还可以假设,不仅索赔的大小(假设索赔额很大)不是任何协变量的函数,而且拥有极大索赔的可能性 也不是。

从第一部分开始,我们已经看到了所考虑的分布对预测有影响,在第二部分中,我们已经看到了大额索赔的定义(以及如何处理它们)也有影响。很明显,精算师在进行利率评估时具有一定的杠杆作用。

拓端tecdat|R语言通过伽玛与对数正态分布假设下的广义线性模型对大额索赔进行评估预测相关推荐

  1. 拓端tecdat|R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险

    最近我们被客户要求撰写关于冠心病风险的研究报告,包括一些图形和统计输出. 相关视频:R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险 逻辑回归Logistic模型原理和R语言分类预测冠 ...

  2. 拓端tecdat|R语言用LOESS(局部加权回归)季节趋势分解(STL)进行时间序列异常检测

    最近我们被客户要求撰写关于LOESS(局部加权回归)的研究报告,包括一些图形和统计输出. 这篇文章描述了一种对涉及季节性和趋势成分的时间序列的中点进行建模的方法.我们将对一种叫做STL的算法进行研究, ...

  3. 拓端tecdat|R语言向量误差修正模型 (VECMs)分析长期利率和通胀率影响关系

    最近我们被客户要求撰写关于向量误差修正模型的研究报告,包括一些图形和统计输出. 向量自回归模型估计的先决条件之一是被分析的时间序列是平稳的.但是,经济理论认为,经济变量之间在水平上存在着均衡关系,可以 ...

  4. 拓端tecdat|R语言线性回归和时间序列分析北京房价影响因素可视化案例

    最近我们被客户要求撰写关于北京房价影响因素的研究报告,包括一些图形和统计输出. 目的 房价有关的数据可能反映了中国近年来的变化: 人们得到更多的资源(薪水),期望有更好的房子 人口众多 独生子女政策: ...

  5. 拓端tecdat荣获掘金社区入驻新人奖

    2021年7月,由掘金发起了"入驻成长礼"颁奖活动.本次活动邀请到知名开发者.服务机构代表等业界人士. 据了解,掘金社区"新入驻创作者礼"主要对已经积累了一定历 ...

  6. 拓端tecdat荣获2022年度51CTO博主之星

    相信技术,传递价值,这是51CTO每一个技术创作者的动力与信念,2022 年度,拓端tecdat 作为新锐的数据分析咨询公司,在51CTO平台上,不断的输出优质的技术文章,分享前沿创新技术,输出最佳生 ...

  7. R语言惩罚逻辑回归、线性判别分析LDA、广义加性模型GAM、多元自适应回归样条MARS、KNN、二次判别分析QDA、决策树、随机森林、支持向量机SVM分类优质劣质葡萄酒十折交叉验证和ROC可视化

    最近我们被客户要求撰写关于葡萄酒的研究报告,包括一些图形和统计输出. 介绍 数据包含有关葡萄牙"Vinho Verde"葡萄酒的信息.该数据集有1599个观测值和12个变量,分别是 ...

  8. R语言GARCH族模型:正态分布、t、GED分布EGARCH、TGARCH的VaR分析股票指数

    全文链接:http://tecdat.cn/?p=31023 如何构建合适的模型以恰当的方法对风险进行测量是当前金融研究领域的一个热门话题(点击文末"阅读原文"获取完整代码数据). ...

  9. R语言使用caret包对GBM模型参数调优(自定义调优的评估指标,例如ROC指标):抽取预测标签及类概率、抽样ROC的指标并绘制密度图

    R语言使用caret包对GBM模型参数调优(自定义调优的评估指标,例如ROC指标):抽取预测标签及类概率.抽样ROC的指标并绘制密度图 目录 R语言使用caret包对GBM模型参数调优(自定义调优的评 ...

  10. R语言时间序列(time series)分析实战:霍尔特指数Holt‘s平滑法预测

    R语言时间序列(time series)分析实战:霍尔特指数Holt's平滑法预测 目录

最新文章

  1. JS~字符串长度判断,超出进行自动截取(支持中文)
  2. Hyper-V虚拟机快照占用磁盘空间过多,导致虚拟机不能启动怎么办
  3. 3-1 Point类的构造函数_JAVA
  4. 关于owa over https的邮箱加密访问
  5. springboot elasticsearch vue ik中文分词器 实现百度/京东全文搜索
  6. 如何判断当前循环的栏目是不是最后一个
  7. SSOR-PCG FORTRAN版CSR压缩存储
  8. win下编译TNN安卓库(静态或者动态) + android studio ndk调用
  9. APP推广运营手册全集
  10. HTML颜色值的设置
  11. iris流程图_IRIS项目管理流程
  12. 如何将图片一键重命名按顺序_图片批量重命名工具(RenameIt)
  13. 洛谷八连测——关于取模与思维僵化
  14. oracle 中int字节,oracle 数据类型
  15. 录音如何生成二维码?
  16. 单片机彩灯移动实验_单片机彩灯实验
  17. Android手机一键Root原理分析(作者:非虫,文章来自:《黑客防线》2012年7月)
  18. 实战工作十年的Code Review方法论与实践总结
  19. 【2022 CCF BDCI 文心大模型创意项目】中秋款文心带你轻松搞定MV制作
  20. BlackArch-Tools

热门文章

  1. HTMLTestRunner修改Python3的版本
  2. 帮助开发者快速创建响应式布局的Boilerplate - Responsive Boilerp...
  3. 双机热备、双机互备与 双机双工的区别
  4. HPC:鱼与熊掌可以兼得
  5. 欧洲冠军联赛决赛结束
  6. PHP学习思维导图--小树好久没长大了,给它加点枝叶
  7. Linux中select函数学习及实例笔记
  8. js 终止 for 循环
  9. python易错盲点排查之+=与+的区别分析以及一些赋值运算踩过的坑
  10. spin_lock浅析【转】