拓端tecdat|R语言再保险合同定价案例研究
原文链接:http://tecdat.cn/?p=13617
原文出处:拓端数据部落公众号
再保险案例研究目的是为业务中断索赔定价一些非比例再保险合同。考虑以下数据集,
> db=read.xls(
+ "PE.xls",
+ sheet=1)
Content type 'application/vnd.ms-excel' length 183808 bytes (179 Kb)
open URL
==================================================
downloaded 179 Kb
至于任何(标准)保险合同,定价中有两个部分
- 预期的索赔数量
- 个人索赔的平均费用
在这里,我们没有协变量(但是可以使用某些变量,例如行业的种类,地理位置等)。
让我们从每年的预期索赔数开始。这是每天的频率
是很久以前的数据,但是,这也是一件好事,因为十年后,我们可以预期大多数索赔已经解决。为了绘制上面的图,我们使用
> date=db$DSUR
> D=as.Date(as.character(date),format="%Y%m%d")
> vD=seq(min(D),max(D),by=1)
> sD=table(D)
> d1=as.Date(names(sD))
> d2=vD[-which(vD%in%d1)]
> vecteur.date=c(d1,d2)
> vecteur.cpte=c(as.numeric(sD),rep(0,length(d2)))
> base=data.frame(date=vecteur.date,cpte=vecteur.cpte)
> plot(vecteur.date,vecteur.cpte,type="h",xlim=as.Date(as.character(
+ c(19850101,20111231)),format="%Y%m%d"))
然后,我们可以使用(标准)Poisson回归来预测每日业务中断索赔的数量,例如,在2010年的任何一天(假设我们必须在几年前对再保险合同进行定价)
> pred2010 =predict(regdate,newdata=nd2010,type="response")
> sum(pred2010)
[1] 159.4757
观察使用旧数据有弊端,因为如果我们按时进行回归(包括一些可能的趋势),我们将面临更多不确定性。
假设我们在给定的一年中平均有160项声明。
> plot(D,db$COUTSIN,type="h")
现在让我们集中讨论这些索赔的费用。我们的数据集中有2,400个索赔要求适合模型(或至少估计了再保险合同可能给我们造成的损失)。假设我们想为我们的大额索赔购买再保险合同。在16年的时间里,该可执行文件的费用应接近1500万。
> quantile(db$COUTSIN,1-32/2400)/1e6
98.66667% 15.34579
> abline(h=quantile(db$COUTSIN,1-32/2400),col="blue")
因此,考虑一些免赔额为1500万的再保险合同。让我们假设再保险公司同意这种免赔额,但承保范围为3500万。平均成本(为再保险公司)是E(g(X))
第一个想法是查看我们投资组合中的第一个成本,即该赔偿的经验平均值。
检查一些损失
> indemn(5)
[1] 0
> indemn(20)
[1] 5
> indemn(50)
[1] 35
现在,如果计算再保险公司在16年内的平均还款额,
> mean(indemn(db$COUTSIN/1e6))
[1] 0.1624292
因此,根据索赔,再保险公司将平均支付162,430。每年有160项索赔,纯保费应接近2600万
> mean(indemn(db$COUTSIN/1e6))*160
[1] 25.98867
(同样,对于3,500万份保险,平均每年应发生两次的某些索赔)。正如我们看到的,再保险的标准模型是帕累托分布(或更具体地说,是广义帕累托分布),
这里有三个参数
- 阈值(我们将其视为固定阈值,但会看到其对再保险定价的影响)
- 比例参数
- 尾部指数
策略是考虑一个低于我们免赔额的门槛,例如1200万。然后,假设损失超过1200万,我们就可以拟合广义Pareto分布,
> gpd.PLxi beta
7.004147e-01 4.400115e+06
计算
在这里,鉴于索赔超过1200万,平均还款额接近600万
> E(15e6,50e6,gpd.PL[1],gpd.PL[2],12e6)
[1] 6058125
现在,我们必须考虑达到1200万的概率
> mean(db$COUTSIN>12e6)
[1] 0.02639296
因此,如果总结一下,我们每年平均有160项索赔
> p
[1] 159.4757
只有2.6%将超过1200万
> mean(db$COUTSIN>12e6)
[1] 0.02639296
因此,每年发生1200万以上的频率为4.2
> p*mean(db$COUTSIN>12e6)
[1] 4.209036
对于超过1200万的索赔,平均还款额为
> E(15e6,50e6,gpd.PL[1],gpd.PL[2],12e6)
[1] 6058125
因此,纯溢价应接近
> p*mean(db$COUTSIN>12e6)*E(15e6,50e6,gpd.PL[1],gpd.PL[2],12e6)
[1] 25498867
接近我们获得的经验值。实际上,也可以查看阈值参数的影响,很明显,中间值可以更改。
我们可以将纯溢价绘制为该阈值的函数,
> seuils=seq(1e6,15e6,by=1e6)
> plot(seuils,Vectorize(esp)(seuils),type="b",col="red")
对于较大的阈值,该值在24到26之间。同样,这是第一步,我们可以为更高的再保险层定价,例如可抵扣额为5000万的再保险合同(我们之前有低于该门槛的索赔的再保险合同),而承保额为5000万。拥有参数模型变得有趣,该模型应该比经验平均值更健壮。
拓端tecdat|R语言再保险合同定价案例研究相关推荐
- 拓端tecdat|R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险
最近我们被客户要求撰写关于冠心病风险的研究报告,包括一些图形和统计输出. 相关视频:R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险 逻辑回归Logistic模型原理和R语言分类预测冠 ...
- 拓端tecdat|R语言用LOESS(局部加权回归)季节趋势分解(STL)进行时间序列异常检测
最近我们被客户要求撰写关于LOESS(局部加权回归)的研究报告,包括一些图形和统计输出. 这篇文章描述了一种对涉及季节性和趋势成分的时间序列的中点进行建模的方法.我们将对一种叫做STL的算法进行研究, ...
- 拓端tecdat|R语言向量误差修正模型 (VECMs)分析长期利率和通胀率影响关系
最近我们被客户要求撰写关于向量误差修正模型的研究报告,包括一些图形和统计输出. 向量自回归模型估计的先决条件之一是被分析的时间序列是平稳的.但是,经济理论认为,经济变量之间在水平上存在着均衡关系,可以 ...
- 拓端tecdat|R语言线性回归和时间序列分析北京房价影响因素可视化案例
最近我们被客户要求撰写关于北京房价影响因素的研究报告,包括一些图形和统计输出. 目的 房价有关的数据可能反映了中国近年来的变化: 人们得到更多的资源(薪水),期望有更好的房子 人口众多 独生子女政策: ...
- 拓端tecdat荣获掘金社区入驻新人奖
2021年7月,由掘金发起了"入驻成长礼"颁奖活动.本次活动邀请到知名开发者.服务机构代表等业界人士. 据了解,掘金社区"新入驻创作者礼"主要对已经积累了一定历 ...
- 拓端tecdat荣获2022年度51CTO博主之星
相信技术,传递价值,这是51CTO每一个技术创作者的动力与信念,2022 年度,拓端tecdat 作为新锐的数据分析咨询公司,在51CTO平台上,不断的输出优质的技术文章,分享前沿创新技术,输出最佳生 ...
- R语言cox回归模型案例(绘制列线图、校正曲线):放疗是否会延长胰脏癌手术患者的生存时间
R语言cox回归模型案例(绘制列线图.校正曲线):放疗是否会延长胰脏癌手术患者的生存时间 目录
- R语言Logistic回归模型案例基于AER包的affair数据分析
R语言Logistic回归模型案例基于AER包的affair数据 目录 R语言Logistic回归模型案例基于AER包的affair数据 #数据加载及目标变量二值化
- R语言Logistic回归模型案例:低出生婴儿体重的影响因素分析(列线图、校准曲线)
R语言Logistic回归模型案例:低出生婴儿体重影响因素分析(列线图.校准曲线) 目录 R语言Logistic回归模型案例:低出生婴儿体重影响因素分析(列线图.校准曲线ÿ
- R语言Logistic回归模型案例:分析吸烟、饮酒与食管癌的关系
R语言Logistic回归模型案例:分析吸烟.饮酒与食管癌的关系 目录 R语言Logistic回归模型案例分析吸烟.饮酒与食管癌的关系 #样例数据
最新文章
- iOS开发-Xcode入门ObjC程序
- 关于定义视频播放器的界面的相关的类transPortcontroll等
- setCharacterEncoding和setContentType
- python初学者代码示例_Selenium 快速入门笔记和代码示例(Python版)
- 作者:周涛,电子科技大学大数据研究中心主任、教授、博士生导师。
- 软件开发安全性_开发具有有效安全性的软件的最佳方法
- 数据库关键字引起的,ORA-00904: TABLE.column: 标识符无效
- hdu 3065 病毒侵袭持续中
- Confluence 6 配置数字格式
- ddm模型公式_DDM模型绝对估值模型的理解和运用 分析师会利用DDM模型来给公司定价,如果投资者过于依赖,这样可能会给我们很好的机会,在他们犯错误时,就是我们把握机会的时... - 雪球...
- java html截图_Java实现网页截图/登录截图
- 利用java编写网络聊天程序并加密信息
- MATLAB:Radon正变换的理解
- 中山マミ - 咲く未来
- python 发送QQ邮箱
- 一边攒大米,一边做公益
- 成都微信小程序电商定制报价
- 某大学生写给女朋友的信
- L_TO_CREATE_POSTING_CHANGE
- 团队建设管理培训PPT模板