拓端tecdat|R语言极值理论:希尔HILL统计量尾部指数参数估计可视化
原文链接:http://tecdat.cn/?p=26277
原文出处:拓端数据部落公众号
极值理论对样本尾部分布的极值指数的估计方法主要有两类:半参数方法和全 参数方法,前者主要是基于分布尾部的 Hill 估计量,后者则主要基于广义帕累托分布。
尾部指数的希尔HILL统计量估计。更具体地说,我们看到如果 , 和 ,然后希尔HILL估计为
。 然后 在某种意义上满足某种一致性 ,如果 ,即 (在收敛速度的附加假设下, )。此外,在附加的技术条件下
为了说明这一点,请考虑以下代码。首先,让我们考虑一个帕累托生存函数,以及相关的分位数函数
> Q=fuction(p){unro(funion(x) S(x)-(1-p),loer=1,per=1e+9)$root}
我们将考虑更复杂的生存函数。这是生存函数和分位数函数,
> plot(u,Veie(Q)(u),type="l")
在这里,我们需要 分位数函数从这个分布中生成一个随机样本,
> X=Vectorize(Q)(runif(n))
hill统计量在这里
> abline(h=alpha)
我们现在可以生成数千个随机样本,并查看这些估计器(对于某些特定的 的)。
> for(s in 1:ns){
+ X=Vectorize
+ H=hill
+ hilk=function(k)
+ HilK[s,]=Vectorize
+ }
如果我们计算平均值,
> plot(15*(1:10),apply(2,mean)
我们得到了一系列可以被认为是无偏的估计量。
现在,回想一下,处于 Fréchet 分布并不意味着 , 和 , 但意味着
对于一些缓慢变化的函数 ,不一定恒定!为了了解可能发生的情况,我们必须稍微具体一些。这只能通过查看生存函数的性质。假设,这里有一些辅助函数
这个(正)常数 以某种方式与生存函数与幂函数之比的收敛速度有关。
更具体地说,假设
然后,使用获得二阶正则变化性质 ,然后,如果 趋向于无穷大太快,那么估计就会有偏差。 如果 ,那么,对于一些 ,
这个结果的直观解释是,如果 太大,并且如果基础分布不完全 是帕累托分布,那么希尔估计量是有偏的。这就是我们所说的意思
- 如果 太大, 是有偏估计量
- 如果 太小, 是一个不稳定的估计量
(后者来自样本均值的属性:观察越多,均值的波动性越小)。
让我们运行一些模拟以更好地了解正在发生的事情。使用前面的代码,生成具有生存函数的随机样本实际上是极其简单的
> Q=function(p){uniroot(function(x) S(x)-(1-p)}
如果我们使用上面的代码。
希尔hill变成
> abline(h=alpha)
但它仅基于一个样本。再次考虑数千个样本,让我们看看 Hill 统计量如何,
所以这些估计量的(经验)平均值是
最受欢迎的见解
1.R语言POT超阈值模型和极值理论分析
2.R语言极值理论EVT:基于GPD模型的火灾损失分布分析
3.R语言有极值(EVT)依赖结构的马尔可夫链(MC)对洪水极值分析
4.R语言回归中的hosmer-lemeshow拟合优度检验
5.matlab实现MCMC的马尔可夫切换ARMA – GARCH模型估计
6.R语言区间数据回归分析
7.R语言WALD检验 VS 似然比检验
8.python用线性回归预测股票价格
9.R语言如何在生存分析与Cox回归中计算IDI,NRI指标
拓端tecdat|R语言极值理论:希尔HILL统计量尾部指数参数估计可视化相关推荐
- 拓端tecdat|R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险
最近我们被客户要求撰写关于冠心病风险的研究报告,包括一些图形和统计输出. 相关视频:R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险 逻辑回归Logistic模型原理和R语言分类预测冠 ...
- 拓端tecdat|R语言向量误差修正模型 (VECMs)分析长期利率和通胀率影响关系
最近我们被客户要求撰写关于向量误差修正模型的研究报告,包括一些图形和统计输出. 向量自回归模型估计的先决条件之一是被分析的时间序列是平稳的.但是,经济理论认为,经济变量之间在水平上存在着均衡关系,可以 ...
- 拓端tecdat|R语言用LOESS(局部加权回归)季节趋势分解(STL)进行时间序列异常检测
最近我们被客户要求撰写关于LOESS(局部加权回归)的研究报告,包括一些图形和统计输出. 这篇文章描述了一种对涉及季节性和趋势成分的时间序列的中点进行建模的方法.我们将对一种叫做STL的算法进行研究, ...
- 拓端tecdat|R语言线性回归和时间序列分析北京房价影响因素可视化案例
最近我们被客户要求撰写关于北京房价影响因素的研究报告,包括一些图形和统计输出. 目的 房价有关的数据可能反映了中国近年来的变化: 人们得到更多的资源(薪水),期望有更好的房子 人口众多 独生子女政策: ...
- R语言极值理论 EVT、POT超阈值、GARCH 模型分析股票指数VaR、条件CVaR:多元化投资组合预测风险测度分析
最近我们被客户要求撰写关于极值理论的研究报告,包括一些图形和统计输出. 相关视频: 极值理论EVT与R语言应用:GPD模型火灾损失分布分析 R语言极值理论EVT:基于GPD模型的火灾损失分布分析 相关 ...
- 拓端tecdat荣获掘金社区入驻新人奖
2021年7月,由掘金发起了"入驻成长礼"颁奖活动.本次活动邀请到知名开发者.服务机构代表等业界人士. 据了解,掘金社区"新入驻创作者礼"主要对已经积累了一定历 ...
- 拓端tecdat荣获2022年度51CTO博主之星
相信技术,传递价值,这是51CTO每一个技术创作者的动力与信念,2022 年度,拓端tecdat 作为新锐的数据分析咨询公司,在51CTO平台上,不断的输出优质的技术文章,分享前沿创新技术,输出最佳生 ...
- R语言淮河流域水库水质数据相关性分析、地理可视化、广义相加模型GAM调查报告...
采样地点:淮河流域一带,昭平台水库.白龟山水库.燕山水库.石漫滩水库.板桥水库.宿鸭湖水库.博山水库.南湾水库.石山口水库.五岳水库.泼河水库.鲶鱼山水库(点击文末"阅读原文"获取 ...
- R语言ggplot2进行特定国家或者地区的地图可视化、在地图上标出所有首府城市所在地(plot the locations of the capital cities)
R语言ggplot2进行特定国家或者地区的地图可视化.在地图上标出所有首府城市所在地(plot the locations of the capital cities) 目录
- R语言使用igraph包进行网络(network)可视化实战
R语言使用igraph包进行网络(network)可视化实战 目录 R语言使用igraph包进行网络(network)可视化实战 #包的安装和导入
最新文章
- 点分十进制IP转换为十进制数以及逆变换,JavaScript
- 【NLP】全面详解 | 深度学习中的注意力机制(一)
- mariadb mysql 语法_Mariadb MySQL、Mariadb中GROUP_CONCAT函数使用介绍
- 面试必会系列 - 11.1 一文读懂Maven:Maven工程类型、项目结构、工程关系、常见命令等
- 秒速五厘米男主php,秒速五厘米最后男主从事的是什么工作?
- 全球开源正当时,第 19 届中日韩三国 IT 局长 OSS 会议暨东北亚开源软件推进论坛圆满落幕
- golang actor模型探索
- tbb::parallel_for 实例
- 看我说PHP之文件上传
- 使用 Hibernate 二级缓存的步骤
- word文档分页符与分节符区别
- Java语言中 (游戏:彩票)修改程序清单3-8,产生三位整数的彩票。程序提示用户输入一个三位整数,依照以下规则判定用户是否赢得奖金:
- 软考高级-信息系统管理师之质量管理(最新版)
- [QT_041]Qt学习之通用对话框:QErrorMessage、QFileDialog、QProgressDialog
- 第一Python第一个爬虫项目
- 连夜看了30多篇改进YOLO的中文核心期刊 我似乎发现了一个能发论文的规律
- 应对不确定性的一个有效手段是重塑企业的使命、愿景和价值观。
- 基于aws cloudfront的前端应用灰度方案
- SRV记录的说明及使用
- fNIRS中的假阳性和假阴性:问题、挑战和方法