原文链接:http://tecdat.cn/?p=25348

原文出处:拓端数据部落公众号

你们可能知道,实际极值分析有两种常用方法:分块极大值Block-maxima、阈值超额法threshold excess。今天,我们将分别介绍这两种方法。

分块极大值Block-maxima

分块样本极大值的极值理论(Block-maxima)。这种对(时间)观测序列的极值建模的方法是基于在一定的恒定长度序列内利用这些观测值的最大值或最小值。对于足够多  的n个已建立块,这n个等长块  的所得峰值    可用于将合适的分布拟合到这些数据。虽然块大小基本上可以自由选择,但必须在偏差(小块)和方差(大块)之间进行权衡。通常,序列的长度通常选择对应于某个熟悉的时间段,在大多数情况下为一年。年度最大值(或最小值)的结果向量称为“年度最大值(最小值)系列”或简称为 AMS。

根据 Fisher-Tippett-Gnedenko 定理,块最大值的分布可以通过广义极值分布来近似。

以下代码显示了一个简短的实际示例,该示例使用 R将广义极值分布拟合到降水数据的时间序列。样本数据集包含 1971 年至 2014 年 降水数据。

# 加载所需的包# 获取数据
prexts <- rehyd# 导出 AMS 以获得最大降水量
ams <- apprly# GEV 分布的最大似然拟合
evd
# 诊断图
plotrl_mle <- reevel
# 基于 L- 拟合 GEV 分布矩估计
# 诊断图
plot(fiom)
# 重现水平:
rm <- retvel
# 重现水平图plot
loc <- as.numeric(retvel)# 带 LMOM 图的重现水平loc <- as.numeric(return.level)

在这种情况下,两个结果非常相似。在大多数情况下,L 矩估计比最大似然估计更稳健。除了这些经典估计方法之外,extRemes还提供广义最大似然估计(GMLE,  Martins 和 Stedinger,2000 年)和贝叶斯估计方法(Gilleland 和 Katz,2016 年)。

阈值超额法threshold excess

我们现在来看看阈值超额法。

根据 Coles (2001) 的说法,如果可以使用没有间隙的完整(时间)序列,则阈值方法比块最大值方法更有效,因为所有超过某个阈值的值都可以作为模型拟合的基础。在某些情况下,将分布拟合到块最大值数据是一种浪费的方法,因为每个块只有一个值用于建模,而阈值过剩方法可能会提供更多关于极端值的信息。

然而,类似于块最大值方法中块大小的选择,部分持续时间模型的阈值选择也受到偏差(低阈值)和方差(高阈值)之间的权衡。

Coles (2001) 描述了两种不同的阈值选择方法。首先,有一种基于平均残差寿命图的探索性方法。该技术在实际模型拟合之前应用。其次,另一种方法是评估参数估计的稳定性。因此,模型拟合的这种敏感性分析是在一系列不同的阈值范围内进行的。

但是,选择合适的阈值可能是使用部分持续时间序列执行极值分析的最关键部分。Scarrott 和 MacDonald 在其 2012 年的文章A review of极值阈值估计和不确定性量化(REVSTAT 10(1): 33-59)中对阈值估计方法进行了很好的概述 。

找到合适的阈值后,超过该阈值的极值子集将用于拟合广义帕累托分布。

根据 Pickands-Balkema-de Haan 定理,超过阈值的值的分布可以近似为广义帕累托分布。

以下代码显示了一个简短的实际示例,该示例使用R将广义帕累托分布拟合到降水数据的时间序列。样本数据集以 1981 年至 2014 年降水数据为特征。

# 平均剩余寿命图:
lplot(prects)
# 平均剩余寿命图描绘了阈值 (u) 与平均过剩流量。
# 这个想法是找到图几乎是线性的最低阈值;
# 考虑到 95% 的置信范围。# 在一系列阈值上拟合 GPD 模型
threplot(prxts)fitrange (prts)
# 设置阈值
th <- 40# 最大似然估计
pole <- fe
# 诊断图rl_mle <- retvel(po)# L-矩估计
d(as.vector(prmethod = "moments")
# 诊断图
retel(pom)# 重现水平图# 使用 MLE 的重现水平图loc <- as.numeric# 带 LMOM 的重现水平图
plmom


这个例子很好地说明了为什么基于 L 矩的方法可能优于最大似然估计,因为右图清楚地证明了使用 L 矩估计时异常值的影响要小得多。除了这些经典估计方法之外,还提供广义最大似然估计(GMLE,  Martins 和 Stedinger,2000 年)和贝叶斯估计方法(Gilleland 和 Katz,2016 年)。

在最近关于分块最大值法和阈值超额法的文章中,我们简单地假设了极值分析的所有假设都得到了满足。然而,在处理环境变量时,情况很可能不是这样的。特别是平稳性的假设在很多情况下可能被违反。在全球气候变化的背景下,气象或其他环境变量的时间序列中很可能有一个相当大的趋势。当然,这种趋势必须被纳入分析中,因为由此产生的回归水平随时间而变化。

广义帕累托分布拟合

下面的代码显示了一个简短的实际例子,即使用R对降水数据的时间序列进行广义帕累托分布的拟合。样本数据集是从1971年到2013年的降水数据。

# 推导出最大降水的AMS值
as <- apprly(preax)# 检查AMS的平稳性。# 简单的线性模型summary(lm)p <- ggplot

拟合线性模型的结果和图给人的印象都表明年最大降水量有上升趋势。Mann-Kendall趋势检验的结果是一个非常小的P值,证实了这一趋势。因此,必须进行趋势校正,以说明随时间变化的回归水平。

# 最大似然估计
d( method = "MLE")
# 重现水平图
plot(mend)

与前面的重现水平图(没有趋势)相比,这个重现水平图看起来有所不同。它显示的是5年和100年重现水平随时间的变化。


最受欢迎的见解

1.R语言POT超阈值模型和极值理论分析

2.R语言极值理论EVT:基于GPD模型的火灾损失分布分析

3.R语言有极值(EVT)依赖结构的马尔可夫链(MC)对洪水极值分析

4.R语言回归中的hosmer-lemeshow拟合优度检验

5.matlab实现MCMC的马尔可夫切换ARMA – GARCH模型估计

6.R语言区间数据回归分析

7.R语言WALD检验 VS 似然比检验

8.python用线性回归预测股票价格

9.R语言如何在生存分析与Cox回归中计算IDI,NRI指标

拓端tecdat|R语言极值分析:分块极大值Block-maxima、阈值超额法threshold excess、广义帕累托分布GPD拟合降水数据时间序列相关推荐

  1. 极值分析:分块极大值BLOCK-MAXIMA、阈值超额法、广义帕累托分布GPD拟合降雨数据时间序列...

    全文链接:http://tecdat.cn/?p=25348 你们可能知道,实际极值分析有两种常用方法:分块极大值Block-maxima.阈值超额法threshold excess(点击文末&quo ...

  2. MATLAB数据处理(2)——广义帕累托分布和极值外推

    MATLAB数据处理(2)--广义帕累托分布和极值外推 广义帕累托分布 使用matlab进行广义帕累托分布参数估计 图像检查拟合效果 极值外推 还有一些问题 极值外推有时候会有问题 阈值选取的艺术 广 ...

  3. 拓端tecdat|R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险

    最近我们被客户要求撰写关于冠心病风险的研究报告,包括一些图形和统计输出. 相关视频:R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险 逻辑回归Logistic模型原理和R语言分类预测冠 ...

  4. 拓端tecdat|R语言向量误差修正模型 (VECMs)分析长期利率和通胀率影响关系

    最近我们被客户要求撰写关于向量误差修正模型的研究报告,包括一些图形和统计输出. 向量自回归模型估计的先决条件之一是被分析的时间序列是平稳的.但是,经济理论认为,经济变量之间在水平上存在着均衡关系,可以 ...

  5. 拓端tecdat|R语言线性回归和时间序列分析北京房价影响因素可视化案例

    最近我们被客户要求撰写关于北京房价影响因素的研究报告,包括一些图形和统计输出. 目的 房价有关的数据可能反映了中国近年来的变化: 人们得到更多的资源(薪水),期望有更好的房子 人口众多 独生子女政策: ...

  6. 拓端tecdat|R语言用LOESS(局部加权回归)季节趋势分解(STL)进行时间序列异常检测

    最近我们被客户要求撰写关于LOESS(局部加权回归)的研究报告,包括一些图形和统计输出. 这篇文章描述了一种对涉及季节性和趋势成分的时间序列的中点进行建模的方法.我们将对一种叫做STL的算法进行研究, ...

  7. 分布式能源接入分析matlab 通过分布式能源的选址定容确定得到帕累托最优解集

    分布式能源接入分析matlab 通过分布式能源的选址定容确定得到帕累托最优解集,然后选择最优值进行分析,模型为双层模型,程序采用改进粒子群算法 _:89180639056410504快乐程序人

  8. 分布式能源接入分析matlab 通过分布式能源的选址定容确定得到帕累托最优解集,然后选择最优值进行分析

    分布式能源接入分析matlab 通过分布式能源的选址定容确定得到帕累托最优解集,然后选择最优值进行分析,模型为双层模型,程序采用改进粒子群算法,程序本人编制,可讲解! :951806390564105 ...

  9. R语言极值理论 EVT、POT超阈值、GARCH 模型分析股票指数VaR、条件CVaR:多元化投资组合预测风险测度分析

    最近我们被客户要求撰写关于极值理论的研究报告,包括一些图形和统计输出. 相关视频: 极值理论EVT与R语言应用:GPD模型火灾损失分布分析 R语言极值理论EVT:基于GPD模型的火灾损失分布分析 相关 ...

  10. 数据特征分析之帕累托分析以及python实现

    帕累托分析(贡献度分析) → 帕累托法则:20/80定律 "原因和结果.投入和产出.努力和报酬之间本来存在着无法解释的不平衡.一般来说,投入和努力可以分为两种不同的类型: 多数,它们只能造成 ...

最新文章

  1. SAP PM入门系列32 - S_ALR_87013432 Display Confirmations
  2. vim java 注释_centOS7 下的vim java补全
  3. 电梯调度问题之需求分析
  4. tar 解压zip_Keka for mac(压缩解压工具)
  5. 论文浅尝 | 一个模型解决所有问题:实体和事件的神经联合模型
  6. 自动门程序c语言,自动门控制程序共享
  7. scrapy 爬取百度知道,多spider子一个项目中,使用一个pielines
  8. SDxCentral 2015年NFV报告
  9. 教大家一个快速批量去水印下载快手视频、图集的方法技巧
  10. Nacos指南-服务发现:删除服务
  11. [TIPTOP] 鼎捷ERP開發小撇步 - 編譯程式碼 及 畫面檔 一次到位的方法
  12. 机房资产管理系统linux,资产管理平台设备技术指标.doc
  13. Alibaba微服务组件Nacos单机+集群配置 prometheus+grafana监控配置及注册中心实战【收获满满】
  14. 【Android】制作一个简易的画板
  15. 封禁恶意IP访问在我司实践总结
  16. 启动nacos报错:Exception in thread main java.lang.UnsupportedClassVersionError
  17. 利用卷积处理图片的实例(图像模糊,锐化...)
  18. 【莫烦Python】Python 基础教程学习笔记与代码
  19. MATLAB算法实战应用案例精讲-【图像处理】数字图像二值化(附Java、python、matlab、C++和R语言代码实现)
  20. ai自动配音_自媒体免费配音神器,一键生成100条AI配音

热门文章

  1. 关于Java中的final关键字
  2. 实验1-利用Debug查看CPU寄存器和内存+利用机器指令和汇编指令编程
  3. 第二季-专题3-汇编语言得玩转
  4. 【BZOJ 3172】单词
  5. new和malloc的区别(详细)
  6. Packet Tracer 5.0实验(二) 交换机的Telnet远程登录设置
  7. ffmpeg-20160517-git-bin
  8. 《Linux内核设计与实现》课本第十八章自学笔记——20135203齐岳
  9. DataGridView突出
  10. 【转】PCDATA和CDATA的区别究竟是什么呢?