Bootstrap:

在统计学中,自助法(Bootstrap Method,Bootstrapping或自助抽样法)是一种从给定训练集中有放回的均匀抽样,也就是说,每当选中一个样本,它等可能地被再次选中并被再次添加到训练集中。当样本来自总体,能以正态分布来描述,其抽样分布(Sampling Distribution)为正态分布(The Normal Distribution);但当样本来自的总体无法以正态分布来描述,则以渐进分析法、自助法等来分析。采用随机可置换抽样(random samplingwith replacement)。对于小样本,自助法效果很好。

Bootstrap 属于非参数统计中一种重要的估计统计量方差进而进行区间估计的统计方法。是一种非参数的蒙特卡洛方法,其实质是对观测信息进行再抽样,进而对总体的分布特性进行统计推断。其核心思想和基本步骤如下:

  1. 采用重抽样技术从原始样本中抽取一定数量(自己给定)的样本,此过程允许重复抽样。
  2. 根据抽出的样本计算给定的统计量T。
  3. 重复上述N次(一般大于1000),得到N个统计量T。
  4. 计算上述N个统计量T的样本方差,得到统计量的方差。

Bootstrap通过方差的估计可以构造置信区间等,其运用范围得到进一步延伸。

具体抽样方法举例:
想要知道池塘里面鱼的数量,可以先抽取N条鱼,做上记号,放回池塘。
进行重复抽样,抽取M次,每次抽取N条,考察每次抽到的鱼当中有记号的比例,综合M次的比例,在进行统计量的计算。

R实现:

对样本为3, 5, 7, 9, 11, 13的二项分布进行parametric bootstrap过程:

# Data from binomial(15, θ) for an unknown θ
x = c(3, 5, 7, 9, 11, 13)
binomSize = 15 # known size of binomial
n = length(x) # sample size
thetahat = mean(x)/binomSize # MLE for θ
nboot = 5000 # number of bootstrap samples to use
# nboot parametric samples of size n; organize in a matrix
tmpdata = rbinom(n*nboot, binomSize, thetahat)
bootstrapsample = matrix(tmpdata, nrow=n, ncol=nboot)
# Compute bootstrap means thetahat* and differences delta*
thetahatstar = colMeans(bootstrapsample)/binomSize
deltastar = thetahatstar - thetahat
# Find quantiles and make the bootstrap confidence interval
d = quantile(deltastar, c(.1,.9))
ci = thetahat - c(d[2], d[1])

涉及的R语言知识:

rbinom(n, size, prob)
n是所需满足该分布的随机数的个数,size是试验次数(number of trials (zero or more)),prob是二项分布的概率。
比如你要生成100个服从B(10,0.5)分布的随机数,命令就应该是rbinom(100,10,0.5)。

quantile():
求分位数

parametric bootstrap参数估计抽样方法的R实现相关推荐

  1. Bootstrap重抽样方法

    Bootstrap重抽样方法 Bootstrap重抽样数据集的产生方式主要分为3种方法: 非参数重抽样 Non-parametric resampling 此方法不假设数据的分布或模型.数据表示为n个 ...

  2. 【视频】什么是Bootstrap自抽样及应用R语言线性回归预测置信区间实例|数据分享

    最近我们被客户要求撰写关于Bootstrap的研究报告,包括一些图形和统计输出. 自抽样统计是什么以及为什么使用它? 本文将自抽样方法与传统方法进行比较,并了解它为何有用.并在R语言软件中通过对汽车速 ...

  3. Kmeans聚类K值选择Parametric Bootstrap方法,以及数据重抽样方法Bootstrapping

    常用的K值选择方法是通过寻找"拐点"确认,或者下游业务需求确定.下文介绍了另一种选择方法. 评论:原始该K值选择法只有在数据为"gaussian-like"时才 ...

  4. R语言Bootstrap、百分位Bootstrap法抽样参数估计置信区间分析通勤时间和学生锻炼数据

    最近我们被客户要求撰写关于Bootstrap的研究报告,包括一些图形和统计输出. 本文展示了如何使用 R 构建Bootstrap自举置信区间的示例.还强调了 R 包 ggplot2 用于图形的用途.但 ...

  5. R语言层次聚类(hierarchical clustering):数据缩放、PCA聚类结果可视化、fpc包的clusterboot函数通过bootstrap重采样的方法评估hclust层次聚类的稳定性

    R语言层次聚类(hierarchical clustering):数据缩放.PCA聚类结果可视化.fpc包的clusterboot函数通过bootstrap重采样的方法评估hclust层次聚类的稳定性 ...

  6. R语言Kmeans聚类、抽取聚类簇:fpc包clusterboot函数通过bootstrap重采样的方法评估Kmeans聚类的稳定性、fpc包的kmeansruns函数通过CH准则和ASW获取最优K值

    R语言Kmeans聚类.抽取聚类簇:fpc包的clusterboot函数通过bootstrap重采样的方法评估Kmeans聚类的稳定性.fpc包的kmeansruns函数通过Calinski-Hara ...

  7. R语言中的抽样方法与描述统计函数

    抽样方法 常见的抽样方法 简单随机抽样 分层抽样 系统抽样 # 导入数据 # 1 金融 2 建筑 3 外语 data <- read.csv("E:\\Github\\code-lea ...

  8. 统计学习(四):重抽样方法

    文章目录 重抽样方法 交叉验证法 验证集方法 k​折交叉验证法 偏差--方差均衡 交叉验证法在分类问题中的应用 自助法 重抽样方法 重抽样方法(resampling method)是一种不可或缺的工具 ...

  9. bootstrap 时间线_R语言——通过bootstrap自抽样量化统计估计量的不确定性

    开始今天的内容之前,需要大吼一声放假啦!感恩节假期正式开始,并且为防止节假日人流带来的更严重的新冠传染,感恩节之后本学期所有的课程也都将转为线上,也就是说,直到春季学期开学,我都会蜗居在自己的公寓里. ...

最新文章

  1. RTL设计推荐的各步骤 推荐工具 适合VHDL verilog
  2. WPF中的动画——(六)演示图板
  3. 联科集团携手阿里云发布科研混合云平台 共建科研教育新生态
  4. 学习笔记(二)——CSS基础
  5. 解决Oracle jdbc驱动包maven下载失败问题
  6. Windows的三种坐标系:屏幕坐标系,非客户区坐标系,客户区坐标系
  7. 【LeetCode笔记】236. 二叉树的最近公共祖先(Java、二叉树、DFS)
  8. 浅谈分布式一致性协议之2PC
  9. [转]MySQL忘记密码的正确解决方法
  10. SQL--数据--基本操作
  11. 可变模糊集理论matlab程序,可变模糊集理论的哲学基础
  12. itools苹果录屏大师_超级录屏大师苹果版下载-超级录屏大师APP
  13. vray for sketchup 2018安装教程详解
  14. 友情链接对网站优化有什么作用
  15. uniapp全端应用商城系统,应用市场APP,软件库APP,葫芦芥子博客
  16. C# 无损压缩图片
  17. 基于微信 xlog 开源 日志框架
  18. Sublime text3常用的快捷键—骚骚的编辑器
  19. 土地覆盖/土地利用简介及数据集
  20. PL/SQL将电话号码前三位用括号括起来(以XXX-XXX-XXXX为例)

热门文章

  1. mySQL中stuff,sql stuff函数的语法和作用
  2. Python一键保存千张表情包图
  3. NFT Insider由WHALE社区、BeepCrypto联合出品,浓缩每周NFT新闻,为大家带来关于NFT最全面、最新鲜、最有价值的讯息。
  4. 关于js中delete 操作符的秘密(如何删除对象的属性,清空对象)
  5. [BUUCTF]PWN——[HarekazeCTF2019]baby_rop2
  6. 【论文阅读】inception v1学习总结
  7. 关于Centos使用wget下载: 无法解析主机地址问题
  8. CentOS之——双网卡双IP双网关配置(双网卡配置一个上外网一个接局域网)
  9. 深入理解操作系统实验——bomb lab(phase_1)
  10. Spring Cloud Alibaba微服务架构实战教程—07集成knife4j生成Api文档