推断统计是指用样本数量特征推断总体特征 ,在现实生活中,我们只抽取一个样本,计算出一个统计量(样本均值,样本方差,样本比例等)的值,将其作为总体参数的一个估计值,这种方法也称点估计,但是这样做往往不准确,但是我们有了抽样分布的概念,指的是所有估计值的集合,以样本均值为例,由中心极限定理(clt)知,

从均值 μ \mu μ、方差为 σ 2 {\sigma^2} σ2的任意一个总体中抽取样本容量为 n n n的样本,当 n n n充分大时,样本均值 x ˉ \bar{x} xˉ的抽样分布渐进服从均值为 μ \mu μ,方差为 σ 2 n \frac{\sigma^2}{n} nσ2​的正态分布。

#中心极限定理实现
import numpy as np
import matplotlib.pyplot as plt
random_data=np.random.randint(1,3,10000)
s=[]
for i in range(10000):sample=np.random.choice(random_data,1000)s.append(sample.mean())
plt.hist(s,bins=30)

但是样本容量小或者说我们收集到的数据有限时,抽样分布不再服从正态分布,那我们如何做统计推断呢,可以采用bootstrap抽样法,

基本思想是从总体中抽出一个样本,然后从这个样本中进行有放回抽样,抽取若干个样本(一般大于1000且每个样本容量和初始抽取样本容量相同,每个样本计算出样本统计量的值,仍以均值为例,计算出 x 1 ˉ , x 2 ˉ … x n ˉ \bar{x_1},\bar{x_2}\ldots\bar{x_n} x1​ˉ​,x2​ˉ​…xn​ˉ​,得到均值的抽样分布,此时
总体均值 μ ^ = ∑ i = 1 n x i ˉ n \hat{\mu}=\frac{ \sum_{i=1}^n\bar{x_i} }{n} μ^​=n∑i=1n​xi​ˉ​​
总体方差 σ 2 ^ = ∑ i = 1 n ( μ − x i ˉ ) 2 ^ n − 1 \hat{\sigma^2}=\frac{ \sum_{i=1}^n(\hat{\mu-\bar{x_i} )^2} }{n-1} σ2^=n−1∑i=1n​(μ−xi​ˉ​)2^​​
这就是用bootstrap方法去估计总体均值和方差。

# bootstrap实现
np.random.seed(123)
s=np.random.choice(random_data,100)
b=[]
for i in range(10000):c=np.random.choice(s,1000)b.append(c.mean())
plt.hist(b,bins=30)

bootstrap抽样相关推荐

  1. 置信区间(Confidence Intervals)是什么?如何计算置信区间?置信区间的两种计算方法是什么?二值样本置信区间如何计算?如何基于bootstrap抽样进行置信区间计算?

    置信区间(Confidence Intervals)是什么?如何计算置信区间?置信区间的两种计算方法是什么?二值样本置信区间如何计算?如何基于bootstrap抽样进行置信区间计算? 目录 置信区间( ...

  2. 随机森林中的Bootstrap抽样是有放回抽样么?Bootstrap抽样过程描述一下

    随机森林中的Bootstrap抽样是有放回抽样么?Bootstrap抽样过程描述一下 Bootstrap方法:每当选中一个元组,这个元组同样也可能再次被选中并再次添加到训练集中.例如,想象一台从训练集 ...

  3. Bootstrap抽样和Monte Carlo思想

    写在前面 总是搞不懂.记不住这些名字好像很厉害的算法思想,这篇文章主要写一下Bootstrap抽样和蒙特卡罗算法思想. 一.Bootstrap抽样 1.基本思想 Bootstrap抽样的基本思想是在全 ...

  4. 统计学中的Bootstrap方法(Bootstrap抽样)用来训练bagging算法,如果随机森林Random Forests

    统计学中的Bootstrap方法(Bootstrap抽样)用来训练bagging算法,如果随机森林Random Forests 提示:系列被面试官问的问题,我自己当时不会,所以下来自己复盘一下,认真学 ...

  5. 统计学中的Bootstrap方法(Bootstrap抽样)

    Bootstrap又称自展法.自举法.自助法.靴带法 ,  是统计学习中一种重采样(Resampling)技术,用来估计标准误差.置信区间和偏差 Bootstrap是现代统计学较为流行的一种统计方法, ...

  6. Bootstrap重抽样方法

    Bootstrap重抽样方法 Bootstrap重抽样数据集的产生方式主要分为3种方法: 非参数重抽样 Non-parametric resampling 此方法不假设数据的分布或模型.数据表示为n个 ...

  7. 讲讲Bootstrap是在干啥?

    总第248篇/张俊红 学过统计学的同学应该对置信区间都有了解,置信区间又叫估计区间,是从概率来讲某个随机变量可能取的值的范围. 在前面的文章<聊聊置信度与置信区间>中讲过为什么会有置信区间 ...

  8. bagging通过bootstrap构建集成分类器

    集成学习是将不同分类器组合成为一个元分类器,元分类器与其包含的当个分类器相比,元分类器具有更好的泛化性能. 一.bagging集成分类器 bagging没有使用相同的训练集拟合集成分类器中的单个成员分 ...

  9. Stata:Bootstrap 简介

      作者: 吴雄(湘潭大学),童天天(中南财经政法大学) 连享会  Source: The Bootstrap in Stata 原文链接: 连享会-Bootstrap简介 文章目录 1. Boots ...

最新文章

  1. 5.1.2 IO控制器
  2. 使用VS2019创建项目,添加文件和库地址
  3. LeetCode 32. 最长有效括号(栈DP)
  4. leaving target processor paused”错误怎么解决
  5. 2021-2025年中国冲击式粉碎机装置行业市场供需与战略研究报告
  6. python是什么类型的编程语言-python和scratch有什么区别
  7. java工程师英文简历_java软件工程师英文简历模板
  8. 小程序图片src本地服务器路径,微信小程序 图片加载(本地,网路)实例详解...
  9. linux at24测试程序,C51读写AT24C04源代码及AT24C04测试程序
  10. 服务器主板测试工程师的项目经历,硬件测试简历项目经验怎么写
  11. K-Means聚类算法
  12. Git 团队协作中常用检查术语 WIP PTAL CC LGTM 等解释
  13. 马铃薯淀粉生产线的全球与中国市场2022-2028年:技术、参与者、趋势、市场规模及占有率研究报告
  14. java的基本数据类型有哪些
  15. python矩阵操作:dot、inv、det、eig
  16. 用MATLAB的GUI绘图的一个简单例子
  17. before和after怎么区分_before的用法和如何判断其时态,before和after区别
  18. win人工智能助手——小爱同学uwp版 (win10专属)
  19. 使用Python开发游戏运行脚本(二)实现模拟点击
  20. 光伏逆变器行业研究及十四五规划分析报告

热门文章

  1. 常见的浏览器兼容性问题总结(有自己遇到的还有网上大神总结的)
  2. 深度解析杀毒软件内核(经典5章合集)
  3. Excel数值函数(5):COUNTIF,统计符合指定条件的单元格数量
  4. Table边框(内边框,外边框)使用总结
  5. html表格边框设置单线,border-collapse把table边框的样式设置成单线
  6. 802 11协议介绍
  7. [模型]拉格朗日插值法
  8. 每天学一个 Linux 命令(73):curl
  9. ArmClang: error: No license checking back-end registered with id Keil.mdkstd for feature Keil
  10. 赌对周期,李想的汽车之家成长为市值10亿美元的公司(转)