目录

  • 1. 抽样的基本概念

    • 1.1 全及总体与样本总体
    • 1.2 全及指标与抽样指标
    • 1.3 样本容量与样本个数
    • 1.4 重复抽样和不重复抽样
  • 2. 抽样误差
    • 2.1 抽样误差
    • 2.2 影响抽样误差的因素
    • 2.3 抽样平均误差
  • Reference

 突然发现自己掉进了一个大坑......一开始想要搞明白重复抽样与不重复抽样的平均平均误差大小?一想什么鬼,重复抽样、不重复抽样、平均误差大致明白,可是结合起来是什么?后来查了查发现,抽样平均误差又是什么?经过一番查找,大致对抽样有了一点点的了解,但其中仍存在许多问题没有解决;得到了现阶段自己所需要的,及时出坑.....


本文介绍:

  • 抽样的基本概念
  • 抽样误差

1. 抽样的基本概念

1.1 全及总体与样本总体

全及总体是我们所要研究的对象,又称母体,简称总体;是具有某种共同性质的许多单位的集合体

样本总体则是我们所要观察的对象,又称子样,简称样本;样本总体是从全及总体中随机抽样出来的,代表的是全及总体部分单位的集合体

  对于某一次抽样,全及总体是确定的,而样本总体是不确定的,因为由一个全及总体能够随机抽样出许多样本总体;

注意:为求统一,下文中出现的总体即代表全及总体;出现的样本则代表样本总体,即某次抽样得到的样本总体;

1.2 全及指标与抽样指标

全及指标是通过某种方式对总体进行计算得到的指标,这种指标能够反映总体的某种属性或特征,也称总体参数;常用的全及指标有:总体平均数(或总体成数)、总体标准差(或总体方差)

抽样指标是通过某种方式对样本进行计算得到的指标,而这种指标能够反应样本的样本特征,目的是用来估计全及指标的综合指标,称为统计量;可以看出,统计量样本变量的函数;常用的统计量(即抽样指标)有:样本平均数(或抽样成数)、样本标准差(或样本方差)

  同样,对于一个问题,总体是唯一确定的,因此总体参数(即全及指标)也是唯一确定的,它是待估计的数;而统计量(即抽样指标)则是随机变量,它的取值随着样本的不同而变化,肯定的嘛;

注意:为求统一,下文中出现的总体参数即代表全及指标,对应于总体;出现的统计量则代表抽样指标,对应于样本

1.3 样本容量与样本个数

样本容量指的是一次抽样后样本所包含的单位数;通常单位数大于30个称大样本,否则称小样本

样本个数指的是从一个总体中可能抽取的样本(即样本总体)个数,也称样本可能数目

  一个总体有多少样本,则样本统计量就有多少种取值,从而就形成统计量的分布;

1.4 重复抽样和不重复抽样

  重复抽样和不重复抽样表示的是从总体种获取样本的两种不同方式重复抽样指的是在抽样过程中,是又放回的;不重复抽样则表示无放回;

2. 抽样误差

2.1 抽样误差

  由于样本是从总体中随机抽样而来的,正因为随机抽样使样本中各单位的结构不足以代表总体中各单位的结构(其实,也就是说样本无法完全反映总体的特征),而引起的统计量与总体参数(即抽样指标与全及指标)之间的绝对离差,称为抽样误差,也称随机误差;(不包括登记误差、系统性误差)(至于什么是绝对离差?,是指单项数值与平均值之间差的绝对值)

  抽样误差包括:抽样实际误差、抽样平均误差、抽样极限/允许误差

2.2 影响抽样误差的因素

影响抽样误差的因素:

  • 总体各单位标志值的差异程度;
  • 样本的单位数;
  • 抽样的方法;
  • 抽样调查的组织形式;

2.3 抽样平均误差

“终于见到想要看到的东西了,,,,”

2.3.1 抽样平均误差的作用

作用:抽样平均误差的作用是说明统计量(即样本指标)对总体参数(即总体指标)的代表性的高低;即抽样平均误差大,说明统计量对总体参数的代表性低;反之,则高;

2.3.2 抽样平均误差的计算

(1)抽样平均误差是指所有可能的样本指标与总体指标之间的平均差异程度,反应抽样误差的一般水平的指标;

(2)用样本平均数的标准差样本成数的标准差来作为衡量其抽样误差一般水平的尺度。

抽样平均误差的计算根据抽样方式的不同分成:重复抽样计算、不重复抽样计算;

2.3.2.1 样本平均数的抽样平均误差

重复抽样:
\[ \sigma_{\overline{X}} =\dfrac{\sigma}{\sqrt{n}} \]
其中,\(\sigma\)表示总体标准差;\(n\)表示样本容量;

不重复抽样:
\[ \sigma_{\overline{X}} = \sqrt{\dfrac{\sigma^2}{n}(\dfrac{N-n}{N-1})} \]
其中,\(N\)表示总体单位数;

当\(N\)很大的时候,\(N-1\approx N\):
\[ \sigma_{\overline{X}} = \sqrt{\dfrac{\sigma^2}{n}(1-\dfrac{n}{N})} \]
计算抽样平均误差时,用样本标准差\(s\)代替总体标准差;

2.3.2.2 样本成数的抽样平均误差

样本成数的抽样平均误差表明各样本成数和总体成数绝对离差的一般水平;

重复抽样:
\[ \sigma_P = \sqrt{\dfrac{p(1-p)}{n}} \]
其中,\(p\)表示总体成数;\(n\)表示样本单位数;

不重复抽样:
\[ \sigma_P = \sqrt{\dfrac{p(1-p)}{n}(\dfrac{N-n}{N-1})} \]
当\(N\)很大时,
\[ \sigma_P = \sqrt{\dfrac{p(1-p)}{n}(1-\dfrac{n}{N})} \]

总结:可以发现,重复抽样的抽样平均误差大于不重复抽样的抽样平均误差;


大致看到了目前自己想要看明白的阶段,其中具体细节没有深究;例如,计算抽样平均误差的样本平均数样本成数具体怎么定义,以及上述公式如何推导证明?

仍有许多问题存在其中,引用文献中有一篇抽样平均误差计算公式的证明,作者对公式进行了推导,想要弄明白的可以看一下;

Reference

  • 张玲-抽样平均误差计算公式的证明
  • 百度百科-抽样平均误差
  • 百度文库-抽样平均误差

转载于:https://www.cnblogs.com/chenzhen0530/p/10643369.html

重复抽样与不重复抽样的抽样平均误差大小?相关推荐

  1. 重复抽样与非重复抽样

    抽样平均误差是抽样平均数的标准差,它反映抽样平均数与总体平均数的平均差异程度. 1. 重复抽样 μx=σn√ \mu_x=\frac{\sigma}{\sqrt n} 2. 非重复抽样 μx=σ2n⋅ ...

  2. 概率论与数理统计——重复抽样与不重复抽样的判定

    首先来看一下概念 重复抽样 重复抽样又叫重置抽样或放回抽样,是指统计抽样时对每次被抽到的样本登记后再放回总体,重新参与下一次抽选的抽样方法. 重复抽样中每次抽选时,总体待抽选的单位数是不变的,前面被抽 ...

  3. 随机森林中的Bootstrap抽样是有放回抽样么?Bootstrap抽样过程描述一下

    随机森林中的Bootstrap抽样是有放回抽样么?Bootstrap抽样过程描述一下 Bootstrap方法:每当选中一个元组,这个元组同样也可能再次被选中并再次添加到训练集中.例如,想象一台从训练集 ...

  4. pandas删除数据行中的重复数据行、基于dataframe所有列删除重复行、基于特定数据列或者列的作何删除重复行、删除重复行并保留重复行中的最后一行、pandas删除所有重复行(不进行数据保留)

    pandas删除数据行中的重复数据行.基于dataframe所有列删除重复行.基于特定数据列或者列的作何删除重复行.删除重复行并保留重复行中的最后一行.pandas删除所有重复行(不进行数据保留) 目 ...

  5. 【组合数学】生成函数 ( 正整数拆分 | 重复有序拆分 | 不重复有序拆分 | 重复有序拆分方案数证明 )

    文章目录 一.重复有序拆分 二.不重复有序拆分 1.无序拆分基本模型 2.全排列 三.重复有序拆分方案数证明 参考博客 : 按照顺序看 [组合数学]生成函数 简要介绍 ( 生成函数定义 | 牛顿二项式 ...

  6. MySQL 查询重复数据,删除重复数据保留id最小的一条作为唯一数据

    MySQL 查询重复数据,删除重复数据保留id最小的一条作为唯一数据 目录导航: 开发背景: 实战: 表结构如下图所示: 操作: 总结: 回到顶部 开发背景: 最近在做一个批量数据导入到MySQL数据 ...

  7. 剑指offer:在一个排序的链表中,存在重复的结点,请删除该链表中重复的结点,重复的结点不保留,返回链表头指针。

    在一个排序的链表中,存在重复的结点,请删除该链表中重复的结点,重复的结点不保留,返回链表头指针. 例如,链表1->2->3->3->4->4->5 处理后为 1-& ...

  8. python concat去除重复值语句_Python DataFrame使用drop_duplicates()函数去重(保留重复值,取重复值)...

    摘要 在进行数据分析时,我们经常需要对DataFrame去重,但有时候也会需要只保留重复值. 这里就简单的介绍一下对于DataFrame去重和取重复值的操作. 创建DataFrame 这里首先创建一个 ...

  9. 打印出重复的姓名和重复的次数,并按重复次数排序:

    读取文件内容, 打印出重复的姓名和重复的次数,并按重复次数排序: package com;import java.io.*; import java.util.*;/* 打印出重复的姓名和重复的次数, ...

  10. 从类似如下的文本文件中读取出所有的姓名,并打印出重复的姓名和重复的次数

    一些经验总结: 1.对于读取文件,大家要熟记BufferedReader类,他可以一次读取一行,在很多的笔试题会遇到这样的例子,但是判断读取结束的标志并不是我们平时所见的-1,而是null. 2.可以 ...

最新文章

  1. MIT给人工智能“泼冷水”:AI创造性目前有限
  2. 数据库-MySQL-搭建服务器
  3. 【BZOJ1854】【codevs3358】游戏,二分图最大匹配
  4. Office Word2019您正试图运行的函数包含有宏或需要宏语言
  5. JS获取鼠标的坐标和滚动条的位置
  6. php5 Trace如何配置,配置参考 · ThinkPHP5.0完全开发手册 · 看云
  7. 【UVA1339】古老的密码(巧妙思路+(q)sort降序排列的三种方法)
  8. CCS下载MSP430编译遇到的几个小问题
  9. M1 mac 安装打印机驱动程序
  10. i9023 中国联通 3G 西安信息中心号码
  11. 贝壳DMP平台建设实践
  12. 深入理解Plasma(四):Plasma Cash
  13. 网络工程师十月份免费讲座
  14. CAD关于图层隐藏图层操作(com接口c#语言)
  15. rz cz命令未找到
  16. Centos 7 开机一直转圈 提示failed to load SELinux policy freezing的解决方法
  17. c语言语法要素,第6章DSP_C语言程序设计要素.ppt
  18. Linux 安装图形化界面
  19. 计算机应用基础搜题答案,2017计算机应用基础试题及答案
  20. 实用工具分享-桌面美化软件Fences

热门文章

  1. 《程序员情商》沟通能力练习基本功——趣味绕口令
  2. SXLib3D -- 一款高效的点云和网格交互处理平台
  3. matlab停止运行命令_matlab终止运行命令
  4. 计算机网络之子网掩码,子网掩码
  5. excel中如何解锁锁定单元格
  6. 计算机中单位换算tb,bit Byte KB MB GB TB 单位换算
  7. 百旺如何看是否清卡_百旺税控怎么看反写成功
  8. python表格绘制斜线表头_Java中使用POI在Excel单元格中画斜线—XLSX格式
  9. 北邮机器人队2020预备队培训(七) ——仿真文件介绍
  10. 光纤通道交换机的全球与中国市场2022-2028年:技术、参与者、趋势、市场规模及占有率研究报告