概率抽样 probability sampling

概率抽样,也称随机抽样,是指遵循随机原则进行的抽样,总体中每个单位都有一定的机会呗选入样本。概率抽样具有如下特点:

  1. 抽样时是按一定的概率以随机原则抽取样本,使每个单位都有一定的机会被抽中
  2. 每个单位被抽中的概率是已知的,或者是可以计算出来的
  3. 当用样本估计参数时,要考虑到每个样本单位被抽中的概率

入样概率 sampling probability

每个样本单位被抽中的概率。

抽样框 sampling frame

抽样框是指对选择作为样本的总体单位列出名册或排序编号,以确定总体的抽样范围和结构。

简单随机抽样 simple random sampling

简单随机抽样就是从包括总体N个单位的抽样框中随机地、一个个地抽取n个单位作为样本,每个单位的入样概率是相等的。【批:简单随机抽样对抽样框的要求非常高,在实际调查中往往很难实现】

分层抽样 stratified sampling

分层抽样是将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本。将各层的样本结合起来,对总体的目标量进行估计。分层抽样具有如下优点:

  1. 保证样本中包含各种特征的抽样单位,样本结构与总体结构比较接近
  2. 为组织实施调查提供了便利
  3. 既可以估计总体参数,也可以估计各层的目标量

整群抽样 cluster sampling

将总体中若干个单位合并为组,这样的组称为群。抽样时直接抽取群,然后对中选群中的所有单位全部实施调查,这样的抽样方法称为整群抽样。整群抽样具有如下特点:

  1. 简化编制抽样框的工作量
  2. 节省调查费用,方便调查的实施
  3. 因为同一群内的单位或多或少有些相似,精度交叉,抽样误差比较大

系统抽样 systematic sampling

将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位,这种抽样方法称为系统抽样。系统抽样具有如下特点:

  1. 如果有辅助信息将总体内的单位有组织地排列,可以有效地提高估计的精度
  2. 估计量方差的估计比较困难

多阶段抽样 multi-stage sampling

采用类似整群抽样的方法,首先抽取群,但并不是调查群内的所有单位,而是再进一步抽样,从选中的群中抽取出若干个单位进行调查因为取得这些接受调查的单位需要两个步骤,所以将这种抽样方式称为二阶段抽样。这里,群是初级抽样单位,第二阶段抽取的是最终抽样单位。将这种方法推广,使抽样的段数增多,就称为多阶段抽样。

二阶段抽样 two-stage sampling

初级抽样单位 PSUs (primary sampling unit)

最终抽样单位 final sampling unit

非概率抽样 non-probability sampling

非概率抽样是相对于概率抽样而言的,指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。非概率抽样包括方便抽样、判断抽样、自愿样本、滚雪球抽样和配额抽样。

方便抽样 convenience sampling

调查过程中由调查员依据方便的原则,自行抽取样本。方便抽样具有如下特点:

  1. 方便粘稠样,调查的成本低
  2. 样本选择带有随意性,将调查结果推广到总体是没有任何意义的

判断抽样 judgement sampling

判断抽样是指研究人员根据经验、判断和对研究对象的了解,有目的地选择一些单位作为样本,实施时根据不同的目的有重点抽样、典型抽样、代表抽样等方式。

重点抽样 importance sampling:重点抽样是从调查对象的全部单位中选择少数重点单位,对其实施调查。

典型抽样 typical sampling:典型抽样是从总体中选择若干个典型的单位进行深入的调研,目的是同构典型单位来描述或解释所研究问题的本质和规律。

代表抽样 representative sample:代表抽样是通过分析,选择具有代表性的单位作为样本,在某种程度上,也具有典型抽样的含义。

自愿样本 voluntary sampling

自愿样本值被调查者自愿参加,称为样本中的一份子,向调查人员提供有关信息。

滚雪球抽样 snowball sampling

滚雪球抽样往往用于对稀少群体的调查。在滚雪球抽样中,首先选择一组调查单位,对其实施调查之后,再请他们提供另外一些属于研究总体的研究对象,调查人员根据所提供的线索,进行此后的调查。这个过程持续下去,就会形成滚雪球效应。

配额抽样 quota sampling

配额抽样类似于概率抽样中的分层抽样,在市场调查中有广泛的应用。它是首先将总体中的所有单位按一定的标志(变量)分为若干类,然后在每个类中采用方便抽样或判断抽样的方式选取样本单位。这种抽样方式操作比较简单,而且可以保证总体中不同类别的单位都能包括在所抽的样本中,使得样本的结构和总体的结构类似。【批:配额抽样仅能保证在配额变量上,样本的结构和总体的结构类似,但不能保证在其他变量上的结构也相似】

CATI = computer assisted telephone interview

计算机辅助电话调查(CATI)系统把计算机与电话访问连接起来,调查的问卷被输入计算机,调查员在计算机屏幕前操作,随机样本的抽选由计算机完成,由计算机进行自动拨号,调查员将调查结果输入计算机。【批:我也不知道现在业内是否还在使用这种方法进行调查】

实验组 experiment group

实验组是指随机抽选的实验对象的子集。在这个子集中,每个单位接受某种特别的处理。【批:这种特别的处理通常称为实验刺激;因此实验组与对照组的差异可以简单的描述为是否接受实验刺激】

对照组 control group

对照组中,每个单位不接受实验组成员所接受的某种特别的处理。

抽样误差 sampling error

抽样误差是由抽样的随机性引起的样本结果与总体真值之间的误差。在概率抽样中,我们依据随机原则抽取样本,可能抽中由这样一些单位组成的样本,也可能抽中由另外一些单位组成的样本。根据不同的样本,可以得到不同的观测结果。

非抽样误差 non-sampling error

非抽样误差是相对抽样误差而言的,是指除抽样误差之外的,由其他原因引起的样本观察结果与总体真值之间的差异。抽样误差是一种随机性误差,只是存在于概率抽样中【批:抽样误差并不是仅存在于概率抽样中,任何抽样都会存在抽样误差;只是在非概率抽样中,因为不是按照随机抽样原则抽取的样本,因此抽样误差无法确定】;非抽样误差则不同,无论是概率抽样、非概率抽样,或者在全面调查中,都有可能产生非抽样误差。非抽样误差包括抽样框误差、回答误差、无回答误差、调查员误差、测量误差。

《统计学》笔记:第2章 数据的搜集相关推荐

  1. 《统计学》——思考题第二章数据的搜集(贾俊平)

    目录 1.什么是二手资料?使用二手资料需要注意些什么? 2.比较概率抽样和非概率抽样的特点.举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样. 3.调查中搜集数据的方法主要有自填式.面 ...

  2. 软考-中级-网络工程师-笔记-第2章-数据通信基础

    软考-中级-网络工程师-笔记-第1章-计算机网络概论 第2章 数据通信基础 2.1 数据通信的基础概念 模拟信号-连续的 数字型号-离散到 来奎斯特 香农定理 2.2 信道特性 2.2.1 信道带宽 ...

  3. 统计学笔记:赤裸裸的数据任人打扮

    拖拖拉拉两个月,终于看完了今年第一本书--<赤裸裸的统计学>,本书作者采用故事性叙述,梳理了统计学中基础而关键的知识点,作为统计学的科普读物,表述更容易让外行人接受.笔者根据自身理解对其中 ...

  4. DDIA笔记—第六章 数据分区

    第六章 数据分区 数据分区与数据复制 分区通常与复制结合使用,即每个分区在多个节点都存在副本,这就意味着某条记录属于特定的分区,而同样的内容会保存在不同的节点上以提高系统的容错性. 每个节点同时充当某 ...

  5. vb教材笔记_VB课堂笔记-----第五章 数据的输入与输出

    第五章 数据的输入与输出(笔试2-4分) 需要掌握:3个方法.2个函数.1个语句 一.Print输出方法 格式: 对象名.Print 表达式-- 功能:输出表达式的结果(计算和输出) 注: 1)对象名 ...

  6. MySQL学习笔记——第3章 数据表的管理和表中数据操纵

    第3章 数据表的管理和表中数据操纵 3.1 MySQL数据类型 数字类型:数字类型包括整数类型和数值类型 整数类型:TINYINT.SMALLINT.MEDIUMINT.INT和BIGINT 数值类型 ...

  7. 人大版统计学教材第六版学习笔记--第3章 数据的图表展示

    合理使用图表描述统计结果是应用统计的基本技能之一. 文章目录 数据的预处理 数据审核 数据筛选 数据排序 数据透视表 定性数据的整理与展示 分类数据的整理与图示 数据的整理与计算 分类数据的图示 顺序 ...

  8. python数据分析第七章实训3_《利用python进行数据分析》读书笔记--第七章 数据规整化:清理、转换、合并、重塑(二)...

    3.数据转换 介绍完数据的重排之后,下面介绍数据的过滤.清理.以及其他转换工作. 去重 #-*- encoding: utf-8 -*- importnumpy as npimportpandas a ...

  9. DDIA读书笔记 第五章 数据同步

    数据同步 多主 无主 主从关系 同步方式 同步同步 异步同步 半同步同步 同步滞后 read-after-write 一致性 单调读一致性 前缀一致读 实现 基于语句 基于WAL 基于行 拓扑结构 环 ...

  10. 第二行代码学习笔记——第六章:数据储存全方案——详解持久化技术

    本章要点 任何一个应用程序,总是不停的和数据打交道. 瞬时数据:指储存在内存当中,有可能因为程序关闭或其他原因导致内存被回收而丢失的数据. 数据持久化技术,为了解决关键性数据的丢失. 6.1 持久化技 ...

最新文章

  1. Qt4在linux下的安装
  2. 深圳杯---垃圾焚烧厂的经济补偿问题
  3. 粤港澳大湾区菜篮子-哲商对话·林裕豪:从玉农业谋定大健康
  4. iOS ffmpeg 之编译ffmpeg
  5. String和enum的互相转换
  6. eclipse中护眼色设置
  7. 查看电脑重启日志_系统日志看硬盘故障图文教程,电脑日志查看磁盘硬盘坏道问题方法...
  8. Python学习入门基础:文件读写操作、模块和包、异常
  9. 如何基于TensorFlow使用LSTM和CNN实现时序分类任务
  10. 【u107】数字游戏(bds)
  11. java中priorityqueue_详解JAVA中priorityqueue的具体使用
  12. markdown生成html不出效果,mdeditor: 简单markdown编辑器,同步预览html效果。不依赖任何插件,使用简单,原创,造轮子中。。。更新中。。。...
  13. 土壤类型空间分布数据介绍
  14. 个人时间和任务管理工具GTD大盘点!你适合哪一款?
  15. 网桥(Bridge)作用详解
  16. 申请手册:英国百所大学中文名称及网址
  17. 3D MAX 2014学习地址
  18. 怎么给固定资产安装标签
  19. vue h5端实现富文本图片预览(基于 Vant 的 ImagePreview 组件)
  20. 微信小程序和微信小游戏的区别体现在哪?

热门文章

  1. 用户画像 客户消费模型表
  2. R语言TCGA数据下载及处理biolinks包的学习与使用(一)数据下载
  3. 科技风UI除了蓝色,还有什么配色选择?
  4. 西餐菜单怎么翻译成英文
  5. sap 流程图 退货销售订单_ERP系统:退货流程的解决方案
  6. 激光导航AGV的停车精度受环境变化的影响有多大?
  7. 增强 扫描王 源码_制作一个类“全能扫描王”的简易扫描软件(opencv)
  8. c语言setlocale第二个参数,关于setlocale函数的参数问题
  9. Unity导入图片为何会失真
  10. i18n国际语言代码对照表