数据抽样方式可分为概率抽样和非概率抽样,抽样的目的是减少数据量,以小群体样本来进行分析,得出针对全体或某一类的适用结论。

抽样样本的好坏需要依据研究的具体问题而定,不同的研究问题,对抽样样本的要求会有所差异,样本的抽样方式也有所不同。

概率抽样

定义:采用随机的方式,在所有样本中,每个样本都有可能被采样到。这里注意随机与随便的区别,随机是没有主观意识存在的,每个样本都有一定概率被抽中,而随便抽样,则带有人为的主观意识,受人为思想、喜好的影响。

适用场景:以小样本抽样来估计整体样本的特征

特点:专业性强,估计的精度可衡量,成本相对非概率抽样要高

概率抽样方法:简单随机抽样、分层抽样(分类,从每个类中独立、随机抽取)、整群抽样(将样本画组,整组抽取)、系统抽样(将样本顺序排序,按照一定的规则进行抽样,如间隔1个样本抽取一次样本),多阶抽样(基于整群抽样的结果,再进行随机概率抽样)

非概率抽样

定义:相对于概率抽样而言,根据研究目的的要求,抽取部分样本进行调查研究,不保证每个样本都有一定概率被抽中。

适用场景:进行初步调研,探索性的研究,快速掌握基本信息

特点:简单、快速、成本低,专业度不高

非概率抽样方法:方便抽样(顾名思议,怎么方便怎么来)、判断抽样(依据经验,有目的的选择样本)、自愿抽样(顾名思议,样本自身主动参与)、滚雪球抽样(样本稀少情况下,由基本样本推荐其他样本,逐步扩大)

总结

在进行一个课题研究的时候,采用哪种抽样方式,需要依赖很多因素综合评估,更多时候是概率抽样和非概率抽样都会使用,相辅相成。

数据抽样方式:概率抽样、非概率抽样相关推荐

  1. 【机器学习基础】kaggle竞赛中数据抽样方式

    什么情况下需要会用到抽样 数据量太大,计算能力不足. 抽样调查,小部分数据即可反应全局情况. 时效要求,通过抽样快速实现概念验证. 定性分析的工作需要. 无法实现全覆盖的场景,比如满意度调查等. 解决 ...

  2. pandas数据预处理(标准化归一化、离散化/分箱/分桶、分类数据处理、时间类型数据处理、样本类别分布不均衡数据处理、数据抽样)

    1. 数值型数据的处理 1.1 标准化&归一化 数据标准化是一个常用的数据预处理操作,目的是处理不同规模和量纲的数据,使其缩放到相同的数据区间和范围,以减少规模.特征.分布差异等对模型的影响. ...

  3. C#调用C++的DLL 所有数据类型转换方式

    本以为这篇搜集整理的代码会是很不错的文章,花了一天时间,搜索到最后居然出来一篇叫做"C# 与 C++ 数据类型对照表"的文章.几乎囊括掉和大部分的数据了,太打击我了. 本文中有部分 ...

  4. 引擎: 决定数据库存取数据的方式 = 不同的特点 = 不同的用户体验 数据类型: 规定了数据库可以存放哪些数据 约束: 限制存储数据的规则 键...

    Microsoft Windows [版本 10.0.17134.472] (c) 2018 Microsoft Corporation.保留所有权利. C:\Users\Administrator& ...

  5. 高效的数据压缩编码方式 Protobuf

    高效的数据压缩编码方式 Protobuf github地址 目录 ProtocolBuffers 是什么 为什么要发明 ProtocolBuffers proto3 定义 Message 分配字段编号 ...

  6. 计算机网络(二十三)-网络层-概述与数据交换方式

    一.网络层的功能 主要任务是把分组从源端传送到目的端,为分组交换网上的不同主机提供通信服务. 网络层传输单位是数据报. 功能 路由选择与分组转发,最佳路径. 异构网络互联: 拥塞控制: 若所有结点都来 ...

  7. printf 规定数据输出方式

    功能 c语言中产生格式化输出的函数(定义在 stdio.h 中).向终端输出(显示器等) 用法 int printf(const char *format,[argument]); format 参数 ...

  8. 【clickhouse】ClickHouse表引擎 MergeTree 索引与数据存储方式 一级索引 二级索引

    1.概述 转载:ClickHouse表引擎 MergeTree 索引与数据存储方式 2.一级索引 MergeTree 主键使用 primary key 定义,定义主键后,会将数据依据 index_gr ...

  9. IOS的四种数据存储方式及优劣

    IOS有四种经常使用数据存储方式: 第一种方法:用NSUserDefaults存储配置信息 NSUserDefaults被设计用来存储设备和应用的配置信息.它通过一个工厂方法返回默认的.也是最经常使用 ...

  10. 如何读出烧录程序.bin的数据_如何改变程序搜索数据的方式?使用Redis进行搜索...

    当用户在文本编辑器或者文字处理软件中搜索一个单词或者句子的时候,软件就会对文件进行扫描并寻找那个单词或者句子.如果读者曾经使用过Linux.Unix或者OS X的grep程序,或者曾经使用过Windo ...

最新文章

  1. 汉字转拼音php代码函数,php中将汉字转换成拼音的函数代码
  2. 轻松简单地开发Web Services 2
  3. java的对象对象映射_Java对象到对象映射器
  4. c# 中关键字_C#中的“使用”关键字
  5. c#winform使用WebBrowser 大全[超长文转载]
  6. java对象间的转型,详细讲述Java中的对象转型
  7. 4fsk调制matlab_数字调制解调技术的MATLAB与FPGA实现
  8. amazeui学习笔记--css(布局相关2)--等分网格 AVG Grid
  9. LSTM训练过程与参数解读
  10. google地图网页版_谷歌收录查询方法大全,如何让Google快速收录网页?
  11. 突破电信80端口封锁,用CDN架设公司服务器!
  12. win10麦克风说话没声音_电脑版微信,语音通话无声音的解决
  13. 360与腾讯之争,作为程序员,是愿意自己的项目进入市场得到些成功就被腾讯抄袭,还是软件刚一发布出去,就被360查杀?
  14. python%是什么意思_%在Python中是什么意思?
  15. GDOI2017滚粗记
  16. 用while输出1到100的偶数python_用while语句,求1到100的偶数之和
  17. lwip连续发数据卡死_用lwip发送大量数据时,遇到的问题解答记录;
  18. 【PTA乙级】【1096 大美数 (15 分)】
  19. 配置log4j2.xml输出MyBatis的SQL日志
  20. 2023年Android现代开发

热门文章

  1. 电动汽车电池换电站选址与定容(Matlab代码实现)
  2. 杭州师范大学计算机科学与技术怎么样,杭州师范大学怎么样 王牌专业有哪些...
  3. 北京联通dns服务器位置,全国联通DNS服务器地址
  4. 短视频发布之前要注意什么?从配音到发布时间,选对才能吸粉引流
  5. Win10字体模糊怎么办?
  6. 计算机里的硬盘分区,Disk Genius对电脑硬盘分区的详细步骤
  7. java继承动物类_Java之继承
  8. Python实战(07):使用selenium刷访问量
  9. AVC与HEVC的差异-帧内预测
  10. IT行业未来发展前景如何?