学习目标目标

知道总体、样本、样本大小、样本数量

知道样本统计量和总体统计量

知道总体分布、样本分布和抽样分布

知道常用的抽样方法

某糖果公司研发了一种超长效口香糖,为了得到口味持续时间的数据,公司聘请了试吃者帮忙完成检验,结果却让人大跌眼镜!

没文化,真可怕!我该怎么办? 有时候数据很容易收集,例如参加健身俱乐部的人的年龄,后这一家游戏公司的销售数据。但有时候不太容易,该怎么办呢? 是时候拿出终极武器了— 抽样

1.抽样相关概念

总体:是指研究对象的整个群体。

公司生产的一批糖果

样本:是从总体中选取的一部分,用于代表总体的整体情况。

在这批糖果中随机抽取50颗糖果

样本数量:又叫样本空间,是表示有多少个样本。

在这批糖果中随机抽取50颗糖果,抽5次:样本数量=5

样本大小:也叫样本容量,表示每个样本里有多少个数据。

每个样本50颗糖果:样本大小=50

统计量:

统计量是对数据进行统计得到的量,例如:均值、方差、标准差、比例等。总体统计量:总体XX

对总体进行统计得到的统计量总体均值$$\mu$$:整批所有糖果数据的均值

总体方差$$\sigma^2$$:整批所有糖果数据的方差

样本统计量:样本XX

对样本进行统计得到的统计量样本均值$$\bar{X}$$:抽取的某个样本糖果数据的均值

样本方差$$S^2$$:抽取的某个样本糖果数据的方差

分布:总体分布

总体数据的概率分布:整批所有糖果数据的概率分布往往未知,很多时候无法获得总体所有元素的观测值

可以通过理论计算进行假定

样本分布

抽取的样本中数据的概率分布:抽取的某个样本糖果数据的概率分布假设总体大小为m,样本大小为n,n趋近于m时,样本分布趋近于总体分布

样本分布又称经验分布

注意:样本分布与总体分布近似(抽样正确的前提下)抽样分布对样本统计量概率分布的一种描述:所有样本均值的概率分布

2.抽样方法

​ 抽样的目的是为了通过样本获得总体的信息,所以关键点是怎么抽样才能保证获得的样本具有代表性,下面,我们简单介绍几种常用的抽样方法。简单随机抽样(simple random sampling)。原理和我们抽扑克牌、抽奖一样,就是从一个固定的总体中(比如有N个对象),利用抽签或其他随机方法(如随机数表)抽取n个对象。所谓随机,是指总体中每一个对象被抽中的概率相等。假设两个人抽扑克牌比大小,两个人抽中大王的概率其实一样,都是1/54。

系统抽样(systematic sampling)。这种抽样方法的核心在于确定一个所谓的“抽样间隔”。比如将总体对象随机编号,从1至100,我们只抽取编号个位数是7的对象,即编号为7,17,27,…的样本,本质上他们相邻的编号有一个固定的间隔——10。

分层抽样(stratified sampling),是指先将总体按照某种特征分为若干层,比如按照性别分为男女两层,然后再从每一层内进行简单随机抽样。分层的目的就在于提升样本对总体的代表性,提高估计的精确度,比如一般的理工院校男生多女生少,采用分层抽样可以保证男性和女性样本都能被抽中。

整群抽样(cluster sampling),是将总体分成几个群,比如我国开展的大型调查一般会以省或地区为群,先采用简单随机抽样的方法抽取群,然后从抽中的群中再抽取相关的个体进行研究。现实过程中可以将抽中的群中的所有对象作为研究样本,也可以在群内部再次进行抽样获得部分调查对象作为样本。

3.小结抽样相关概念 【知道】

总体:是指研究对象的整个群体。

样本:从总体中选取的一部分

样本大小:每个样本里有多少个数据

样本数量:表示有多少个样本。

统计量

总体XX

总体均值$$\mu$$

总体方差$$\sigma^2$$

样本XX

样本均值$$\bar{X}$$

样本方差$$S^2$$

分布:

总体分布

样本分布

抽样分布

抽样方法 【知道】

简单随机抽样:随机抽

系统抽样:等间隔抽

分层抽样:每种分别抽

整群抽样:直接抽一拨

python按指定概率抽样_python:抽样和抽样方法相关推荐

  1. python找指定内容_python查找指定具有相同内容文件的方法

    本文实例讲述了python查找指定具有相同内容文件的方法.分享给大家供大家参考.具体如下: python代码用于查找指定具有相同内容的文件,可以同时指定多个目录 调用方式:python doubles ...

  2. python输出指定字符串_Python输出指定字符串的方法

    输入一串字符,由字母.数字和空格组成,长度 < 1000, 判断其中是否存在日期格式的数据.日期格式的数据具有如下的特征,连续包含年份和月份信息.年份信息是指连续的四个数字,之后是 Jan, F ...

  3. python删除指定字符_python删除字符串中指定字符的方法

    最近开始学机器学习,学习分析垃圾邮件,其中有一部分是要求去除一段字符中的标点符号,查了一下,网上的大多很复杂例如这样 import re temp = "司法局让我和户 1 5. 8 0. ...

  4. python格式化字符串漏洞_Python字符串格式化的方法(两种)

    本文介绍了Python字符串格式化,主要有两种方法,分享给大家,具体如下 用于字符串的拼接,性能更优. 字符串格式化有两种方式:百分号方式.format方式. 百分号方式比较老,而format方式是比 ...

  5. python中len字典_Python 字典(Dictionary) len()方法

    Python 字典(Dictionary) len()方法 描述 Python 字典(Dictionary) len() 函数计算字典元素个数,即键的总数.高佣联盟 www.cgewang.com 语 ...

  6. python深入与提高_Python深入01 特殊方法与多范式

    Python一切皆对象,但同时,Python还是一个多范式语言(multi-paradigm),你不仅可以使用面向对象的方式来编写程序,还可以用面向过程的方式来编写相同功能的程序(还有函数式.声明式等 ...

  7. python按指定概率抽样_概率加权的随机抽样 (Weighted Random Sampling) – A-Res 蓄水池算法...

    概率加权的随机抽样 (Weighted Random Sampling) – A-Res 蓄水池算法 2017-11-20 18:51:10 旧日重来 最近,Aulddays 遇到一个随机抽样任务.有 ...

  8. python 查找指定文件_python实现在目录中查找指定文件的方法

    本文实例讲述了python实现在目录中查找指定文件的方法.分享给大家供大家参考.具体实现方法如下: 1. 模糊查找 代码如下: import os from glob import glob #用到了 ...

  9. python截取指定字符串_python 正则匹配获取指定多个词的在字符串(句子/段落)索引位置...

    python 正则匹配获取指定多个词的在字符串(句子/段落)索引位置 利用re.finditer()特性. finditer() 返回一个MatchObject类型的iterator,它提供了匹配对象 ...

最新文章

  1. 2020年Spring Cloud最后一个大版本发布!
  2. 《快活帮》第九次团队作业:Beta冲刺与验收准备
  3. request的setAttribute()怎么用的?
  4. Cytology: Diagnostic Principles and Clinical Correlates 细胞学: 诊断原则与临床相关性 PDF
  5. c:if test=/c:if 使用
  6. 第一类修正贝塞尔函数的C语言实现
  7. centos下搭建Jenkins持续集成环境(安装jenkins)
  8. 2022年中国AI芯片行业深度研究
  9. 再谈JavaScript时钟中的16ms精度问题.
  10. [导入]Reporting Services 3: 报表模型项目
  11. 前端求职简历模板,一投即过!
  12. java 安卓 物联网_面向物联网的Android应用开发与实践
  13. 魔窗-企业级Deeplink解决方案,你的App增长引擎!
  14. 通过U盘安装Windows11时遇此设备不支持升级时的解决办法
  15. RMAN Recipes 中对Flash Recovery Area的总结
  16. 关于结构化,半结构化,非结构化数据的理解
  17. thinkphp核心 伯乐发卡系统高级版PHP网站源码 已去授权无后门_已测
  18. python抓取360图片之马自达
  19. 博客大巴,自动登录,并发布信息开发小计。
  20. 几种MySQL高可用方案整理

热门文章

  1. 阿里云SLB健康检查探究
  2. 你可能用错了 kafka 的重试机制
  3. java+jsp基于ssm的智慧医疗系统医院挂号就诊系统-计算机毕业设计
  4. 创建 vue 手脚架
  5. springboot/vue前后端分离后台管理系统增删改查
  6. Vue项目实战:接口错误拦截与环境设置
  7. 高德地图获取当前屏幕中心点的经纬度
  8. 设置多用户同时登录Windows远程桌面
  9. oracle workflow test,oracle workflow常见问题的解决方案
  10. 大规模流量的网站架构