统计学系列目录(文末有大奖赠送
统计学①——概率论基础及业务实战
统计学②——概率分布(几何,二项,泊松,正态分布)
统计学④——置信区间
统计学⑤——假设验证

一、总体与样本定义

总体:所研究的所有事件的集合
样本:是从总体中抽出的数量相对较小的集合,可用于做出对总体的结论

二、抽样方法

我们希望抽取的样本分布和总体分布一致,这样用样本估计总体会比较准确,这种样本叫作无偏样本。

无偏样本的抽样方法
简单随机抽样:抽签,随机编号生成器,有放回抽样和不放回两种
分层抽样:将总体分为几个层,层内部相似,层与层之间差距较大,再对每一层进行简单随机抽样
整群抽样:将总体分为几个群,群与群之间相似,随机抽取几个群作为样本
系统抽样:随机选取一个数据K,每次到第K个抽样单位就抽一次

三、总体参数的估计

①总体均值
当通过抽样获得无偏样本后,可以直接用样本的均值来估计总体的均值,如下:


②总体方差
方差是否可以直接用样本方差呢?答案是No,因为方差衡量的是分散性,样本相对总体而言,数量较少,可能会将一些异常值排除在外,导致样本的方差要少于总体

如果要确切知道总体的方差,并且拥有总体的数据,方差的计算如下:

如果需要用样本估计总体的方差,计算如下:

之所以用n-1而不是n,,是因为n-1会使得方差稍微大一些,更接近总体方差

③总体比例
样本比例直接估计总体比例

四、比例抽样分布

当考虑从一个总体中抽取所有大小为n的样本,由这些样本中的某个比例所形成的分布,就叫比例的抽样分布,一般用Ps表示样本比例变量

一般用来求解这类问题:当得知公司生产的糖果有25%的红色的,那么随机抽取100个样本,至少有50%的糖果是红色的概率?

Ps的期望和方差定义为:

如果n>30时,二项分布可以近似为正态分布

需要进行连续性修正

五、均值抽样分布

如果考虑从一个总体中抽出所有大小为n的样本,然后用这些样本的均值形成一个分布,那么这个分布就叫均值抽样分布。

一般用来求解这类问题:总体中每个袋子平均有10颗糖,那么随机抽取一个袋子中糖的个数小于8的概率是多少?

期望和方差的计算如下:

样本的均值期望就是总体的均值,而方差却不等于总体方差,这里是为什么呢?

因为总体方差衡量的是总体样本的分散性,而均值方差衡量的是所有抽取的样本的均值的分散性,是2个不同的东西。用总体的方差/n 表示随着样本数量增多,样本均值方差会越来越小,意味着样本均值越来越接近于总体均值

如果总体符合均值为μ,方差为σ^2的正态分布,那么抽取的样本均值符合如下分布:

如果总体不是正态分布时,那样本均值还会符合上述分布吗?答案是看情况,如果抽取的样本n很大时,还是符合上述分布的,这里要重点引出中心极限定理:

中心极限定理可以运用于:

① 如果总体属于二项分布,用X~B(n,p)表示,n>30,则样本均值的抽样分布近似N(np,pq/n)
② 如果总体属于泊松分布,用Po(λ)表示,n>30,则样本均值的抽样分布近似N(λ,λ/n)

因为均值的抽样分布属于正态分布,就可以通过标准化再差概率表得到特定样本均值的概率了


本人互联网数据分析师,目前已出Excel,SQL,Pandas,Matplotlib,Seaborn,机器学习,统计学,个性推荐,关联算法,工作总结系列。


微信搜索并关注 " 数据小斑马" 公众号,回复“统计”可以免费获取下方深入浅出统计学、统计学原理、赤裸裸的统计学9本统计学入门到精通必备经典教材

统计学③——总体与样本的差异在哪里相关推荐

  1. 【定量分析、量化金融与统计学】统计推断基础(1)---总体、样本、标准差、标准误

    目录 一.前言 二.总体与样本 1.总体(population)的概念 2.总体的性质与参数 首先是:平均数(mean)µ 标准差(standard deviation,SD)σ希腊字母sigma 3 ...

  2. 深入浅出统计学(十一)总体和样本的估计

    基本概念 . 问题 章节理解 上一章主要讲解如何用样本估计总体参数 这一章主要是讲解如何用总体估计样本的概率分布

  3. 【统计学】从样本到总体

    总体和样本均值的符号: n = 样本容量 u = 总体均值 x = 样本均值 σ = 总体标准差 s = 样本标准差 样本均值分布的特征: 对于任何样本均值的分布: 样本容量越大,样本均值的分布越接近 ...

  4. 【读书笔记->统计学】11-02 总体和样本的估计-总体比例、样本比例、根据总体预测样本比例概念简介

    总体比例与样本比例 假设一个情境:曼帝糖果公司再一次进行了抽样,以便利用调查结果预测:总体中有多大比例的人"可能偏爱曼帝公司的糖球". 结果发现,在40个人中有32个人偏爱他们的口 ...

  5. 【读书笔记->统计学】11-03 总体和样本的估计-样本均值的概率、中心极限定理概念简介

    样本均值的概率 假设一个情境:曼帝糖果公司也生产小袋装糖球,每一个小包装袋里的糖球数目均值为10,方差为1.然而,有一个顾客买了30袋糖球,结果发现每袋糖球中的糖球平均数目只有8.5.求这种事情发生概 ...

  6. 数理统计-5.1 总体与样本

    **总体:**在一个统计问题中,我们把研究对象的全体成为全体 **个体:**构成总体的每个成员 用概率分布可描述与归纳总体,总体可看作是一个分布 从总体中抽样等价于从分布中抽样 总体分为有限总体与无限 ...

  7. 统计学②——概率分布(几何,二项,泊松,正态分布)

    统计学系列目录(文末有大奖赠送): 统计学①--概率论基础及业务实战 统计学③--总体与样本 统计学④--置信区间 统计学⑤--假设验证 概率分布描述了一个给定变量的所有可能取值结果的概率,历史上伟大 ...

  8. 统计学④——置信区间怎么算

    统计学系列目录(文末有惊喜彩蛋): 统计学①--概率论基础及业务实战 统计学②--概率分布(几何,二项,泊松,正态分布) 统计学③--总体与样本 统计学⑤--假设验证 上一篇写了如何通过样本的均值和方 ...

  9. 统计学⑤——假设验证

    统计学系列目录(文末有大奖赠送): 统计学①--概率论基础及业务实战 统计学②--概率分布(几何,二项,泊松,正态分布) 统计学③--总体与样本 统计学④--置信区间 一.什么是假设验证? 当你从广告 ...

  10. 统计学名词解释 —— 2. 什么是「总体」和「样本」

    总体和样本 如果一个集合X,包含若干样本{x1,x2,⋯,xn}\{ x_1, x_2, \cdots, x_n\}{x1​,x2​,⋯,xn​},这里的 X就被称为总体 ,xix_ixi​则被称为总 ...

最新文章

  1. mysql常用语句列表
  2. easyui messager 消息框 对话框
  3. 如何从用户体验的角度去做一个网站的页面设计
  4. P2617 Dynamic Rankings(带修主席树)
  5. c++怎么保存汉字_“的汉字 ”写作练习
  6. 将Redis集成到您的Spring项目中
  7. 使用Spring Boot对REST URL进行集成测试
  8. 二分图的最大匹配问题
  9. 时尚美妆图片,让你饱眼福的唯美壁纸
  10. 基础02Random类、ArrayList类
  11. 博图15怎么看各种功能块说明_西门子STEP7常用功能块说明
  12. Ruby新手入门之gem配置
  13. 配置标准IP ACL实验
  14. 搜狗主动提交url并反馈快照更新软件(含源码)
  15. 【牛客网】马三来刷题之顺时针旋转矩阵
  16. js jq 按钮开始/停止转换
  17. 4 款超级好用的终端文件管理器
  18. 干货 | 足式机器人运动控制发展方向——轨迹优化
  19. java_09.Linux:远程登录_可以用putty也可以用SecureCRT或者Xshell5【关闭防火墙,或者关闭一些必要的防火墙才能远程登录】Linux能ping通windows,window
  20. java笔试完一般多久给通知_笔试之后多久收到面试通知?

热门文章

  1. 最短路径(dijistra和floyd算法)
  2. win10任务栏假死问题
  3. 【VMware】NAT模式、桥接模式、仅主机模式
  4. SpringBoot统一异常拦截处理
  5. kuka机器人码垛编程网盘_kuka机器人循环指令码垛编程探索
  6. Go语言实用用法大全
  7. 华为云空间兑换码在哪里找_华为云空间在哪里找到
  8. Uncode-Schedule首页、文档和下载 - 分布式任务调度组件 - 开源中国社区
  9. iptables实现网卡包的转发
  10. 金融学核心期刊有哪些?