统计学③——总体与样本的差异在哪里
统计学系列目录(文末有大奖赠送
):
统计学①——概率论基础及业务实战
统计学②——概率分布(几何,二项,泊松,正态分布)
统计学④——置信区间
统计学⑤——假设验证
一、总体与样本定义
总体:所研究的所有事件的集合
样本:是从总体中抽出的数量相对较小的集合,可用于做出对总体的结论
二、抽样方法
我们希望抽取的样本分布和总体分布一致,这样用样本估计总体会比较准确,这种样本叫作无偏样本。
无偏样本的抽样方法:
① 简单随机抽样:抽签,随机编号生成器,有放回抽样和不放回两种
② 分层抽样:将总体分为几个层,层内部相似,层与层之间差距较大,再对每一层进行简单随机抽样
③ 整群抽样:将总体分为几个群,群与群之间相似,随机抽取几个群作为样本
⑤ 系统抽样:随机选取一个数据K,每次到第K个抽样单位就抽一次
三、总体参数的估计
①总体均值
当通过抽样获得无偏样本后,可以直接用样本的均值来估计总体的均值,如下:
②总体方差
方差是否可以直接用样本方差呢?答案是No,因为方差衡量的是分散性,样本相对总体而言,数量较少,可能会将一些异常值排除在外,导致样本的方差要少于总体
如果要确切知道总体的方差,并且拥有总体的数据,方差的计算如下:
如果需要用样本估计总体的方差,计算如下:
之所以用n-1而不是n,,是因为n-1会使得方差稍微大一些,更接近总体方差
③总体比例
样本比例直接估计总体比例
四、比例抽样分布
当考虑从一个总体中抽取所有大小为n的样本,由这些样本中的某个比例所形成的分布,就叫比例的抽样分布,一般用Ps表示样本比例变量
一般用来求解这类问题:当得知公司生产的糖果有25%的红色的,那么随机抽取100个样本,至少有50%的糖果是红色的概率?
Ps的期望和方差定义为:
如果n>30时,二项分布可以近似为正态分布
需要进行连续性修正
五、均值抽样分布
如果考虑从一个总体中抽出所有大小为n的样本,然后用这些样本的均值形成一个分布,那么这个分布就叫均值抽样分布。
一般用来求解这类问题:总体中每个袋子平均有10颗糖,那么随机抽取一个袋子中糖的个数小于8的概率是多少?
期望和方差的计算如下:
样本的均值期望就是总体的均值,而方差却不等于总体方差,这里是为什么呢?
因为总体方差衡量的是总体样本的分散性,而均值方差衡量的是所有抽取的样本的均值的分散性,是2个不同的东西。用总体的方差/n 表示随着样本数量增多,样本均值方差会越来越小,意味着样本均值越来越接近于总体均值
如果总体符合均值为μ,方差为σ^2的正态分布,那么抽取的样本均值符合如下分布:
如果总体不是正态分布时,那样本均值还会符合上述分布吗?答案是看情况,如果抽取的样本n很大时,还是符合上述分布的,这里要重点引出中心极限定理:
中心极限定理可以运用于:
① 如果总体属于二项分布,用X~B(n,p)表示,n>30,则样本均值的抽样分布近似N(np,pq/n)
② 如果总体属于泊松分布,用Po(λ)表示,n>30,则样本均值的抽样分布近似N(λ,λ/n)
因为均值的抽样分布属于正态分布,就可以通过标准化再差概率表得到特定样本均值的概率了
本人互联网数据分析师,目前已出Excel,SQL,Pandas,Matplotlib,Seaborn,机器学习,统计学,个性推荐,关联算法,工作总结系列。
微信搜索并关注 " 数据小斑马
" 公众号,回复“统计
”可以免费获取下方深入浅出统计学、统计学原理、赤裸裸的统计学
等9本统计学入门到精通必备经典教材
统计学③——总体与样本的差异在哪里相关推荐
- 【定量分析、量化金融与统计学】统计推断基础(1)---总体、样本、标准差、标准误
目录 一.前言 二.总体与样本 1.总体(population)的概念 2.总体的性质与参数 首先是:平均数(mean)µ 标准差(standard deviation,SD)σ希腊字母sigma 3 ...
- 深入浅出统计学(十一)总体和样本的估计
基本概念 . 问题 章节理解 上一章主要讲解如何用样本估计总体参数 这一章主要是讲解如何用总体估计样本的概率分布
- 【统计学】从样本到总体
总体和样本均值的符号: n = 样本容量 u = 总体均值 x = 样本均值 σ = 总体标准差 s = 样本标准差 样本均值分布的特征: 对于任何样本均值的分布: 样本容量越大,样本均值的分布越接近 ...
- 【读书笔记->统计学】11-02 总体和样本的估计-总体比例、样本比例、根据总体预测样本比例概念简介
总体比例与样本比例 假设一个情境:曼帝糖果公司再一次进行了抽样,以便利用调查结果预测:总体中有多大比例的人"可能偏爱曼帝公司的糖球". 结果发现,在40个人中有32个人偏爱他们的口 ...
- 【读书笔记->统计学】11-03 总体和样本的估计-样本均值的概率、中心极限定理概念简介
样本均值的概率 假设一个情境:曼帝糖果公司也生产小袋装糖球,每一个小包装袋里的糖球数目均值为10,方差为1.然而,有一个顾客买了30袋糖球,结果发现每袋糖球中的糖球平均数目只有8.5.求这种事情发生概 ...
- 数理统计-5.1 总体与样本
**总体:**在一个统计问题中,我们把研究对象的全体成为全体 **个体:**构成总体的每个成员 用概率分布可描述与归纳总体,总体可看作是一个分布 从总体中抽样等价于从分布中抽样 总体分为有限总体与无限 ...
- 统计学②——概率分布(几何,二项,泊松,正态分布)
统计学系列目录(文末有大奖赠送): 统计学①--概率论基础及业务实战 统计学③--总体与样本 统计学④--置信区间 统计学⑤--假设验证 概率分布描述了一个给定变量的所有可能取值结果的概率,历史上伟大 ...
- 统计学④——置信区间怎么算
统计学系列目录(文末有惊喜彩蛋): 统计学①--概率论基础及业务实战 统计学②--概率分布(几何,二项,泊松,正态分布) 统计学③--总体与样本 统计学⑤--假设验证 上一篇写了如何通过样本的均值和方 ...
- 统计学⑤——假设验证
统计学系列目录(文末有大奖赠送): 统计学①--概率论基础及业务实战 统计学②--概率分布(几何,二项,泊松,正态分布) 统计学③--总体与样本 统计学④--置信区间 一.什么是假设验证? 当你从广告 ...
- 统计学名词解释 —— 2. 什么是「总体」和「样本」
总体和样本 如果一个集合X,包含若干样本{x1,x2,⋯,xn}\{ x_1, x_2, \cdots, x_n\}{x1,x2,⋯,xn},这里的 X就被称为总体 ,xix_ixi则被称为总 ...
最新文章
- mysql常用语句列表
- easyui messager 消息框 对话框
- 如何从用户体验的角度去做一个网站的页面设计
- P2617 Dynamic Rankings(带修主席树)
- c++怎么保存汉字_“的汉字 ”写作练习
- 将Redis集成到您的Spring项目中
- 使用Spring Boot对REST URL进行集成测试
- 二分图的最大匹配问题
- 时尚美妆图片,让你饱眼福的唯美壁纸
- 基础02Random类、ArrayList类
- 博图15怎么看各种功能块说明_西门子STEP7常用功能块说明
- Ruby新手入门之gem配置
- 配置标准IP ACL实验
- 搜狗主动提交url并反馈快照更新软件(含源码)
- 【牛客网】马三来刷题之顺时针旋转矩阵
- js jq 按钮开始/停止转换
- 4 款超级好用的终端文件管理器
- 干货 | 足式机器人运动控制发展方向——轨迹优化
- java_09.Linux:远程登录_可以用putty也可以用SecureCRT或者Xshell5【关闭防火墙,或者关闭一些必要的防火墙才能远程登录】Linux能ping通windows,window
- java笔试完一般多久给通知_笔试之后多久收到面试通知?