数理统计:样本及抽样分布7
(几天没学习了?好好反省反省!!卷起来)
目录
一、随机样本
二、直方图
三、箱线图
四、抽样分布
五、重要的分布
1. 卡方分布
2. t 分布
3. F 分布
在概率论中,对于随机变量的分布都是已知的,然后求其数字特征。
但是在数理统计中,生活中的很多随机变量的分布都是未知的,我们需要通过设定试验,进行重复独立的观察,对观察得到的数据进行分析,从而对所研究的随机变量的分布作出种种判断。
首先,我们需要了解数理统计的一些基本概念。
一、随机样本
1. 总体:试验的全部可能的观察值
2. 个体:每一个可能观察值
3. 容量:总体中所包含的个体个数
一个总体对应于一个随机变量X,对于总体的研究也就是对于随机变量X的研究
4. 样本、样本值:岁随机变量X进行n次重复独立的观察,这样得到的X1,X2,X3....是样本。x1,x2,x3....是随机变量X1,X2,X3...的观察值,也成为了样本值。
二、直方图
多次试验之后,我们会得到很多数据,而这些数据都是杂乱无章的,为了快速地对这些数据有一个初步的判断和观察,我们需要借助图形来帮助描述。
画频率直方图的要点:
1. 找出极值
2. 取区间范围时,最小值稍微比极小值小一点点(1.5左右),最大值比极大值大一点点左右。
3. 取多少个小区间δ? 当样本数量<50时,通常取5~6个,当样本数量很大时,取10~20个。若讲小区间分太多个,可能会出现有些区间频率为0的情况。所以要选取合适的数量。
画出直方图后,我们可以根据轮廓大致看出分布情况。
三、箱线图
箱线图可以帮助我们快速掌握一组数据的极值、中位数、上四分位数和下四分位数。
1. 样本分位数:
2. 箱线图的性质:
- 中心位置:中位数就是数据集的中心
- 散布程度:区间较短时,证明点比较集中
- 对称性:若M在箱子的中间,证明分布较为对称,若Min-M 大于 Max-Q3,证明数据分布向左倾斜,反之向右倾斜。
箱线图特别适合用于比较2个或2个以上数据集的性质,这样我们可以比较判断数据集之间的不同,分散程度等特点。
箱线图还可以应用于检查是否有疑似异常值。
3. 修正箱线图:画出疑似异常值。
IQR=Q3-Q1,四分位数间距
Q1-1.5IQR,若数值小于这个值,标注出
Q3+1.5IQR,若数值大于这个值,标注出
4. 疑似异常值处理:系统误差,数据来自不同的总体,或者数据是正确的,但只是因为小概率事件。对于异常值的处理,我们通常考虑使用中位数来替换,这样对结论的影响较小。
四、抽样分布
样本是进行对总体推断的依据,但是在应用中,不会直接使用样本本身,而是针对不同的问题构造一个适合的样本函数,利用这些样本函数来进行统计推断。
1. 统计量:
2. 数字特征的表示
3. 经验分布函数
4. 格里文科定理
这个定理是以样本推断总体的依据。经验函数在整个实轴上1概率收敛于分布函数,于是当样本容量充分大的时候,经验分布函数能够很好的逼近总体分布函数。
五、重要的分布
自由度:独立变量的个数
1. 卡方分布
卡方分布具有可加性,数学期望为n,方差为2n。卡方分布的上分位数和标准正态分布的上分位数有联系,可以用标准正态分布的上四分位数来做估计。
2. t 分布
当n足够大时,t分布近似分布于N(0,1)
3. F 分布
3. 正态总体的样本均值μ和样本方差S的分布
(每天进步一点点!!)
数理统计:样本及抽样分布7相关推荐
- 第五章数理统计--样本和抽样分布
从今天开始要学习数理统计. 概率论:是专门研究随机现象的一门学科,定量描述随机现象及其规律. 数理统计:数理统计的研究对象是数据,包括对数据的采集.整理.分析.建模.主要任务是获取样本.描述样本,从样 ...
- 概率论与数理统计--样本及抽样分布
文章目录 总体和样本 统计量 三大分布 四大定理 总体和样本 统计量 三大分布 四大定理
- 统计-样本及抽样分布
第六章 样本及抽样分布 在概率中,我们所研究的随机变量的分布都是假设已知的. 在数理统计中,我们研究的随机变量的分布是未知的,或者是不完全知道的.我们通过对随机变量进行大量重复.独立的观察,收集书记, ...
- 第六章 样本与抽样分布
引言 题型总结中推荐例题有蓝皮书的题型较为重要,只有吉米多维奇的题型次之. 思维导图中,标红的是重点内容,标黄的是次重点. 码字不易,如果这篇文章对您有帮助的话,希望您能点赞.收藏.加关注!您的鼓励就 ...
- 概率统计·样本及抽样分布【随机样本、抽样分布】
总体与个体 总体:试验的全部可能的观察值称为总体 个体:总体中每个可能的观察值称为个体 总体期望=样本平均期望 总体方差/n=样本平均方差 随机样本 X1,X2--Xn相互独立(x1,x2--xn是观 ...
- 搞学术离不开的那些数学—概率论与数理统计
概率论与数理统计 声明:本博客仅作为学习.复习所用,该博客参考的教材为高等教育出版社出版的 浙江大学 第四版<概率论与数理统计>教材,并参考了四川大学 徐小湛老师的讲课视屏(再次声明本博客 ...
- 【概率论与数理统计】
概率论与数理统计总结 一.概率论的基本概念 1.1 样本空间,样本点,随机试验 1.2事件的关系及其运算 1.3 条件概率 1.4全概率与贝叶斯 二.随机变量及其分布 2.1 离散分布 1.3poss ...
- 概率论与数理统计(第二版) 吴传生 编 高等教育出版社 大学课后习题答案
概率论与数理统计(第二版) 吴传生 编 高等教育出版社 第1章:随机事件的概率 第2章:一维随机变量及其分布 第3章:多维随机变量及其分布 第4章:随机变量的数字特征 第5章:大数定律和中心极限定律 ...
- 概率论与数理统计(一)知识框架
概率论与数理统计(一) 知识点框架建立 这学期新修的一门课程,简单的做个知识点概括.结合上课老师所讲和自身所理解的内容,罗列出基本重要的知识点.有助于后期的复习. 一.课程的性质与任务 这门课程是通识 ...
最新文章
- 业务逻辑组件化android,AppJoint 极简 Android 组件化方案
- 阿里三面被挂,幸获内推,历经5轮终于拿到口碑offer
- php+读取配置里的值,ThinkPHP 读取配置信息与动态配置(C方法)
- 一个完整的canvas画图
- 总结:第一章~第五章
- unity3d 地面印花_unity怎么实现挖掘泥土?
- 如何用Pygame写游戏(二十二)
- 高效率测试之巧用策略模式 (引用)
- markdown 流程图js_在Markdown中用mermaid语法绘制图表
- Window操作系统注册表学习
- VS2017使用github
- 【计算机网络】湖科大微课堂 笔记目录(完结)
- ubuntu14安装火狐浏览器(firefox)中国版
- 电视和计算机共享视频,电脑中的图片视频一键共享到电视上去看
- OAuth 2.0授权框架详解
- GSM劫持+短信嗅探 “半夜盗刷”
- Linux应用程序目录规范——XDG
- Adobe Flash Player 是什么
- oracle的12012,Oracle 18.3 ORA-12012 ORA-20001
- 2513: 小勇学分数(公约数问题)