概率论总结(四): 大数定律及中心极限定理
一、大数定律
1.弱大数定理(辛钦大数定理)
我们先用通俗的语言来介绍大数定理是干什么的?然后再给出它严格的数学定义。
通俗地说,辛钦大数定理是说,对于独立同分布且具有均值μ\muμ得随机变量X1X_1X1,…,XnX_nXn,当n很大时它们得算术平均1n∑k=1nXK\frac{1}{n}\sum _{k=1}^n X_Kn1∑k=1nXK很可能接近于μ\muμ。
也就是说大数定律讲的是样本均值收敛到总体均值(就是期望),没错,就是这么简单。
下面是严格的数学定义:
注:什么是随机变量序列?
随机变量序列就是一列按某种规则排列的随机变量。 这种规则可随意,但强调的是一个次序。
例如:
若Xi表示第i次抛硬币的结果,那么{Xi}这个序列就是若干次抛硬币的结果序列,X1指第一次抛的结果,Xn指第n次抛的结果。
若Yi表示前i次抛硬币正面向上的次数,(记第i次正面朝上为Xi=1,反面朝上为Xi=0)那么可以有Yi=X1+X2+…+Xi。这样{Yi}这个序列就是前i次抛硬币正面朝上的汇总序列,Y1指的是抛一次硬币正面朝上的次数,Yn指的是抛n次硬币中正面朝上的次数。
可见{Xi}中的随机变量相互独立,而{Yi}中的随机变量则有相互关系,其中前者的结果会影响后者。因此,随机变量序列就是一列按某种规则排列的随机变量。
2.伯努利大数定理
伯努利大数定理是辛钦大数定理的一个重要推论。
二、中心极限定理
我们先用通俗的语言来介绍中心极限定理是干什么的?然后再给出它严格的数学定义。
那么,什么是中心极限定理呢?
中心极限定理是说:
样本的平均值约等于总体的平均值。
不管总体是什么分布,任意一个总体的样本平均值都会围绕在总体的整体平均值周围,并且呈正态分布。
所以我们看到中心极限定理其实是包含了大数定理的,也就是样本的平均值约定于或者说依概率收敛于总体的平均值。
那第二句话是什么意思呢?
比如我们进行取样,每一次取样取一百条数据,这是一个样本,样本中每条数据它的值都是服从相同分布的,我们把这一次的取样结果的平均值即为Xˉ\bar XXˉ,称为样本平均值。很明显Xˉ\bar XXˉ也是一个变量,意思是每一次的取样这个样本平均值都有可能不同。但是中心极限定理指出Xˉ\bar XXˉ围绕着总体的整体平均值周围,并且成正态分布。
这里总体的整体平均值又是什么呢?其实其实并不是指简单的所有数据的平均值。假设我们把V当作随机取到一个数据的值,那么随机变量V的数学期望就是整体平均值。所以它应该是数学期望。这里总体均值上面大数定律中提到的是一样的,都是数学期望。
下面再以一个具体的例子进行说明。
假设有一个群体,如清华毕业的人,我们对这类人群的收入感兴趣。怎么知道这群人的收入呢?我会做这样4步:
第1步.随机抽取1个样本,求该样本的平均值。例如我们抽取了100名毕业于清华的人,然后对这些人的收入求平均值。该样本里的100名清华的人,这里的100就是该样本的大小。有一个经验是,样本大小必须达到30,中心极限定理才能保证成立。
第2步.我将第1步样本抽取的工作重复再三,不断地从毕业的人中随机抽取100个人,例如我抽取了5个样本,并计算出每个样本的平均值,那么5个样本,就会有5个平均值。这里的5个样本,就是指样本数量是5。
第3步.根据中心极限定理,这些样本平均值中的绝大部分都极为接近总体的平均收入。有一些会稍高一点,有一些会稍低一点,只有极少数的样本平均值大大高于或低于群体平均值。
第4步.中心极限定理告诉我们,不论所研究的群体是怎样分布的,这些样本平均值会在总体平均值周围呈现一个正态分布。
下面是数学定义。
为了跟上面的举例做一个衔接(因为举例是用贴近生活的数理统计,如抽样来举例,而定理是概率论的内容,数理统计是以概率论为基础的)。我们可以把X1,X2,...XnX_1,X_2,...X_nX1,X2,...Xn看作是一个样本,或者说一次大试验,而每一个X都是描述一个数据,或者说一次小实验。那么这个样本的均值Xˉ\bar XXˉ,也就是1n∑k=1nXk\frac{1}{n}\sum _{k=1}^{n} X_kn1∑k=1nXk 它始终围绕在μ\muμ周围,而且它的标准差是1nσ\frac{1}{\sqrt n}\sigman1σ,而且它服从正态分布。 这个可以从上面的定理推出来。
上面的随机变量Y其实就是把变量Y′=XˉY' = \bar XY′=Xˉ标准化了,变成了均值为0,方差为1的正态分布。
同时上面的极限符号也说明了样本大小或随机变量个数n越大,Xˉ\bar XXˉ分布就越接近正态分布。当n趋于无穷时,这是Xˉ\bar XXˉ分布的标准差就趋于零,也就是这时候的样本平均值几乎等于总体平均值(数学期望)。
下面是一道例题:
第二小问跟第一问解法相似,略。
四、参考资料
- 《概率论与数理统计》浙大第四版
概率论总结(四): 大数定律及中心极限定理相关推荐
- 大数定理的MATLAB编程,用MATLAB模拟大数定律和中心极限定理.pdf
您所在位置:网站首页 > 海量文档  > 计算机 > matlab 用MATLAB模拟大数定律和中心极限定理.pdf8 ...
- 大数定理的MATLAB编程,用MATLAB模拟大数定律和中心极限定理
收稿日期: 2005 - 02 - 04 作者简介: 林小苹(1964-) , 女 , 广东汕头人 , 讲师. 文章编号 : 100124217(2005)020012207 用 MATLAB 模拟大 ...
- [概统]本科二年级 概率论与数理统计 第八讲 大数定律与中心极限定理
[概统]本科二年级 概率论与数理统计 第八讲 大数定律与中心极限定理 Chebyshev不等式 弱大数定律 中心极限定理 这一讲我们介绍大数定律与中心极限定理,这两个工具是我们在本科二年级阶段唯二需要 ...
- 概率论—随机变量的数字特征、大数定律及中心极限定理
文章目录 概率论4.5章 随机变量的数字特征 大数定律及中心极限定理 概率论4.5章 随机变量的数字特征 大数定律及中心极限定理
- 两个重要极限_算法数学基础-概率论最重要两个结论:大数定律及中心极限定理...
到这一章,概率的基本概念我们已经梳理完了.这些概念构建起来的概率空间给了我们强有力的分析不确定性的工具,概念非常重要只有对概念有准确的理解才能应用好这些有力的工具.数学是很抽象的东西,他源于实践但高于 ...
- 李永乐复习全书概率论与数理统计 第五、六章 大数定律和中心极限定理及数理统计的基本概念
目录 第五章 大数定律和中心极限定理 第六章 数理统计的基本概念 6.1 总体.样本.统计量和样本数字特征 例4 设总体X∼P(λ)X\sim P(\lambda)X∼P(λ),则来自总体XX ...
- 概率统计:第五章 大数定律与中心极限定理
第五章 大数定律与中心极限定理 内容提要: 一. 大数定律 定理一(契比雪夫大大数定律的特殊情况)设随机变量相互独立,具有相同的均值和方差: 记,则对于任意给定的正数,有 设随机变量是一个随 ...
- 第五章——大数定律和中心极限定理
文章目录 1.大数定律 1.1.弱大数定理(辛钦大数定理) 1.2.伯努利大数定理 2.中心极限定理 2.1.独立同分布的中心极限定理 2.2.李雅普诺夫定理 2.3.棣莫弗--拉普拉斯定理 2.4. ...
- 统计篇(六)-- 大数定律与中心极限定理
极限定理是概率论的基本理论,在理论研究和应用中起着重要的作用,其中最重要的是称为"大数定律"与"中心极限定理"的一些定理.大数定律是叙述随机变量序列的前一些项的 ...
最新文章
- leetcode59:螺旋矩阵||(思路+详解)
- 弹簧和线程:TaskExecutor
- 1社会心理学---感知情境
- tcp连接工具_基于Swoole如何搭建TCP服务,你掌握了吗?
- poj 3461 - Oulipo
- mysql数据库密码修改
- 【2021牛客暑期多校训练营5】Double Strings(二维字符串dp)
- 【X240 QQ视频对方听不到声音】解决方法
- html解决页面放大后元素乱排的问题
- Axure版PRD产品需求文档(教程+下载)
- 读写器APDU指令读写FM1208CPU卡
- php实现 三角形_HTML纯CSS绘制三角形(各种角度)
- unity tags的坑
- 关于技术人员创业入股的问题
- 随笔记之lombok
- mysql rds备份_云数据库RDS如何进行数据备份
- 每日刷题记录 (一)
- RabbitMQ集群安装配置+HAproxy+Keepalived高可用
- Win8下装XP双系统
- 大道至简之一:如何准确把握趋势
热门文章
- 如何在idea中高效地使用和查找TODO标签
- C#指定图片添加文字——修改版
- ARM Cortex-M 调试器 - 基础知识
- 个人防骗大全精选(1)
- [anjularjs] ui-router嵌套ui-view不刷新问题
- 骁龙870相当于什么处理器 骁龙870什么水平
- (9)Android之路====Android系统OTA更新
- TokenGazer一问到底 | 第29期:研究员 vs IRISnet
- 微信小程序页面栈超过【10层】之后无法打开其他页面原因
- 红米 10X和红米10X Pro 的区别