中心极限定理(Central Limit Theorem,CTL),是指概率论中讨论随机变量序列部分和分布渐近于正态分布的一类定理。。

概述

定理是数理统计学和误差分析的理论基础,指出了大量随机变量近似服从正态分布的条件。它是概率论中最重要的一类定理,有广泛的实际应用背景。在自然界与生产中,一些现象受到许多相互独立的随机因素的影响,如果每个因素所产生的影响都很微小时,总的影响可以看作是服从正态分布的。中心极限定理就是从数学上证明了这一现象。 ——百度百科

  • 中心极限定理(CLT)指出,如果样本量足够大,则变量均值的采样分布将近似于正态分布,而与该变量在总体中的分布无关。

独立同分布

  • 设随机变量X1,X2,…,XnX_1, X_2,\dots,X_nX1​,X2​,…,Xn​独立同分布,且具有数学期望μ\muμ和方差σ2\sigma^2σ2,前nnn个变量之和为{%raw%}$\overline S = \sum\limits_{i = 1}^n {{X_i}} \${%endraw%}
  • 那么S‾n\overline S_nSn​的期望和方差为nμn\munμ和nσ2n\sigma^2nσ2,S‾n\overline S_nSn​的标准化变量为:

Yn=S‾n−nμnσY_n=\frac{\overline S_n - n\mu}{\sqrt n\sigma} Yn​=n​σSn​−nμ​

定义

  • 中心极限定理的内容为:YnY_nYn​的概率分布函数Fn(x)F_n(x)Fn​(x)对于任意xxx满足:

{%raw%}
lim⁡n→∞Fn(x)=lim⁡n→∞P{Yn≤x}=lim⁡n→∞P{∑k=1nXk−nμnσ≤x}=∫−∞x12πe−t2/2dt=Φ(x)\begin{array}{c} \lim _{n \rightarrow \infty} F_{n}(x)=\lim \limits_{n \rightarrow \infty} P\left\{Y_{n} \leq x\right\}=\lim \limits_{n \rightarrow \infty} P\left\{\frac{\sum_{k=1}^{n} X_{k}-n \mu}{\sqrt{n} \sigma} \leq x\right\} \\ =\int_{-\infty}^{x} \frac{1}{\sqrt{2 \pi}} e^{-t^{2} / 2} d t=\Phi(x) \end{array} limn→∞​Fn​(x)=n→∞lim​P{Yn​≤x}=n→∞lim​P{n​σ∑k=1n​Xk​−nμ​≤x}=∫−∞x​2π​1​e−t2/2dt=Φ(x)​
{%endraw%}

证明

通过观察某个分布的采样均值可以发现近似服从正态分布,我们的目标就是证明这个变量与正态分布的特征函数相同

  • 引入一些特征函数的结论
  • 正态分布的特征函数:

{%raw%}
φ(t)=e−t22{\varphi (t)}{ = {e^{ - \frac{{{t^2}}}{2}}}} φ(t)=e−2t2​

{%endraw%}

标准正态分布的特征函数

  • 随机变量XiX_iXi​的特征函数用φx(t){\varphi_x (t)}φx​(t)表示
  • S‾n\overline S_nSn​的特征函数为:

{%raw%}
φSn(t)=[φx(t)]n{\varphi_{S_n} (t)}=[{\varphi_x (t)}]^n φSn​​(t)=[φx​(t)]n

{%endraw%}

独立变量和的特征函数

  • XiX_iXi​均值X‾=1nSn‾\overline X=\frac{1}{n}\overline {S_n}X=n1​Sn​​的特征函数:

{%raw%}
φX‾(t)=φSn(tn)=[φx(tn)]n{\varphi_{\overline X} (t)}={\varphi_{S_n} (\frac{t}{n})}=[{\varphi_x (\frac{t}{n})}]^n φX​(t)=φSn​​(nt​)=[φx​(nt​)]n

{%endraw%}

常数线性变换的特征函数

  • {%raw%}Yn=S‾n−nμnσ=X‾−μσn=nσX‾−nσμY_n=\frac{\overline S_n - n\mu}{\sqrt n\sigma}=\frac{\overline X - \mu}{\frac{\sigma}{\sqrt n}}=\frac{\sqrt n}{\sigma}\overline X - \frac{\sqrt n}{\sigma} \muYn​=n​σSn​−nμ​=n​σ​X−μ​=σn​​X−σn​​μ {%endraw%}的特征函数:

{%raw%}
φy(t)=ei(−nσμ)t⋅φxˉ(nσt)=ei(−nσμ)t⋅[φx(tσn)]n\varphi_{y}(t)=e^{i\left(-\frac{\sqrt{n}}{\sigma} \mu\right) t} \cdot \varphi_{\bar{x}}\left(\frac{\sqrt{n}}{\sigma} t\right)=e^{i\left(-\frac{\sqrt{n}}{\sigma} \mu\right) t} \cdot\left[\varphi_{x}\left(\frac{t}{\sigma \sqrt{n}}\right)\right]^{n} φy​(t)=ei(−σn​​μ)t⋅φxˉ​(σn​​t)=ei(−σn​​μ)t⋅[φx​(σn​t​)]n

{%endraw%}

思路1
  • 取对数:

{%raw%}
$$
\begin{aligned}
\ln \varphi_{y}(t)&=\ln \left{e^{i\left(-\frac{\sqrt{n}}{\sigma} \mu\right) t} \cdot\left[\varphi_{x}\left(\frac{t}{\sigma \sqrt{n}}\right)\right]^{n}\right}\
&=-i \frac{\sqrt{n}}{\sigma} \mu t+n \ln \left[\varphi_{x}\left(\frac{t}{\sigma \sqrt{n}}\right)\right]\
&=\frac{-i \mu \frac{t}{\sigma \sqrt{n}}+\ln \left[\varphi_{x}\left(\frac{t}{\sigma \sqrt{n}}\right)\right]}{\frac{1}{n}}\

\end{aligned}
$$

{%endraw%}

  • 令p=tσnp=\frac{t}{\sigma \sqrt{n}}p=σn​t​, 当 $ n \rightarrow \infty $ 时, $ p \rightarrow 0$ 又 :

{%raw%}
$$
\begin{aligned}

&\varphi_{x}(0)=\int_{-\infty}^{\infty} f(x) d x=1\
&\varphi_{x}{\prime}(0)=\int_{-\infty}{\infty} i x f(x) d x=i \mu\
&\varphi_{x}^{\prime \prime}(0)=\int_{-\infty}{\infty}-x{2} f(x) d x=-E\left(X{2}\right)=-\mu{2}-\sigma^{2}\
\end{aligned}
$$

{%endraw%}

  • 有 :

{%raw%}
$$
\begin{aligned}

\lim {n \rightarrow \infty} \ln \varphi{y}(t)&=\lim {n \rightarrow \infty} \frac{-i \mu \frac{t}{\sigma \sqrt{n}}+\ln \left[\varphi{x}\left(\frac{t}{\sigma \sqrt{n}}\right)\right]}{\frac{1}{n}}\
&=\frac{t{2}}{\sigma{2}} \lim {p \rightarrow 0} \frac{-i \mu p+\ln \left[\varphi{x}§\right]}{p^{2}} \quad(\text { 洛必达) }\
&=\frac{t{2}}{\sigma{2}} \lim {p \rightarrow 0} \frac{-i \mu+\frac{1}{\varphi{x}§} \cdot \varphi_{x}^{\prime}§}{2 p} \quad(\text { 洛必达 })\
&=\frac{t{2}}{\sigma{2}} \lim {p \rightarrow 0} \frac{\varphi{x}^{\prime \prime}§ \cdot \varphi_{x}§-\varphi_{x}^{\prime}§ \cdot \varphi_{x}{\prime}§}{2\left[\varphi_{x}§\right]{2}}\
&=\frac{t{2}}{\sigma{2}} \cdot \frac{\varphi_{x}^{\prime \prime}(0) \cdot \varphi_{x}(0)-\varphi_{x}^{\prime}(0) \cdot \varphi_{x}{\prime}(0)}{2\left[\varphi_{x}(0)\right]{2}}\
&=\frac{t{2}}{\sigma{2}} \cdot \frac{\left(-\mu{2}-\sigma{2}\right) \cdot 1-i \mu \cdot i \mu}{2 \cdot 1}\
&=-\frac{t^{2}}{2}
\end{aligned}
$$

{%endraw%}

思路2

{%raw%}
Yn=nXˉ−μσn=∑i=1nηiσnηi=Xi−μφ(t)=E(eitYn)=E(eitη1σn⋅eitη2σn⋅…⋅eitηnσn)=[ϕ(tσn)]n\begin{array}{l} Y_{n}=\frac{n \bar{X}-\mu}{\sigma \sqrt{n}}=\frac{\sum_{i=1}^{n} \eta_{i}}{\sigma \sqrt{n}} \\\quad \eta_{i}=X_{i}-\mu \\ \varphi(t)=E\left(e^{i t Y_{n}}\right)=E\left(e^{i t \frac{\eta_{1}}{\sigma \sqrt{n}}} \cdot e^{i t \frac{\eta_{2}}{\sigma \sqrt{n}}} \cdot \ldots \cdot e^{i t \frac{\eta_{n}}{\sigma \sqrt{n}}}\right)=\left[\phi\left(\frac{t}{\sigma \sqrt{n}}\right)\right]^{n} \end{array} Yn​=σn​nXˉ−μ​=σn​∑i=1n​ηi​​ηi​=Xi​−μφ(t)=E(eitYn​)=E(eitσn​η1​​⋅eitσn​η2​​⋅…⋅eitσn​ηn​​)=[ϕ(σn​t​)]n​
{%endraw%}

  • ϕ(t)\phi(t)ϕ(t) 为 ηi\eta_{i}ηi​ 的特征函数
  • ϕ(tσn)\phi\left(\frac{t}{\sigma \sqrt{n}}\right)ϕ(σn​t​) 在0点处的泰勒展开形式为:

{%raw%}
ϕ(tσn)=ϕ(0)+ϕ′(0)tσn+ϕ′′(0)2!(tσn)2+o((tσn)2)=1+0−t22n+o((tσn)2)\begin{aligned} \phi\left(\frac{t}{\sigma \sqrt{n}}\right)=\phi(0) &+\phi^{\prime}(0) \frac{t}{\sigma \sqrt{n}}+\frac{\phi^{\prime \prime}(0)}{2 !}\left(\frac{t}{\sigma \sqrt{n}}\right)^{2}+o\left(\left(\frac{t}{\sigma \sqrt{n}}\right)^{2}\right) \\ &=1+0-\frac{t^{2}}{2 n}+o\left(\left(\frac{t}{\sigma \sqrt{n}}\right)^{2}\right) \end{aligned} ϕ(σn​t​)=ϕ(0)​+ϕ′(0)σn​t​+2!ϕ′′(0)​(σn​t​)2+o((σn​t​)2)=1+0−2nt2​+o((σn​t​)2)​
{%endraw%}

  • 所以, φ(t)\varphi(t)φ(t) 为:

{%raw%}
φ(t)=(1−t22n+o((tσn)2))(−2nt2)×(−t22)=e−t22,n→+∞\varphi(t)=\left(1-\frac{t^{2}}{2 n}+o\left(\left(\frac{t}{\sigma \sqrt{n}}\right)^{2}\right)\right)^{\left(-\frac{2 n}{t^{2}}\right) \times\left(-\frac{t^{2}}{2}\right)}=e^{-\frac{t^{2}}{2}}, n \rightarrow+\infty φ(t)=(1−2nt2​+o((σn​t​)2))(−t22n​)×(−2t2​)=e−2t2​,n→+∞
{%endraw%}

都得出结论
  • 即有:

{%raw%}
lim⁡n→∞φy(t)=e−t22\lim _{n \rightarrow \infty} \varphi_{y}(t)={e^{ - \frac{{{t^2}}}{2}}} n→∞lim​φy​(t)=e−2t2​

{%endraw%}

  • YnY_nYn​特征函数与正态分布相同,故有当$ n \rightarrow \infty时,时,时,Y_n$服从正态分布的结论

应用思路

  • 均值方差为μ\muμ和σ2\sigma^2σ2,的独立同分布的随机变量XiX_iXi​前nnn项之和S‾n\overline S_nSn​的标准变化量YnY_nYn​,当nnn充分大时,其分布近似于标准正态分布
  • 即在nnn充分大时,S‾n\overline S_nSn​分布近似于N(nμ,nσ2)N(n\mu,n\sigma^2)N(nμ,nσ2)
  • 一般情况下,很难求出nnn个随机变量之和的分布函数。因此当nnn充分大时,可以通过正态分布来做理论上的分析或者计算

独立不同分布

  • Liapunov定理:设随机变量 X1,X2,⋯,Xn,⋯X_{1}, X_{2}, \cdots, X_{n}, \cdotsX1​,X2​,⋯,Xn​,⋯ 相互独立, 具有数学期望和方差:
    E[Xk]=μk,Var⁡[Xk]=σk2\mathbb{E}\left[X_{k}\right]=\mu_{k}, \operatorname{Var}\left[X_{k}\right]=\sigma_{k}^{2} E[Xk​]=μk​,Var[Xk​]=σk2​

  • 记: Bn2=∑k=1nσk2B_{n}^{2}=\sum_{k=1}^{n} \sigma_{k}^{2}Bn2​=∑k=1n​σk2​ 若存在正数 δ,\delta,δ, 使得当 n→∞n \rightarrow \inftyn→∞ 时,有:

    {%raw%}
    1Bn2+δ∑k=1nE[∣Xk−μk∣2+δ]→0\frac{1}{B_{n}^{2+\delta}} \sum_{k=1}^{n} \mathbb{E}\left[\left|X_{k}-\mu_{k}\right|^{2+\delta}\right] \rightarrow 0 Bn2+δ​1​k=1∑n​E[∣Xk​−μk​∣2+δ]→0

{%endraw%}

  • 则随机变量之和 SXn‾=∑k=1nXk\overline{S X_{n}}=\sum_{k=1}^{n} X_{k}SXn​​=∑k=1n​Xk​ 的标准变化量:

{%raw%}
Zn=SXn‾−E[SXn‾]Var⁡[SXn‾]=SXn‾−∑k=1nμkBnZ_{n}=\frac{\overline{S X_{n}}-\mathbb{E}\left[\overline{S X_{n}}\right]}{\sqrt{\operatorname{Var}\left[\overline{S X_{n}}\right]}}=\frac{\overline{S X_{n}}-\sum_{k=1}^{n} \mu_{k}}{B_{n}} Zn​=Var[SXn​​]​SXn​​−E[SXn​​]​=Bn​SXn​​−∑k=1n​μk​​
{%endraw%}

  • 概率分布函数 Fn(x)F_{n}(x)Fn​(x) 对于任意 xxx 满足:

{%raw%}
lim⁡n→∞Fn(x)=lim⁡n→∞P{Zn≤x}=lim⁡n→∞P{∑k=1nXk−∑k=1nμkBn≤x}=∫−∞x12πe−t2/2dt=Φ(x)\begin{array}{c} \lim _{n \rightarrow \infty} F_{n}(x)=\lim _{n \rightarrow \infty} P\left\{Z_{n} \leq x\right\}=\lim _{n \rightarrow \infty} P\left\{\frac{\sum_{k=1}^{n} X_{k}-\sum_{k=1}^{n} \mu_{k}}{B_{n}} \leq x\right\} \\ =\int_{-\infty}^{x} \frac{1}{\sqrt{2 \pi}} e^{-t^{2} / 2} d t=\Phi(x) \end{array} limn→∞​Fn​(x)=limn→∞​P{Zn​≤x}=limn→∞​P{Bn​∑k=1n​Xk​−∑k=1n​μk​​≤x}=∫−∞x​2π​1​e−t2/2dt=Φ(x)​
{%endraw%}

  • 其物理意义为:

    相互独立的随机变量 X1,X2,⋯,Xn,⋯X_{1}, X_{2}, \cdots, X_{n}, \cdotsX1​,X2​,⋯,Xn​,⋯ 之和 SXn‾=∑k=1nXk\overline{S X_{n}}=\sum_{k=1}^{n} X_{k}SXn​​=∑k=1n​Xk​ 的衍生随机变量序列 Zn=SXn‾−∑k=1nμkBn,Z_{n}=\frac{\overline{S X_{n}}-\sum_{k=1}^{n} \mu_{k}}{B_{n}},Zn​=Bn​SXn​​−∑k=1n​μk​​, 当 nnn 充分大时, 其分布近似与标准正态分布。

  • 这里并不要求 X1,X2,⋯,Xn,⋯X_{1}, X_{2}, \cdots, X_{n}, \cdotsX1​,X2​,⋯,Xn​,⋯ 同分布。

棣莫佛-拉普拉斯定理

  • Demoiver-Laplace 定理:设随机变量序列 ηn,n=1,2,…\eta_{n}, n=1,2, \ldotsηn​,n=1,2,… 服从参数为 (n,p)(n, p)(n,p) 的二项分布,其中 0<p<10<p<10<p<1 则对于任意 xxx, 有:

{%raw%}
lim⁡n→∞P{ηn−npnp(1−p)≤x}=∫−∞x12πe−t2∣2dt=Φ(x)\lim _{n \rightarrow \infty} P\left\{\frac{\eta_{n}-n p}{\sqrt{n p(1-p)}} \leq x\right\}=\int_{-\infty}^{x} \frac{1}{\sqrt{2 \pi}} e^{-t^{2} \mid 2} d t=\Phi(x) n→∞lim​P{np(1−p)​ηn​−np​≤x}=∫−∞x​2π​1​e−t2∣2dt=Φ(x)
{%endraw%}

  • 该定理表明, 正态分布是二项分布的极限分布。当 nnn 充分大时,可以利用正态分布来计算二项分布的概率。

参考资料

  • https://baike.baidu.com/item/%E4%B8%AD%E5%BF%83%E6%9E%81%E9%99%90%E5%AE%9A%E7%90%86/829451?fr=aladdin

  • https://baijiahao.baidu.com/s?id=1665261046335447411&wfr=spider&for=pc

  • http://www.huaxiaozhuan.com/%E6%95%B0%E5%AD%A6%E5%9F%BA%E7%A1%80/chapters/2_probability.html

  • https://www.zhihu.com/question/25956080/answer/1375064657

  • https://zhuanlan.zhihu.com/p/93738110

概率论基础 - 9 - 中心极限定理相关推荐

  1. UA MATH563 概率论的数学基础 中心极限定理22 度量概率空间中的弱收敛 Portmanteau定理

    UA MATH563 概率论的数学基础 中心极限定理22 度量概率空间中的弱收敛 Portmanteau定理 现在我们讨论度量空间中的弱收敛,假设(Ω,d)(\Omega,d)(Ω,d)是一个度量空间 ...

  2. UA MATH563 概率论的数学基础 中心极限定理24 随机变量的特征函数

    UA MATH563 概率论的数学基础 中心极限定理24 随机变量的特征函数 定义 假设XXX是定义在(Ω,F,P)(\Omega,\mathcal{F},P)(Ω,F,P)上的随机变量,定义 ϕ(t ...

  3. UA MATH563 概率论的数学基础 中心极限定理23 概率测度族的紧性

    UA MATH563 概率论的数学基础 中心极限定理23 概率测度族的紧性 给定一个度量可测空间(Ω,F)(\Omega,\mathcal{F})(Ω,F),度量为ddd,我们可以在这个可测空间上定义 ...

  4. UA MATH563 概率论的数学基础 中心极限定理21 Skorohod定理的证明

    UA MATH563 概率论的数学基础 中心极限定理21 Skorohod定理的证明 Skorohod定理 如果Fn⇒FF_n \Rightarrow FFn​⇒F,则存在以FnF_nFn​为cdf的 ...

  5. UA MATH563 概率论的数学基础 中心极限定理20 弱收敛的性质

    UA MATH563 概率论的数学基础 中心极限定理20 弱收敛的性质 性质一:两种定义的等价性 随机变量依分布收敛 定义一: 假设{Xn}\{X_n\}{Xn​}是一列随机变量,称它依分布收敛到XX ...

  6. UA MATH563 概率论的数学基础 中心极限定理17 0-1律的应用

    UA MATH563 概率论的数学基础 中心极限定理17 0-1律的应用 第14讲到第16讲我们介绍了Kolmogorov非常著名的几大定理(如下),事实上Kolmogorov开发出这些定理的目标是证 ...

  7. UA MATH563 概率论的数学基础 中心极限定理16 Kolmogorov 3-series定理

    UA MATH563 概率论的数学基础 中心极限定理16 Kolmogorov 3-series定理 考虑∑n≥1an\sum_{n \ge 1}a_n∑n≥1​an​,这个级数收敛的充要条件是它的部 ...

  8. UA MATH563 概率论的数学基础 中心极限定理15 Kolmogorov 0-1律

    UA MATH563 概率论的数学基础 中心极限定理15 Kolmogorov 0-1律 如果是初见的话会觉得Kolmogorov 0-1律看上去很奇怪,但它在概率论中有很广泛的应用,这一讲我们简单介 ...

  9. UA MATH563 概率论的数学基础 中心极限定理14 Kolmogorov maximal inequality

    UA MATH563 概率论的数学基础 中心极限定理14 Kolmogorov maximal inequality 这一讲介绍一个有用的不等式,它给出了独立随机变量的和的最值的tail probab ...

最新文章

  1. iOS开发 BLE 蓝牙4.0
  2. Python网络爬虫与信息提取(二)(BeautifulSoup库)
  3. Jenkins配置基于角色的项目权限管理--转
  4. 如何让以特定字符串结尾的所有站点都被加入到Local Intranet Zone中?
  5. 甲流病人初筛(信息学奥赛一本通-T1399)
  6. windows 的使用 —— 注册表(软件的安装和卸载)
  7. Spring→面向切面编程AOP、相关概念、通知Advice类型、配置切面切入点通知、AOP相关API、AOP代理类ProxyFactoryBean、AOP注解@AspectJ
  8. windows7 shift+右键 “在此处打开命令窗口”
  9. 客户端navicat安装教程
  10. 阿里云窄带高清的演进与思考
  11. 楚狂人--驱动开发基础
  12. BI是什么意思?在企业应用中有哪些好处?
  13. 分布式系统技术难题--异地多活
  14. 用pygame做一个简单的python小游戏---生命游戏
  15. R语言27-Prosper 贷款数据分析3
  16. Oracle aes128和aes256加解密
  17. 方法: 跳转App Store更新你应用的URL究竟该怎么写
  18. eNSP:静态路由的负载分担
  19. 基于C++实现的图像检索系统
  20. HTML5基本结构及标签

热门文章

  1. 邮储银行您在我行留存的身份信息不准确.. 解决
  2. Centos下关于ssh、scp与rsync设置与应用
  3. 小白学java之车辆管理系统,超基础!
  4. SpringBootSecurity安全相关
  5. 原生JavaScript实现随机点名
  6. CSDN日报191122:Android工程师的面试指南
  7. Output argument “yl“ (and maybe others) not assigned
  8. K-Prototypes聚类的Python实现
  9. pytorch 一个 Tensor的 is_leaf requires_grad 两个属性同时 为 True 才会保存 grad
  10. 达芬奇密码 第八十五章