科普一下所谓“大数定律的四种证法”

作者 :  王若度

最近网上总是调侃数学、统计博士知道所谓“大数定律的四种证法”,本身是模仿《孔乙己》的桥段,用以调侃数学、统计博士学一些没什么用的东西。其实我是从来没听说过大数定律的四种证法这回事的,我相信大多数同学也都没有听说过。因此这件事引起了我的兴趣,也顺便为“大数定律”正个名。(顺便说一下,百度百科的大数定律页面逊毙了,今天(2012/11/25)我去看,历史介绍里竟然介绍的是中心极限定理的发展过程。)

对于一般人来说,大数定律的非严格表述是这样的:X_1,...,X_n是独立同分布随机变量序列,均值为u,S_n=X_1+...+X_n,则S_n/n收敛到u.

如果说“弱大数定律”,上述收敛是指依概率收敛(in probability),如果说“强大数定律”,上述收敛是指几乎必然收敛(almost surely/with probability one)。

大数定律通俗一点来讲,就是样本数量很大的时候,样本均值和真实均值充分接近。这一结论与中心极限定理一起,成为现代概率论、统计学、理论科学和社会科学的基石之一,重要性在本人看来甚至不弱于微积分。(有趣的是,虽然大数定律的表述和证明都依赖现代数学知识,但其结论最早出现在微积分出现之前。而且在生活中,即使没有微积分的知识也可以应用。例如,没有学过微积分的学生也可以轻松利用excel或计算器计算样本均值等统计量,从而应用于社会科学。)

最早的大数定律的表述可以追朔到公元1500年左右的意大利数学家Cardano。1713年,著名数学家James (Jacob) Bernouli正式提出并证明了最初的大数定律。不过当时现代概率论还没有建立起来,测度论、实分析的工具还没有出现,因此当时的大数定律是以“独立事件的概率”作为对象的。后来,历代数学家如Poisson(“大数定律”的名字来自于他)、Chebyshev、Markov、Khinchin(“强大数定律”的名字来自于他)、Borel、Cantelli等都对大数定律的发展做出了贡献。直到1930年,现代概率论奠基人、数学大师Kolgomorov才真正证明了最后的强大数定律。

下面均假设X, X_1,...,X_n是独立同分布随机变量序列,均值为u。独立同分布随机变量和的大数定律常有的表现形式有以下几种。

初等概率论

(1). 带方差的弱大数定律:若E(X^2)小于无穷,则S_n/n-u依概率收敛到0。

证明方法:Chebyshev不等式即可得到。这个证明是Chebyshev给出的。

(2). 带均值的弱大数定律:若u存在,则S_n/n-u依概率收敛到0。

证明方法:用Taylor展开特征函数,证明其收敛到常数,得到依分布收敛,然后再用依分布收敛到常数等价于依概率收敛。

现代概率论

(3). 精确弱大数定律:若xP(|X|>x) 当x趋于无穷时收敛到0,则S_n/n-u_n依概率收敛到0,其中u_n=E[X 1_{|X|<n}]. (在这个定理里,不需要u存在。)

证明方法:需要用到截断随机变量 X 1_{|X|<n}. 然后要用的三角阵列的依概率收敛定理和Fubini定理分析积分变换。

(4). 带4阶矩的强大数定律:若E(X^4)小于无穷,则S_n/n-u几乎必然收敛到0.

证明方法:与(1)类似,先用Chebyshev不等式。然后因为4阶矩的存在,得到P(S_n>nt)对任意常数t的收敛速度足够快,满足Borel-Cantelli的要求,用Borel-Cantelli引理得到大数定律。

(5). 带方差的强大数定律:若E(X^2)小于无穷,则S_n/n-u几乎必然收敛到0.

证明方法:用Kolgoromov三级数定理和Kronecker引理。

(6). 精确强大数定律:若u存在,则S_n/n-u几乎必然收敛到0.

证明方法:这个大数定律的证明确实有几种不同的方法。最早的证明是由数学大师Kolgoromov给出的。现在Durrett (2010)的书上用的是Etemadi (1981)的方法,需要截断X,用到现代概率论的知识如Borel-Cantelli引理、Kolgomorov三级数定理、Fubini定理等。(感谢读者指出,Durrett的书在倒向鞅一章中给出了大数定律的倒向鞅方法证明,只需要用到倒向鞅的知识和Hewitt-Savage 0-1律,不过这也是现代概率论的知识。)

此外,还有很多不同的大数定律,不同分布的,不独立的序列等。定律也不一定是关于随机变量的,也可以是关于随机函数的,甚至随机集合的等等。以数学家命名的也有Khinchin大数定律(不独立序列的强大数定律)、Chebyshev大数定律(弱大数定律(1))、Poisson大数定律(不同概率的随机事件序列的大数定律)、Bernoulli大数定律(随机事件的大数定律)、Kolgomorov大数定律(强大数定律(6))等等……

以上(1-6)是常见的独立同分布序列的大数定律。其中,(3)和(6)是最严格也是最精妙的结果,证明所涉及的高等概率论知识也最多。它们成立的条件不仅是充分条件,也是必要条件,因此它们算是完结了大数定律的发展。大数定律的发展符合数学的一般规律:想证明某一结论,条件越弱(弱大数定律:2阶矩条件->1阶矩条件->没矩条件;强大数定律:4阶矩条件->2阶矩条件->1阶矩条件),证明也就变得越难。

虽然只有(3)和(6)是最精确的结果,但是必须认识到,数学的发展是一个循序渐进的过程,如果没有前面那些更强条件下的定理,也无法得到最后的大数定律。从最开始的自然界观察到大数定律的存在,到最后证明最终形式,历时数百年,现代概率论也在这个过程中建立起来。此外,虽然(3)和(6)比前面的(1)和(5)强很多,但是(1)和(5)的条件仅仅是2阶矩(或方差)的存在,因此他们在几百年间早就被广泛使用,对于一般的社会科学问题、统计问题等已经足足够用了。

总之,大数定律包含概率论里核心的知识。“大数定律的四种证法”尽管表述模糊,原意也充满调侃,但并不是真如《孔乙己》里"回字四种写法"所暗示的那样迂腐或毫无价值。作为概率或统计专业的研究生,弄懂这些定理表述的区别和证明方法的区别和联系,了解前代数学家的工作,对于深刻理解现代概率论是很有好处的。当然,任何人也不应去死记硬背这些证法(我自己也记不住这些证法),只要能理解、弄清其中微妙即可。

转载于:https://www.cnblogs.com/gongdiwudu/p/6137887.html

关于大数定律的讨论(转)相关推荐

  1. 基于推断统计学,把握问题核心洞悉数据模式与趋势

    Hi,各位看官老爷们好~,在前两篇<数据分析-初识数据埋点(一)>.<数据分析-初识数据埋点(二)>中已经对实战应用中的数据埋点的基础认知.基本分类.定义规范.流程以及详细的应 ...

  2. [数据分析方法论]数据分析篇|基于推断统计学,把握问题核心洞悉数据

    经过产品经理详细且周密的埋点准备工作以及产品线上各个环节童鞋的齐心协力,需求以及埋点方案终于上线啦.部分看官认为上线了即代表大头的活都完成了,实际上,上线后才是埋点刚刚开始收集数据的开端,这才刚刚开始 ...

  3. [概统]本科二年级 概率论与数理统计 第八讲 大数定律与中心极限定理

    [概统]本科二年级 概率论与数理统计 第八讲 大数定律与中心极限定理 Chebyshev不等式 弱大数定律 中心极限定理 这一讲我们介绍大数定律与中心极限定理,这两个工具是我们在本科二年级阶段唯二需要 ...

  4. 两个重要极限_算法数学基础-概率论最重要两个结论:大数定律及中心极限定理...

    到这一章,概率的基本概念我们已经梳理完了.这些概念构建起来的概率空间给了我们强有力的分析不确定性的工具,概念非常重要只有对概念有准确的理解才能应用好这些有力的工具.数学是很抽象的东西,他源于实践但高于 ...

  5. 中心极限定理与大数定律的区别

    定义的区别 什么是中心极限定理? 中心极限定理,是说随着样本数量的增加,样本的均值分布呈正态分布.对原总体的分布不做任何要求,意味着无论总体是什么分布,其抽样样本的均值的频数的分布都随着抽样数的增多而 ...

  6. [统计学理论基础] 中心极限定理与大数定律的区别

    一. 中心极限定理 下图形象的说明了中心极限定理 当样本量N逐渐趋于无穷大时,N个抽样样本的均值的频数逐渐趋于正态分布,其对原总体的分布不做任何要求,意味着无论总体是什么分布,其抽样样本的均值的频数的 ...

  7. 关于概率分布理论的原理分析的一些讨论,以及经典概率分布的应用场景,以及概率统计其在工程实践中的应用...

    1. 随机变量定义 0x1:为什么要引入随机变量这个数学概念 在早期的古典概率理论研究中,人们基于随机试验的样本空间去研究随机事件,也发展出了非常多辉煌的理论,包括著名的贝叶斯估计在内. 但是随着研究 ...

  8. [统计学]大数定律与中心极限定理

    大数定律和中心极限定理 大数定律 中心极限定理 大数定律和中心极限定理的联系 伯努利分布 在统计活动中,人们发现,在相同条件下大量重复进行一种随机实验时,一件事情发生的次数与实验次数的比值,即该事件发 ...

  9. TVM/Relay 的 PartitionGraph()(mod) 函数讨论整理

    TVM/Relay 的 PartitionGraph()(mod) 函数讨论整理 TVM/Relay 的图形分区功能.以下简单示例,错误信息. PartitionGraph() 函数指定图形是用带有 ...

最新文章

  1. mysql修改编码格式6_修改编码格式MySQL
  2. VS2015下使用websocketpp和asio构建websock服务器
  3. 【hadoop】20.MapReduce-InputFormat数据切片机制
  4. 监控GoldenGate进程
  5. 与服务器传文件格式,客户端如何向服务器传文件格式
  6. 命运(HDU-2571)
  7. 联想x100e linux,联想小红ThinkPad X100e笔记本拆解!
  8. 【学习笔记】python实现图像的手绘效果
  9. 【回眸】安装Hightec后如何导入源码及相关环境配置
  10. wps公式编辑器文字和公式不对齐
  11. RecyclerView侧滑删除
  12. 家用路由器改造成交换机教程
  13. CSS好看的一些颜色
  14. 文本长度过长时隐藏并显示省略号“...”,以及鼠标停留时悬浮显示全部文本(兼容IE)
  15. 回文数函数的粗浅理解
  16. 1-4 云商城项目工程搭建
  17. linux笔记(基础用法一)
  18. sql sever 2014的Business Intelligence Development Studio (BIDS)安装
  19. 语音笔记16 CIPT2 CAC
  20. file input 点击没反应_input file 无法打开手机端文件选择器

热门文章

  1. HAUT 1262 魔法宝石 暴力思想,多种解决方案
  2. visibility属性
  3. P2698 [USACO12MAR]花盆Flowerpot 单调队列
  4. 免费的视频压缩软件,踩了好多坑之后,终于找到了——Handbrake
  5. jQuery事件委派
  6. 52个小技巧让WP手机使用更顺手
  7. python爬取斗鱼图片
  8. 关于使用[MASK]做完形填空时需要注意的点
  9. c语言求纯粹合数,纯粹合数是哪些?
  10. 手机制作音乐专辑封面_你如何制作好的专辑封面