阅读大概需要5分钟

作者 朱曦炽

编辑 zenRRan

链接 https://www.zhuxichi.com/2017/02/14/CentralLimitTheorem/

导读

中心极限定理是统计学中比较重要的一个定理。 本文将通过实际模拟数据的形式,形象地展示中心极限定理是什么,是如何发挥作用的。

什么是中心极限定理(Central Limit Theorem)

中心极限定理指的是给定一个任意分布的总体。我每次从这些总体中随机抽取 n 个抽样,一共抽 m 次。 然后把这 m 组抽样分别求出平均值。 这些平均值的分布接近正态分布。

我们先举个栗子????

现在我们要统计全国的人的体重,看看我国平均体重是多少。当然,我们把全国所有人的体重都调查一遍是不现实的。所以我们打算一共调查1000组,每组50个人。 然后,我们求出第一组的体重平均值、第二组的体重平均值,一直到最后一组的体重平均值。中心极限定理说:这些平均值是呈现正态分布的。并且,随着组数的增加,效果会越好。 最后,当我们再把1000组算出来的平均值加起来取个平均值,这个平均值会接近全国平均体重。

其中要注意的几点

1.总体本身的分布不要求正态分布

上面的例子中,人的体重是正态分布的。但如果我们的例子是掷一个骰子(平均分布),最后每组的平均值也会组成一个正态分布。(神奇!)

2.样本每组要足够大,但也不需要太大

取样本的时候,一般认为,每组大于等于30个,即可让中心极限定理发挥作用。

话不多说,我们现在来一步步看到中心极限定理是如何起作用的。

用实际数据来展示中心极限定理

注:我们使用python语言以及iPython Notebook来生成和展现数据。不懂的童鞋可以略过代码

第一步, 生成数据

假设我们现在观测一个人掷骰子。这个骰子是公平的,也就是说掷出1~6的概率都是相同的:1/6。他掷了一万次。我们用python来模拟投掷的结果:

生成出来的平均值:3.4927(每次重新生成都会略有不同)

生成出来的标准差:1.7079

平均值接近3.5很好理解。 因为每次掷出来的结果是1、2、3、4、5、6。 每个结果的概率是1/6。所以加权平均值就是3.5。

第二步,画出来看看

我们把生成的数据用直方图画出来直观地感受一下:

可以看到1~6分布都比较平均,不错。

第三步,抽一组抽样来试试

我们接下来随便先拿一组抽样,手动算一下。例如我们先从生成的数据中随机抽取10个数字:

这10个数字的结果是: [3, 4, 3, 6, 1, 6, 6, 3, 4, 4]

平均值:4.0

标准差:1.54

可以看到,我们只抽10个的时候,样本的平均值(4.0)会距离总体的平均值(3.5)有所偏差。

有时候我们运气不好,抽出来的数字可能偏差很大,比如抽出来10个数字都是6。那平均值就是6了。 为什么会出现都是6的情况呢?因为我比较6…哦不是,因为这就是随机的魅力呀!

不过不要担心,接下去就是见证奇迹的时刻。

第四步,见证奇迹的时刻

我们让中心极限定理发挥作用。现在我们抽取1000组,每组50个。

我们把每组的平均值都算出来。

这一共1000个平均值大概是这样的:[3.44, 3.42, 3.22, 3.2, 2.94 … 4.08, 3.74] (我肯定不会把1000个数字都写完,又没有稿费可以骗)

然后,我们把这1000个数字用直方图画出来:

TADA! 完美地形成了正态分布

结果打印如下:

平均值:3.48494

标准差:0.23506

实际应用

在实际生活当中,我们不能知道我们想要研究的对象的平均值,标准差之类的统计参数中心极限定理在理论上保证了我们可以用只抽样一部分的方法,达到推测研究对象统计参数的目的

在上文的例子中,掷骰子这一行为的理论平均值3.5是我们通过数学定理计算出来的。而我们在实际模拟中,计算出来的样本平均值的平均值(3.48494)确实已经和理论值非常接近了。

每日托福单词

adrenaline  n.  肾上腺素

analogous  adj. 类似的

precipitate  v. 促使,导致  adj. 仓促的,匆忙的

alienate  v. 使疏远

permanent  adj. 永久的,永恒的

推荐阅读:

精彩知识回顾

深度学习之激活函数详解

深度学习之卷积神经网络CNN理论与实践详解

深度学习之RNN、LSTM及正向反向传播原理

TreeLSTM Sentiment Classification

一分钟搞懂的算法之BPE算法

【干货】神经网络SRU

基于attention的seq2seq机器翻译实践详解

【干货】基于注意力机制的seq2seq网络

【干货】GRU神经网络


欢迎关注深度学习自然语言处理公众号,我会每天更新自己在机器学习深度学习NLPlinuxpython以及各种数学知识学习的一点一滴!再小的人也有自己的品牌!期待和你一起进步!

长按识别二维码

点个赞呗

中心极限定理通俗介绍相关推荐

  1. 中心极限定理-通俗理解

    中心极限定理-通俗理解: 1.大量相互独立的随机变量,其求和后的平均值服从正态分布,分布是指按照每个平均值的出现频数去判断分布 2.给定一个任意分布的总体.每次从这些总体中随机抽取 n 个抽样,一共抽 ...

  2. 大数定理和中心极限定理的通俗理解。

    一直觉得大数定理和中心极限定理很神秘,很模糊.这次下决心来搞一个彻底清楚,研究一下. 先介绍一下大数定理.网上查了一下由下面几个版本. 切比雪夫大数定律:用统计方法来估计期望的理论依据.E(X)≈1n ...

  3. 通俗讲解 依概率收敛,大数定理和中心极限定理

    通俗讲解 依概率收敛,大数定理和中心极限定理 依概率收敛 首先说一下结论,依概率收敛是一种基础证明工具,可以类比到高数中的极限定义,将一种直觉上的 "逼近某个数" 用数学公式来定义 ...

  4. 通俗的角度理解遍历性定理 (从大数定理,中心极限定理再到遍历性定理)

    文章目录 遍历性定理 所以先理解什么是大数定律 顺便再看看中心极限定理 再看遍历性定理 今天开始学时间序列分析,老师讲了一个名词叫遍历性定理. 遍历性定理 百度百科上的定义: 遍历性定理类似于截面数据 ...

  5. 通俗理解大数定律、中心极限定理

    依概率收敛 https://www.zhihu.com/question/19911209/answer/876481176 来源 不知道各位在学习概率论之初是不是也有我这样的想法:**在实验次数足够 ...

  6. python验证中心极限定理_中心极限定理的最最通俗解释

    一.什么是中心极限定理 在适当的条件下,大量相互独立随机变量的均值经适当标准化后依分布收敛于正态分布.每次从这些总体中随机抽取 n 个抽样,一共抽 m 次. 然后把这 m 组抽样分别求出平均值, 这些 ...

  7. 概率论总结(四): 大数定律及中心极限定理

    一.大数定律 1.弱大数定理(辛钦大数定理) 我们先用通俗的语言来介绍大数定理是干什么的?然后再给出它严格的数学定义. 通俗地说,辛钦大数定理是说,对于独立同分布且具有均值μ\muμ得随机变量X1X_ ...

  8. python验证中心极限定理_我竟然混进了Python高级圈子!

    原标题:我竟然混进了Python高级圈子! 现如今,计算机科学.人工智能.数据科学已成为技术发展的主要推动力. 无论是要翻阅这些领域的文章,还是要参与相关任务,你马上就会遇到一些拦路虎: 想过滤垃圾邮 ...

  9. 中心极限定理_统计学基础知识3——正态分布与大数定律、中心极限定理

    正态分布,也称常态分布,又名高斯分布. 正态曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形,因此人们又经常称之为钟形曲线. 若随机变量X服从一个数学期望为μ.方差为σ^2的正态分布,记为N(μ,σ ...

  10. UA MATH563 概率论的数学基础 中心极限定理24 随机变量的特征函数

    UA MATH563 概率论的数学基础 中心极限定理24 随机变量的特征函数 定义 假设XXX是定义在(Ω,F,P)(\Omega,\mathcal{F},P)(Ω,F,P)上的随机变量,定义 ϕ(t ...

最新文章

  1. ORACLE-osi分层模型.md
  2. china-pub赠书啦,超值畅销书5本
  3. centos7 批量创建samba用户_蜗牛星际基于centos7的NAS系统配置
  4. 一些比较少用但比较有用的linux命令备忘
  5. java -XX:+PrintFlagsInitial该命令可以查看所有JVM参数启动的初始值
  6. 富士 FinePix F401
  7. oracle link binaries,Oracle环境中使用NFS的mount选项
  8. mysql数据库自动化脚本备份_mysql 自动化脚本备份
  9. 程序员的算法课(3)-递归(recursion)算法
  10. 【资料】机器学习笔记的github镜像下载(github个人star数量排名175)
  11. 基于Keras搭建mnist数据集训练识别的Pipeline
  12. Redis学习笔记 - 数据类型与API(2)String
  13. 华为详解海思Hi3716高清机顶盒芯片方案
  14. apple 关闭双重认证_这次Apple可以关闭工作吗?
  15. Preparing transaction:done Verifying transaction:failed RemoveError:‘requests‘ is a dependency of **
  16. iOS-Property follows Cocoa naming convention for returning ‘owned‘ objects
  17. non-compatible bean definition of same name and class [com.echo.util.FileUploadDispatcher]
  18. wow Warlock shushia PVP DZ
  19. 投资黄金,当然选贸易场行员平台真宝金业,安全有保障,返佣高,平仓返。
  20. 基于R和ArcGIS两种方法制作土地利用转移图详细教程

热门文章

  1. UML 结构图之包图 总结
  2. 解题报告 noi 2005 智慧珠游戏(BT 搜索)
  3. Design Pattern 设计模式【观察者】
  4. ASP.net 连接interbase数据库
  5. springboot中解决servlet乱码问题,使用配置类注册过滤器解决
  6. as 与 is 的区别
  7. centos6.5安装sublime text 2
  8. YT工作日志-0911
  9. spring 属性注入
  10. ehcache讲解及实例