经验分布定义为,

表示样本值,不大于任意实数x的样本个数,n表示样本总量。

根据格力文科定理,对于任意的实数x,当样本量足够大的时候,统计量与总体分布的函数值之间只有很小的差距,在实际上可以当做总体分布来使用。

设  是来自以 为分布函数的总体 的样本, 是经验分布函数,则有

对于固定的x,经验分布的 数学期望  是  总体分布。 

现在假设有200个球,分别标上了数字-100到+100 ,没有标零;现在,再取特定的x=0,每一次从200个球中抽取一个球,相应的数字要么小于零,要么大于零,数字小于零的概率是0.5,大于0的概率也是0.5。

大于零用0表示,小于零用1表示,这件事随机的,用X表示该随机变量,那么,X是一个服从两点分布的随机变量;这里为了保证是来自同一总体,必须是放回抽样。那么现在重复做20次这样的实验,就成了20重伯努利试验,因此在20次试验中,抽到小于零的球的个数 是随机变量,服从n=20,p=0.5的 二项分布。于是

对于特定的x,任意一次抽样所得样本X1 要么比x大,要么比x小,比x小的概率为F(x),即是小或大这件事服从0,1分布;现在抽样n次,得到n个样本,因此小于x的个数s(x) 服从二项分布;于是

import numpy as np
import time
import matplotlib.pyplot as plt
import matplotlib.mlab as mlab
from scipy.stats import norm
def caculate(len):#产生正态随机样本len = len #样本数量mu = 5sigma = 3np.random.seed(int(time.time()))s =lambda: np.random.normal(mu, sigma, len )samples=s()# 计算经验分布smax,smin=samples.max(),samples.min()listx=np.arange(smin,smax+0.1,0.05)count=lambda x:((samples<=x)*1).sum()fa=[count(i) for i in listx]faofn=np.array(fa)/len# 计算精确分布q=[norm.cdf((i-mu)/sigma) for i in listx]# 在同一幅图中展示图像return listx,faofn,q
if __name__ == '__main__':num=400listx,faofn,q=caculate(num)plt.subplot(221)# 经验分布plt.plot(listx,faofn)plt.plot(listx,q)plt.title('num of Samples:'+str(num))# 精确分布plt.plot(listx[:-1],5*np.diff(faofn)/np.diff(listx))plt.plot(listx[:-1],5*np.diff(q)/np.diff(listx))num=800listx,faofn,q=caculate(num)plt.subplot(222)plt.plot(listx,faofn)plt.plot(listx,q)plt.title('num of Samples:'+str(num))plt.plot(listx[:-1],5*np.diff(faofn)/np.diff(listx))plt.plot(listx[:-1],5*np.diff(q)/np.diff(listx))num=1800listx,faofn,q=caculate(num)plt.subplot(223)plt.plot(listx,faofn)plt.plot(listx,q)plt.title('num of Samples:'+str(num))plt.plot(listx[:-1],5*np.diff(faofn)/np.diff(listx))plt.plot(listx[:-1],5*np.diff(q)/np.diff(listx))num=10000listx,faofn,q=caculate(num)plt.subplot(224)plt.plot(listx,faofn)plt.plot(listx,q)plt.title('num of Samples:'+str(num))plt.plot(listx[:-1],5*np.diff(faofn)/np.diff(listx))plt.plot(listx[:-1],5*np.diff(q)/np.diff(listx))plt.show()

从上图的精确分布和经验分布可以看出,当样本量比较小的时候,经验和总体分布的拟合较差!随着样本量的上升,经验分布和精确分布几乎重合,这就验证了当样本量足够大时,经验分布和总体分布几乎相同。

从上图的经验概率密度和精确概率密度曲线我们可以看出,经验分布密度   在一个特定点处函数值在精确分布分布密度曲线上下波动,有时候处于上方有时候处于下方,具有随机性,但总的趋势和精确分布是相吻合 。到底是位于上方还位于下方,这个服从两点分布,两点分布的p参数能算出来吗?请在评论区留言

python演示,用经验分布逼近总体精确分布相关推荐

  1. Python演示正多边形逼近圆周过程中计算圆周率近似值

    问题描述: 很久以前推送过这样一篇文章, Python使用matplotlib绘制正多边形逼近圆周 很容易得知,当正多边形的边数变多时,多边形的周长会越来越接近外接圆的周长. 对于圆周,我们知道周长与 ...

  2. 我在学python-我在大学毕业后学习Linux、python的一些经验

    我在大学毕业后学习Linux.python的一些经验 掐指一算,自己已经毕业快半年了,这半年莫名其妙进外包圈子溜达了一圈,有幸退的早还是正常干一些事情吧,外包终究不是太适合刚入社会的毕业生,今天想把自 ...

  3. 我在大学毕业后学习Linux、python的一些经验

    我在大学毕业后学习Linux.python的一些经验 掐指一算,自己已经毕业快半年了,这半年莫名其妙进外包圈子溜达了一圈,有幸退的早还是正常干一些事情吧,外包终究不是太适合刚入社会的毕业生,今天想把自 ...

  4. 九十九、Python所学经验分享

    @Author:Runsen @Date:2020/7/16 人生最重要的不是所站的位置,而是内心所朝的方向.只要我在每篇博文中写得自己体会,修炼身心:在每天的不断重复学习中,耐住寂寞,练就真功,不畏 ...

  5. neo4j的查询语法Cypher+python演示

    全栈工程师开发手册 (作者:栾鹏) 架构系列文章 MATCH 查询节点 根据label,属性的值查询单个(多个)节点.其中label,attr,value可以省略 MATCH (node1_var : ...

  6. Aspose.Slides for Python演示文稿指定幻灯片放映设置

    Aspose.Slides for Python演示文稿指定幻灯片放映设置 使您的应用程序无需使用 Microsoft PowerPoint 即可在 Python 中读取和写入 PowerPoint ...

  7. Catalan 数之Python演示

    这里写自定义目录标题 Catalan 数之Python演示 带限制条件的路径总数 Python演示代码说明 Python代码 Catalan 数之Python演示 关于Catalan 数,英文的下面网 ...

  8. python数据分析项目——【国家统计局】学历分布/CPI/金融行业学历分布

    数据来源: 从国家统计局上获得的数据,有部分数据进行了调整.其中学历分布.金融行业学历分布基于第6次人口普查结果(2010)年,CPI趋势为截止2021.3.1之前最近18个月. 文中使用到的数据: ...

  9. UA MATH563 概率论的数学基础 中心极限定理13 Glivenko-Cantelli定理:经验分布函数收敛到真实分布

    UA MATH563 概率论的数学基础 中心极限定理13 Glivenko-Cantelli定理:经验分布函数收敛到真实分布 这一讲我们介绍大数定律的一个应用,说明经验分布函数会收敛到真实的分布.先回 ...

  10. 华为USG统一安全边界网关的设计、演示、经验鉴证实评-卷A

    华为USG统一安全边界网关的设计.演示.经验鉴证实评-卷A   课程目标: 本课程卷A的核心目标是:对华为USG防火墙的入门规划.架构设计.和任何环境都可能用到的必配功能,及相关工作经验进行演示和描述 ...

最新文章

  1. jsonp跨域ajax跨域get方法
  2. Visual Stdio 无法直接启动带有“类库输出类型”的项目若要调试此项目,请在此解决方案中添加一个引用库项目的可执行项目。将这个可执行项目设置为启动项目!
  3. 领域驱动设计之聚合与聚合根实例一
  4. [翻译]SQL Server 工作集消息
  5. 基于深度学习的驾驶行为预测方法
  6. selenium自动化测试-2.浏览器基本操作
  7. ef设置非自增长id_Ef core 如何设置主键
  8. AS3.0文档类:FLASH右键菜单文档类
  9. spring boot redis分布式锁
  10. java中枚举有什么用_java枚举原来还能这么用
  11. 一文看懂码灵半导体CFW32C7UL系列产品应用(八):扫码设备应用(上)
  12. 3dmax教程技术:3dmax 怎么去掉贴图_3dmax如何去掉贴图
  13. 赵小楼《天道》《遥远的救世主》深度解析(137) 职业的责任担当,活的认真
  14. micropython入门指南电子版_MicroPython入门指南
  15. Linux 设备驱动
  16. 02_Keil5报错 error: #5: cannot open source input file “XXX.h”: No such file or directory解决方法
  17. 三分钟了解阿里云产品:对象存储OSS概述
  18. 阿里云技术专家解读 | 行业首创电商搜索模板
  19. cassandra4.0.6试用
  20. 【相识】亚马逊云科技 Community Builders 新成员

热门文章

  1. 实战案例丨腾讯安全托管服务MSS助力数字广东重保期间“0事故”
  2. 【学习体会】泊松表面重建
  3. 编写存储过程批量造数据
  4. 网站备案 应该找域名商还是空间商备案
  5. 毕业设计指导教师评语 计算机,毕业设计指导教师评语
  6. python爬虫 笔趣阁
  7. OceanBase数据库Docker部署文档
  8. c语言中指针几个字节,【C++】一个指针占几个字节?为什么呢?
  9. 1 PPT默认初始设置(主题颜色、撤回次数、自动保存、图片压缩、字体嵌入、多格式导出、参考线、默认字体、默认样式和清除占位符)
  10. xp计算机内存条启动,xp系统出现“xx内存不能为read或written”怎么解决