python 卡方分布函数_推断统计分析(二):python验证三大抽样分布
推断统计分析:
抽样分布:从已知的总体中以一定的样本容量进行随机抽样,由样本的统计数所对应的概率分布称为抽样分布。抽样分布是统计推断的理论基础。
一、卡方分布
若n个相互独立的随机变量ξ₁、ξ₂、……、ξn,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布(chi-square distribution)。
随着卡方分布样本容量的增加,卡方分布的概率密度曲线趋于对称。当样本容量n -> +∞的时候,卡方分布 -> 正态分布,即卡方分布的极限分布就是正态分布。
x = np.linspace(0, 100, 100000)
for i in range(10, 51, 10):
y = stats.chi2.pdf(x, df=i)
plt.plot(x, y, label='n={}'.format(i))
plt.title('卡方分布随样本容量增加的变化关系图')
plt.legend()
plt.show()
随着样本容量的增加,卡方分布的概率密度曲线趋于对称。样本容量越趋近于+∞,卡方分布越趋近于正态分布。
二、T分布
设X1服从标准正态分布N(0,1),X2服从自由度为n的χ2分布,且X1、X2相互独立,则称变量t=X1(X2/n)1/2所服从的分布为自由度为n的T分布。
t分布的概率密度函数和正态分布的概率密度函数都是偶函数(左右对称的)。t分布随着样本容量的增加,就越来越接近正态分布,即t分布的极限分布也是正态分布。
当样本容量在 30-35之间时,t分布与标准正态分布难以区分
当样本容量达到120时,t分布与标准正态分布实际上完全相同了
x = np.linspace(-3, 3, 100)
plt.plot(x, t.pdf(x, 1), label='df=1')
plt.plot(x, t.pdf(x, 30), label='df=2')
plt.plot(x, t.pdf(x, 120), label='df=120')
plt.plot(x[::5], norm.pdf(x[::5]), 'kx', label='normal')
plt.legend()
plt.title('t分布随样本容量增加的变化关系图')
plt.show()
t分布一直是对称的,随着样本容量的增加,越来越趋近于正态分布,当样本容量到30时,t分布与标准正态分布难以区分,当样本容量达到120时,t分布与标准正态分布实际上完全相同了。
三、F分布
设X1服从自由度为m的χ2分布,X2服从自由度为n的χ2分布,且X1、X2相互独立,则称变量F=(X1/m)/(X2/n)所服从的分布为F分布,其中第一自由度为m,第二自由度为n。
x = np.linspace(-1, 8, 100000)
plt.plot(x, stats.f.pdf(x, 1, 10), label='m=1, n=10')
plt.plot(x, stats.f.pdf(x, 5, 10), label='m=5, n=10')
plt.plot(x, stats.f.pdf(x, 100, 10), label='m=10, n=10')
plt.ylim(0, 1)
plt.title('F分布的概率密度函数')
plt.legend()
plt.show()
F分布是不对称的,随着样本容量的增加,图形并不会趋近于正态分布。
python 卡方分布函数_推断统计分析(二):python验证三大抽样分布相关推荐
- python filter函数_第九篇:Python中lambda、filter和map函数
修修心养养性 世无常贵,事无常师,靠人不如靠己. 大纲 函数类型定义及特性 lambda函数定义及使用 filter函数定义及使用 map函数定义及使用 引入函数类型概念 函数类型定义:python中 ...
- python rstrip函数_【C++实现python字符串函数库】strip、lstrip、rstrip方法
[C++实现python字符串函数库]strip.lstrip.rstrip方法 这三个方法用于删除字符串首尾处指定的字符,默认删除空白符(包括'\n', '\r', '\t', ' '). s.st ...
- python 卡方分布函数_卡方检验2-python代码实现
统计学,风控建模经常遇到卡方分箱算法ChiMerge.卡方分箱在金融信贷风控领域是逻辑回归评分卡的核心,让分箱具有统计学意义(单调性).卡方分箱在生物医药领域可以比较两种药物或两组病人是否具有显著区别 ...
- python opengl 截图_初试PyOpenGL二 (Python+OpenGL)基本地形生成与高度检测
在上文中,讲述了PyOpenGL的基本配置,以及网格,球形的生成,以及基本的漫游.现在利用上一篇的内容,来利用高程图实现一个基本的地形,并且,利用上文中的第三人称漫游,以小球为视角,来在地形上前后左右 ...
- python cut函数_一天学会Python Web框架(七)工具函数
一.字符串操作包 string_helper.py是字符串操作包,主要对字符串进行检查.过滤和截取等处理. #!/usr/bin/evn python # coding=utf-8 import re ...
- python hist函数_虎哥的python小技巧放送之绘制统计图(2)
先放出第一期让大家回顾一下上次的内容 虎哥的python小技巧放送之绘制统计图(1) 第一期主要给大家讲了一些图形设置的东西.这一次开始正式带大家画图~ 折线图:折线图可以通过matplotlib中的 ...
- python退出函数_【转】python 退出程序的方式
python程序退出方式[sys.exit() os._exit() os.kill() os.popen(...)] 知乎说明 1. sys.exit() 执行该语句会直接退出程序,这也是经常使用的 ...
- python done函数_【转】Python内置函数(47)——open
英文文档: open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, ope ...
- python正则化函数_正则化方法及Python实现
正则化有助于克服过度拟合模型的问题.过度拟合是偏差和方差平衡的概念.如果过度拟合,机器学习模型将具有较低的准确性.当我们的机器学习模型试图从数据中学习更多属性时,就会添加来自训练数据的噪声.这里的噪声 ...
- python grid函数_(转)Python Tkinter Grid布局管理器详解
Grid(网格)布局管理器会将控件放置到一个二维的表格里.主控件被分割成一系列的行和列,表格中的每个单元(cell)都可以放置一个控件. 什么时候使用Grid管理器 grid管理器是Tkinter里面 ...
最新文章
- AI促进药物发现:未来是多细胞研究
- TENSORFLOW较好的博客
- 无需人脸检测,实时3维人脸姿态估计img2pose 2020
- 彩票假设 (Lottery Ticket Hypothesis) 在CV、NLP和OOD领域的应用
- 删表出现mysql错误1051_无法删除mySQL表. (错误1050)
- 最全的Pycharm debug技巧
- Redis中的键值过期操作
- python创建多个文件_Python创建文件夹与文件的快捷方法
- python 面试题2
- 中山大学计算机专业研究生报录比,中山大学报录比(中山大学2019各专业报录比)...
- d3 scale详解
- mysql对应systables_mysql5.7中的sys表详解(转)
- 给大家送一个机械轴键盘~
- 深海迷航创造模式火箭怎么飞_《我的世界》怎么用火箭使鞘翅飞起来?
- 锁卡,每插入一张新卡都需要进行解锁
- wps怎么图片透明,在WPS中如何设置图片的透明度?-wps excle 图片透明度
- 分享一款Latex在线编辑器 | 附Latex常用模版
- c#:判断一个数组元素中否有重复元素
- Java基础知识与集合部分面试题整理
- java 图片水印_JAVA实现图片水印