Python进行各项统计检验
统计性检验
本文分为四个部分:
- 正态性检验
- 相关性检验
- 参数统计假设检验
- 非参数统计假设检验
1.正态性检验
本部分列出了可用于检查数据是否具有高斯分布的统计检验。
w检验(Shapiro-wilk test)
检验数据样本是否具有高斯分布。
from scipy.stats import shapiro
data = [21,12,12,23,19,13,20,17,14,19]
stat,p = shapiro(data)
print("stat为:%f" %stat,"p值为:%f" %p)
更多内容
- scipy.stats.shapiro:https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.shapiro.html
- 维基百科:https://en.wikipedia.org/wiki/Shapiro%E2%80%93Wilk_test
2.相关性检验
本节列出了可用于检查两个样本是否相关的统计检验
皮尔逊相关系数
检验两个样本是否具有单调关系
假设
- 每个样本中的观察是独立同分布的
- 每个样本的观察都是正态分布的
- 每个样本的观察具有相同的方差
from scipy.stats import pearsonr
data1 = [21,12,12,23,19,13,20,17,14,19]
data2 = [12,11,8,9,10,15,16,17,10,16]
corr,p = pearsonr(data1,data2)
print("corr为:%f" %corr,"p值为:%f" %p)
更多信息
- scipy.stats.pearsonr:https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.pearsonr.html
- 维基百科:https://en.wikipedia.org/wiki/Pearson_correlation_coefficient
卡方检验
检验两个分类变量是相关的还是独立的
假设
- 用于计算列联表的观察是独立的
- 列联表的每个单元格中有25个或更多个实例
from scipy.stats import chi2_contingency
data1 = [21,12,12,23,19,13,20,17,14,19]
data2 = [12,11,8,9,10,15,16,17,10,16]
stat,p,dof,expected = chi2_contingency(data1,data2)
print("stat为:%f" %stat,"p值为:%f" %p)
更多信息
- scipy.stats.chi2_contingency:https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.chi2_contingency.html
- 维基百科:https://en.wikipedia.org/wiki/Chi-squared_test
3.参数统计假设检验
本节列出了可用于比较数据样本的统计检验
T检验
检验两个独立样本的均值是否存在显著差异
假设
- 每个样本中的观察是独立同分布的
- 每个样本的观察都是正态分布的
- 每个样本中的观察具有相同的方差
from scipy.stats import ttest_ind
data1 = [21,12,12,23,19,13,20,17,14,19]
data2 = [12,11,8,9,10,15,16,17,10,16]
stat,p = ttest_ind(data1,data2)
print("stat为:%f" %stat,"p值为:%f" %p)
更多信息
- scipy.stats.ttest_ind:https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.ttest_ind.html
- 维基百科:https://en.wikipedia.org/wiki/Student%27s_t-test
配对T检验
检验
检验两个配对样本的均值是否cun'存在显著差异
假设
- 每个样本中的观察是独立同分布的
- 每个样本的观察都是正态分布的
- 每个样本中的观察具有相同的方差
- 每个yang样本的观察结果是成对的
from scipy.stats import ttest_rel
data1 = [21,12,12,23,19,13,20,17,14,19]
data2 = [12,11,8,9,10,15,16,17,10,16]
stat,p = ttest_rel(data1,data2)
print("stat为:%f" %stat,"p值为:%f" %p)
更多信息
- scipy.stats.ttest_rel:https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.ttest_rel.html
- 维基百科:https://en.wikipedia.org/wiki/Student%27s_t-test
方差分析
测试两个或两个以上独立样本的均值是否存在显著差异
假设
- 每个样本中的观察是独立同分布的
- 每个样本的观察都是正态分布的
- 每个样本中的观察具有相同的方差
from scipy.stats import f_oneway
data1 = [21,12,12,23,19,13,20,17,14,19]
data2 = [12,11,8,9,10,15,16,17,10,16]
stat,p = f_oneway(data1,data2)
print("stat为:%f" %stat,"p值为:%f" %p)
更多信息
- scipy.stats.f_oneway:https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.f_oneway.html
- 维基百科:https://en.wikipedia.org/wiki/Analysis_of_variance
4.非参数统计假设检验
曼-惠特尼U检验
检验两个独立样本的分布是否相等。
假设
- 每个样本中的观察是独立同分布的
- 可以对每个样本中的观察进行排序
from scipy.stats import mannwhitneyu
data1 = [21,12,12,23,19,13,20,17,14,19]
data2 = [12,11,8,9,10,15,16,17,10,16]
stat,p = mannwhitneyu(data1,data2)
print("stat为:%f" %stat,"p值为:%f" %p)
更多信息
- scipy.stats.mannwhitneyu:https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.mannwhitneyu.html
- 维基百科:https://en.wikipedia.org/wiki/Mann%E2%80%93Whitney_U_test
威尔科克森符号秩检验
检验两个pei配对样本的分布shi是否均等
假设
- 每个样本中的观察是独立同分布
- 可以对每个样本中的观察进行排序
from scipy.stats import wilcoxon
data1 = [21,12,12,23,19,13,20,17,14,19]
data2 = [12,11,8,9,10,15,16,17,10,16]
stat,p = wilcoxon(data1,data2)
print("stat为:%f" %stat,"p值为:%f" %p)
更多信息
- scipy.stats.wilcoxon:https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.mannwhitneyu.html
- 维基百科:https://en.wikipedia.org/wiki/Mann%E2%80%93Whitney_U_test
Kruskal-wallis H检验
检验两个或多个独立样本的分布是否相等
假设
- 每个样本中的观察是独立同分布的
- 可以对每个样本中的观察进行排序
from scipy.stats import kruskal
data1 = [21,12,12,23,19,13,20,17,14,19]
data2 = [12,11,8,9,10,15,16,17,10,16]
stat,p = kruskal(data1,data2)
print("stat为:%f" %stat,"p值为:%f" %p)
更多信息
- scipy.stats.kruskal:https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.kruskal.html
- 维基百科:https://en.wikipedia.org/wiki/Kruskal%E2%80%93Wallis_one-way_analysis_of_variance
参考链接:http://www.atyun.com/26911.html
Python进行各项统计检验相关推荐
- python进行各项统计检验_运用python进行相关性统计检验
本文主要记录了python对数据进行相关性统计检验的实现方法. 主要是: 1.连续变量VS连续变量:皮尔逊相关系数 2.分类变量VS分类变量:卡方检验 3.连续变量VS多分类变量:F检验 4.连续变量 ...
- python进行各项统计检验_Python进行各项统计检验
统计性检验 本文分为四个部分: 正态性检验 相关性检验 参数统计假设检验 非参数统计假设检验 1.正态性检验 本部分列出了可用于检查数据是否具有高斯分布的统计检验. w检验(Shapiro-wilk ...
- python进行各项统计检验_用Python进行最最最基础的统计检定
记得之前再写关于Python绘制统计图的时候就说过,准备写一篇关于数理统计的. 一直都在忙论文,忙完后也比较懒散.就一直拖到了现在. 虽然时隔的比较久远,但还是准备把这个总结出来了. 所需要的Pyth ...
- python 统计检验_[转载]Python替代SPSS进行各项统计检验
采用python的scipy库完成常用的假设检验, 配合pandas库非常好用 正态性检验 检验数据样本是否具有高斯分布. from scipy.stats import shapiro data = ...
- python字典数据类型笔记_Python学习笔记整理(六)Python中的字典
一.字典介绍 字典(dictionary)是除列表意外python之中最灵活的内置数据结构类型.列表是有序的对象结合,字典是无序的对象集合.两者之间的区别在于:字典当中的元素是通过键来存取的,而不是通 ...
- python 编程入门-python编程入门(第3版)
python编程入门(第3版)简洁明了,通俗易懂,非常适合初学者,但是我觉得处理大型任务,多线程应该是必不可少的,这对于初学者来说也是需要了解的,当然了,多线程是个复杂的话题,高级用户可以再深入研究, ...
- linux运维必学python吗_linux运维一定要学python吗?
基于Python本身的优点:简单,易学,速度快,免费.开源,高层语言,可移植性,解释性,可扩展性,可嵌入性,丰富的库,独特的语法.Python已经成为现在编程的必备语言.作为"胶水语言&qu ...
- 运维学python用不上_不会Python开发的运维终将被淘汰?
简介 Python 语言是一种面向对象.直译式计算机程序设计语言,由 Guido van Rossum 于 1989 年底发明.Python 语法简捷而清晰,具有丰富和强大的类库,具有可扩展性和可嵌入 ...
- 不会Python开发的运维终将被淘汰?
Python语言是一种面向对象.直译式计算机程序设计语言,由Guido van Rossum于1989年底发明.Python语法简捷而清晰,具有丰富和强大的类库,具有可扩展性和可嵌入性,是现代比较流行 ...
- python 学习笔记(6)-转载
一.字典介绍 字典(dictionary)是除列表意外python之中最灵活的内置数据结构类型.列表是有序的对象结合,字典是无序的对象集合.两者之间的区别在于:字典当中的元素是通过键来存取的,而不是通 ...
最新文章
- git切换ssh和http协议
- easyui 删除指定行
- SAP S/4HANA里的生产订单,标识其已经结束生产可以发货的字段
- Android-Universal-Image-Loader 的使用说明
- python字符串的切片方式是[n、m、不包括m_python字符串的操作(去掉空格strip(),切片,查找,连接join(),分割split(),转换首字母大写, 转换字母大小写...)...
- 适用于树莓派Raspberry Pi的嵌入式QT平台(二) -- 在Windows下用Qt Creator开发编译Raspberry Qt 5应用程序...
- iOS 搭建XMPP环境时添加依赖库报错及解决
- 介绍如何隐藏JDataGridBean的SplashScreen?
- 关于部分网页打不开的解决方法详解
- zookeeper启动报错already running as process处理
- 无线控制需要服务器,无线局域网无线控制器管理用户通过RADIUS服务器认证的配置-Cisco.PDF...
- 从简单的线性方程开始了解Paddle Fluid 的全连接层 FC
- 华硕笔记本重装系统bios设置
- 数据挖掘学习笔记01——数据挖掘的基本流程
- 加密货币为什么有价值?
- 为Web前端开发者准备的免费PSD资源网站
- 正确思维,和非理性自我斗争
- 区块链签章 + 云签约 让合同的法律效力无懈可击
- android KE or NE分析
- [Astyle]使用bat命令快速格式化整个项目文件