统计性检验

本文分为四个部分:

  • 正态性检验
  • 相关性检验
  • 参数统计假设检验
  • 非参数统计假设检验

1.正态性检验

本部分列出了可用于检查数据是否具有高斯分布的统计检验。

w检验(Shapiro-wilk test)

检验数据样本是否具有高斯分布。

from scipy.stats import shapiro
data = [21,12,12,23,19,13,20,17,14,19]
stat,p = shapiro(data)
print("stat为:%f" %stat,"p值为:%f" %p)

更多内容

  • scipy.stats.shapiro:https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.shapiro.html
  • 维基百科:https://en.wikipedia.org/wiki/Shapiro%E2%80%93Wilk_test

2.相关性检验

本节列出了可用于检查两个样本是否相关的统计检验

皮尔逊相关系数

检验两个样本是否具有单调关系

假设

  • 每个样本中的观察是独立同分布的
  • 每个样本的观察都是正态分布的
  • 每个样本的观察具有相同的方差
from scipy.stats import pearsonr
data1 = [21,12,12,23,19,13,20,17,14,19]
data2 = [12,11,8,9,10,15,16,17,10,16]
corr,p = pearsonr(data1,data2)
print("corr为:%f" %corr,"p值为:%f" %p)

更多信息

  • scipy.stats.pearsonr:https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.pearsonr.html
  • 维基百科:https://en.wikipedia.org/wiki/Pearson_correlation_coefficient

卡方检验

检验两个分类变量是相关的还是独立的

假设

  • 用于计算列联表的观察是独立的
  • 列联表的每个单元格中有25个或更多个实例
from scipy.stats import chi2_contingency
data1 = [21,12,12,23,19,13,20,17,14,19]
data2 = [12,11,8,9,10,15,16,17,10,16]
stat,p,dof,expected = chi2_contingency(data1,data2)
print("stat为:%f" %stat,"p值为:%f" %p)

更多信息

  • scipy.stats.chi2_contingency:https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.chi2_contingency.html
  • 维基百科:https://en.wikipedia.org/wiki/Chi-squared_test

3.参数统计假设检验

本节列出了可用于比较数据样本的统计检验

T检验

检验两个独立样本的均值是否存在显著差异

假设

  • 每个样本中的观察是独立同分布的
  • 每个样本的观察都是正态分布的
  • 每个样本中的观察具有相同的方差
from scipy.stats import ttest_ind
data1 = [21,12,12,23,19,13,20,17,14,19]
data2 = [12,11,8,9,10,15,16,17,10,16]
stat,p = ttest_ind(data1,data2)
print("stat为:%f" %stat,"p值为:%f" %p)

更多信息

  • scipy.stats.ttest_ind:https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.ttest_ind.html
  • 维基百科:https://en.wikipedia.org/wiki/Student%27s_t-test

配对T检验

检验

检验两个配对样本的均值是否cun'存在显著差异

假设

  • 每个样本中的观察是独立同分布的
  • 每个样本的观察都是正态分布的
  • 每个样本中的观察具有相同的方差
  • 每个yang样本的观察结果是成对的
from scipy.stats import ttest_rel
data1 = [21,12,12,23,19,13,20,17,14,19]
data2 = [12,11,8,9,10,15,16,17,10,16]
stat,p = ttest_rel(data1,data2)
print("stat为:%f" %stat,"p值为:%f" %p)

更多信息

  • scipy.stats.ttest_rel:https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.ttest_rel.html
  • 维基百科:https://en.wikipedia.org/wiki/Student%27s_t-test

方差分析

测试两个或两个以上独立样本的均值是否存在显著差异

假设

  • 每个样本中的观察是独立同分布的
  • 每个样本的观察都是正态分布的
  • 每个样本中的观察具有相同的方差
from scipy.stats import f_oneway
data1 = [21,12,12,23,19,13,20,17,14,19]
data2 = [12,11,8,9,10,15,16,17,10,16]
stat,p = f_oneway(data1,data2)
print("stat为:%f" %stat,"p值为:%f" %p)

更多信息

  • scipy.stats.f_oneway:https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.f_oneway.html
  • 维基百科:https://en.wikipedia.org/wiki/Analysis_of_variance

4.非参数统计假设检验

曼-惠特尼U检验

检验两个独立样本的分布是否相等。

假设

  • 每个样本中的观察是独立同分布的
  • 可以对每个样本中的观察进行排序
from scipy.stats import mannwhitneyu
data1 = [21,12,12,23,19,13,20,17,14,19]
data2 = [12,11,8,9,10,15,16,17,10,16]
stat,p = mannwhitneyu(data1,data2)
print("stat为:%f" %stat,"p值为:%f" %p)

更多信息

  • scipy.stats.mannwhitneyu:https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.mannwhitneyu.html
  • 维基百科:https://en.wikipedia.org/wiki/Mann%E2%80%93Whitney_U_test

威尔科克森符号秩检验

检验两个pei配对样本的分布shi是否均等

假设

  • 每个样本中的观察是独立同分布
  • 可以对每个样本中的观察进行排序
from scipy.stats import wilcoxon
data1 = [21,12,12,23,19,13,20,17,14,19]
data2 = [12,11,8,9,10,15,16,17,10,16]
stat,p = wilcoxon(data1,data2)
print("stat为:%f" %stat,"p值为:%f" %p)

更多信息

  • scipy.stats.wilcoxon:https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.mannwhitneyu.html
  • 维基百科:https://en.wikipedia.org/wiki/Mann%E2%80%93Whitney_U_test

Kruskal-wallis H检验

检验两个或多个独立样本的分布是否相等

假设

  • 每个样本中的观察是独立同分布的
  • 可以对每个样本中的观察进行排序
from scipy.stats import kruskal
data1 = [21,12,12,23,19,13,20,17,14,19]
data2 = [12,11,8,9,10,15,16,17,10,16]
stat,p = kruskal(data1,data2)
print("stat为:%f" %stat,"p值为:%f" %p)

更多信息

  • scipy.stats.kruskal:https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.kruskal.html
  • 维基百科:https://en.wikipedia.org/wiki/Kruskal%E2%80%93Wallis_one-way_analysis_of_variance

参考链接:http://www.atyun.com/26911.html

Python进行各项统计检验相关推荐

  1. python进行各项统计检验_运用python进行相关性统计检验

    本文主要记录了python对数据进行相关性统计检验的实现方法. 主要是: 1.连续变量VS连续变量:皮尔逊相关系数 2.分类变量VS分类变量:卡方检验 3.连续变量VS多分类变量:F检验 4.连续变量 ...

  2. python进行各项统计检验_Python进行各项统计检验

    统计性检验 本文分为四个部分: 正态性检验 相关性检验 参数统计假设检验 非参数统计假设检验 1.正态性检验 本部分列出了可用于检查数据是否具有高斯分布的统计检验. w检验(Shapiro-wilk ...

  3. python进行各项统计检验_用Python进行最最最基础的统计检定

    记得之前再写关于Python绘制统计图的时候就说过,准备写一篇关于数理统计的. 一直都在忙论文,忙完后也比较懒散.就一直拖到了现在. 虽然时隔的比较久远,但还是准备把这个总结出来了. 所需要的Pyth ...

  4. python 统计检验_[转载]Python替代SPSS进行各项统计检验

    采用python的scipy库完成常用的假设检验, 配合pandas库非常好用 正态性检验 检验数据样本是否具有高斯分布. from scipy.stats import shapiro data = ...

  5. python字典数据类型笔记_Python学习笔记整理(六)Python中的字典

    一.字典介绍 字典(dictionary)是除列表意外python之中最灵活的内置数据结构类型.列表是有序的对象结合,字典是无序的对象集合.两者之间的区别在于:字典当中的元素是通过键来存取的,而不是通 ...

  6. python 编程入门-python编程入门(第3版)

    python编程入门(第3版)简洁明了,通俗易懂,非常适合初学者,但是我觉得处理大型任务,多线程应该是必不可少的,这对于初学者来说也是需要了解的,当然了,多线程是个复杂的话题,高级用户可以再深入研究, ...

  7. linux运维必学python吗_linux运维一定要学python吗?

    基于Python本身的优点:简单,易学,速度快,免费.开源,高层语言,可移植性,解释性,可扩展性,可嵌入性,丰富的库,独特的语法.Python已经成为现在编程的必备语言.作为"胶水语言&qu ...

  8. 运维学python用不上_不会Python开发的运维终将被淘汰?

    简介 Python 语言是一种面向对象.直译式计算机程序设计语言,由 Guido van Rossum 于 1989 年底发明.Python 语法简捷而清晰,具有丰富和强大的类库,具有可扩展性和可嵌入 ...

  9. 不会Python开发的运维终将被淘汰?

    Python语言是一种面向对象.直译式计算机程序设计语言,由Guido van Rossum于1989年底发明.Python语法简捷而清晰,具有丰富和强大的类库,具有可扩展性和可嵌入性,是现代比较流行 ...

  10. python 学习笔记(6)-转载

    一.字典介绍 字典(dictionary)是除列表意外python之中最灵活的内置数据结构类型.列表是有序的对象结合,字典是无序的对象集合.两者之间的区别在于:字典当中的元素是通过键来存取的,而不是通 ...

最新文章

  1. git切换ssh和http协议
  2. easyui 删除指定行
  3. SAP S/4HANA里的生产订单,标识其已经结束生产可以发货的字段
  4. Android-Universal-Image-Loader 的使用说明
  5. python字符串的切片方式是[n、m、不包括m_python字符串的操作(去掉空格strip(),切片,查找,连接join(),分割split(),转换首字母大写, 转换字母大小写...)...
  6. 适用于树莓派Raspberry Pi的嵌入式QT平台(二) -- 在Windows下用Qt Creator开发编译Raspberry Qt 5应用程序...
  7. iOS 搭建XMPP环境时添加依赖库报错及解决
  8. 介绍如何隐藏JDataGridBean的SplashScreen?
  9. 关于部分网页打不开的解决方法详解
  10. zookeeper启动报错already running as process处理
  11. 无线控制需要服务器,无线局域网无线控制器管理用户通过RADIUS服务器认证的配置-Cisco.PDF...
  12. 从简单的线性方程开始了解Paddle Fluid 的全连接层 FC
  13. 华硕笔记本重装系统bios设置
  14. 数据挖掘学习笔记01——数据挖掘的基本流程
  15. 加密货币为什么有价值?
  16. 为Web前端开发者准备的免费PSD资源网站
  17. 正确思维,和非理性自我斗争
  18. 区块链签章 + 云签约 让合同的法律效力无懈可击
  19. android KE or NE分析
  20. [Astyle]使用bat命令快速格式化整个项目文件

热门文章

  1. 三菱PLC控制器FX3GA USB驱动 程序下载
  2. 3个简单的事情,使你的jQuery代码变得更加棒
  3. 安卓检测root代码
  4. oracle 切换cdb,CDB与PDB之间的切换方法
  5. 南阳oj 215 Sum
  6. postgresql中实现按周统计详解
  7. 社会化分享(附源码)
  8. pandas的自带数据集_Pandas教程:初学者入门必备,很全面,很详细!
  9. VMware vmdk文件打开方法
  10. 鸿蒙二部曲关系,用鸿蒙OS在蜂鸣器上放一曲《两只老虎》