1、什么是统计显著性检验?

在统计中,统计意义是指产生的结果背后有原因,不是随机产生或偶然产生的。

SciPy为我们提供了一个名为scipy.stats的模块,该模块具有执行统计显着性检验的功能。

以下是执行此类测试时很重要的一些技术和关键字:

统计假说

假设是关于总体参数的假设。

零假设

它假定该观察值在统计上不显着。

替代假设

它假设这些观察是由于某种原因。

它替代零假设。

例如:

为了评估学生,我们将采取以下措施:

“学生比平均水平差”-作为无效假设,并且:

“学生胜于平均水平”-作为替代假设。

单尾检验

当我们的假设仅测试值的一侧时,称为“单尾检验”。

例如:

对于原假设:

“均值等于k”,我们可以有另一个假设:

“均值小于k”,或:

“平均值大于k”

两尾测试

当我们的假设正在测试两个值时。

例如:

对于原假设:

“均值等于k”,我们可以有另一个假设:

“平均值不等于k”

在这种情况下,平均值小于或大于k,并且需要检查双方。

Alpha值

阿尔法值是有意义的水平。

例如:

要拒绝零假设,数据必须接近极限。

通常取值为0.01、0.05或0.1。

P值

P值表明数据实际上有多接近极限。

比较P值和alpha值以建立统计显着性。

如果p值<= alpha,我们将拒绝原假设,并说该数据具有统计意义。否则,我们接受原假设。

2、T-Test

T检验用于确定两个变量的均值之间是否存在显着差异。 并让我们知道它们是否属于同一分布。

这是一条两尾测试。

函数ttest_ind()接受两个大小相同的样本,并生成t统计量和p值的元组。

例如:

查找给定值v1和v2是否来自同一分布:import numpy as np

from scipy.stats import ttest_ind

v1 = np.random.normal(size=100)

v2 = np.random.normal(size=100)

res = ttest_ind(v1, v2)

print(res)

Result:Ttest_indResult(statistic=0.40833510339674095, pvalue=0.68346891833752133)

如果只想返回p值,请使用pvalue属性:

例如:import numpy as np

from scipy.stats import ttest_ind

v1 = np.random.normal(size=100)

v2 = np.random.normal(size=100)

res = ttest_ind(v1, v2).pvalue

print(res)

Result:

0.68346891833752133

3、KS-Test

KS测试用于检查给定值是否遵循分布。

该函数将要测试的值和CDF作为两个参数。

CDF可以是返回概率的字符串或可调用函数。

它可以用作一尾或二尾测试。

默认情况下,它是两个尾部的。我们可以将参数Alternative传递为两侧,较小或较大之一的字符串。

例如:

查找给定值是否遵循正态分布:import numpy as np

from scipy.stats import kstest

v = np.random.normal(size=100)

res = kstest(v, 'norm')

print(res)

Result:

KstestResult(statistic=0.047798701221956841, pvalue=0.97630967161777515)

4、数据的统计描述

为了查看数组中值的摘要,我们可以使用describe()函数。

它返回以下描述:number of observations (nobs)

minimum and maximum values = minmax

mean

variance

skewness

kurtosis

例如:

显示数组中值的统计描述:import numpy as np

from scipy.stats import describe

v = np.random.normal(size=100)

res = describe(v)

print(res)

Result:

DescribeResult(

nobs=100,

minmax=(-2.0991855456740121, 2.1304142707414964),

mean=0.11503747689121079,

variance=0.99418092655064605,

skewness=0.013953400984243667,

kurtosis=-0.671060517912661

)

5、正态性检验(Skewness和Kurtosis)

正态性检验基于偏态和峰度。

normaltest()函数为原假设返回p值:

“ x来自正态分布”。

Skewness(偏态):

数据对称性的度量。

对于正态分布,该值为0。

如果为负,则表示数据向左倾斜。

如果为正,则表示数据偏斜正确。

Kurtosis(峰度):

衡量数据是重还是轻尾到正态分布的度量。

正峰度意味着尾巴很重。

负峰度意味着轻微拖尾。

例如:

查找数组中值的偏度和峰度:import numpy as np

from scipy.stats import skew, kurtosis

v = np.random.normal(size=100)

print(skew(v))

print(kurtosis(v))

Result:0.11168446328610283

-0.1879320563260931

例如:

查找数据是否来自正态分布:import numpy as np

from scipy.stats import normaltest

v = np.random.normal(size=100)

print(normaltest(v))

Result:NormaltestResult(statistic=4.4783745697002848, pvalue=0.10654505998635538)

python 显著性检验_Python SciPy 统计显著性检验(Statistical Significance Tests)相关推荐

  1. 二十一、Python中的Scipy统计库

    @Author : By Runsen @Written Date:2019/04/24 @modified Date:2020/5/14 作者介绍:Runsen目前大三下学期,专业化学工程与工艺,大 ...

  2. ks检验python代码_python scipy stats.kstest用法及代码示例

    进行Kolmogorov-Smirnov测试是否合身. 这将针对给定的分布G(x)对观察到的随机变量的分布F(x)进行测试.在原假设下,两个分布相同,F(x)= G(x).替代假设可以是" ...

  3. gamma分布python代码_python scipy stats.gamma用法及代码示例

    伽玛连续随机变量. 作为一个实例rv_continuous类,gamma对象从中继承了通用方法的集合(完整列表请参见下文),并使用特定于此特定发行版的详细信息来完善它们. 注意: 的概率密度函数gam ...

  4. python奇异值分解_python scipy 奇异值分解 SVD

    svd函数返回三个分解部分u,s,vh,由于s是一个对角矩阵,因此s是一个一维数组,保存对角线上的非零值 s中的每个值与vh的行向量以及u中的列向量对应,默认按照从大到小的顺序排列,他表示与其对应向量 ...

  5. About Significance Tests

    After completing this tutorial, you will know: The Student's t-test for quantifying the difference b ...

  6. python 显著性差异_比萨斜塔——统计显著性检验

    Dataset 比萨斜塔是意大利最大的旅游景点之一.几百年来这座塔慢慢靠向一边,最终达到5.5度的倾斜角度,在顶端水平偏离了近3米.年度数据pisa.csv文件记录了从1975年到1987年测量塔的倾 ...

  7. [转载] python查看的统计量_python 描述性统计_Python中的基本统计:描述性统计

    参考链接: Python中的统计函数 1(中位数和平均值的度量) python 描述性统计 The field of statistics is often misunderstood, but it ...

  8. python软件设计数据分析统计服_Python 和 R 数据分析/挖掘工具互查

    写在前面 在此总结一些在数据分析/挖掘中可能用到的功能,方便大家索引或者从一种语言迁移到另一种.当然,这篇博客还会随时更新(不会另起一篇,为了方便大家索引),请大家如果有需要收藏到书签中. 如果大家还 ...

  9. python中的scipy基础知识_python中SciPy是什么?

    python中Numpy常用于计算二维数组计算,而python的另一个库SciPy库与Numpy有着密切的关系,是需要通过Numpy为基础,同时也是通过Numpy数据来操控科学计算.常见的是插值运算. ...

  10. python统计元素个数_python怎么统计列表中元素的个数

    python统计列表中元素的个数的方法:可以通过count()方法来实现.该方法可以统计字符串中某个字符出现的次数,并返回子字符串在字符串中出现的次数.具体用法如:[count=List.count( ...

最新文章

  1. Struts2自定义拦截器实例—登陆权限验证
  2. vi编辑器基本使用方法
  3. Java-Class-C:java.util.Date
  4. P3600-随机数生成器【dp,数学期望】
  5. c 语言中随机数填充数组,c – 生成唯一随机数的数组
  6. ElasticSearch索引
  7. php中json字符串转json对象数组对象,php – 将JSON字符串解析为数组,而不是对象
  8. python编程软件哪个好-来 看看谁最适合学Python编程
  9. Mysql 定时备份操作
  10. matlab连续信号傅里叶变换,连续信号的傅里叶变换及matlab显示
  11. QGraphicsView 如何实现百度地图按照鼠标点进行放大缩小效果
  12. 四川眉山中院宣判两起特大跨国电信诈骗案
  13. 1.3、操作系统的发展和分类
  14. 创建自己的人脸识别程序
  15. Web网站模板-教育培训响应式网站模板(HTML+CSS+JavaScript)
  16. 未来教育计算机三级数据库演示大题,2019年计算机三级数据库考试强化试题及答案003...
  17. Oracle 将多列合并成一列
  18. 2021漳州一中历年高考成绩查询,2021漳州一中录取分数线预测
  19. 关于uniapp的下拉刷新,上拉加载的使用
  20. 级联H桥逆变器的单矢量模型预测控制Simulink仿真

热门文章

  1. ERP应用优势和劣势有哪些
  2. 有关单片机驱动IR2104遇到的问题及解决方法
  3. Make menuconfig详解(转)
  4. 计算机本地连接无internet访问权限,ipv4连接无internet访问权限怎么解决
  5. 乔布斯自传预售即夺下销售冠军
  6. 微信小程序转发功能详解
  7. Win7系统怎么开启远程桌面?Win7远程桌面怎么用
  8. 【语义分割】3、用mmsegmentation训练自己的分割数据集
  9. android 11.0 12.0Launcher3去掉默认的google搜索栏
  10. git 配置 diff 、 merge 工具: kdiff3