python 显著性检验_Python SciPy 统计显著性检验(Statistical Significance Tests)
1、什么是统计显著性检验?
在统计中,统计意义是指产生的结果背后有原因,不是随机产生或偶然产生的。
SciPy为我们提供了一个名为scipy.stats的模块,该模块具有执行统计显着性检验的功能。
以下是执行此类测试时很重要的一些技术和关键字:
统计假说
假设是关于总体参数的假设。
零假设
它假定该观察值在统计上不显着。
替代假设
它假设这些观察是由于某种原因。
它替代零假设。
例如:
为了评估学生,我们将采取以下措施:
“学生比平均水平差”-作为无效假设,并且:
“学生胜于平均水平”-作为替代假设。
单尾检验
当我们的假设仅测试值的一侧时,称为“单尾检验”。
例如:
对于原假设:
“均值等于k”,我们可以有另一个假设:
“均值小于k”,或:
“平均值大于k”
两尾测试
当我们的假设正在测试两个值时。
例如:
对于原假设:
“均值等于k”,我们可以有另一个假设:
“平均值不等于k”
在这种情况下,平均值小于或大于k,并且需要检查双方。
Alpha值
阿尔法值是有意义的水平。
例如:
要拒绝零假设,数据必须接近极限。
通常取值为0.01、0.05或0.1。
P值
P值表明数据实际上有多接近极限。
比较P值和alpha值以建立统计显着性。
如果p值<= alpha,我们将拒绝原假设,并说该数据具有统计意义。否则,我们接受原假设。
2、T-Test
T检验用于确定两个变量的均值之间是否存在显着差异。 并让我们知道它们是否属于同一分布。
这是一条两尾测试。
函数ttest_ind()接受两个大小相同的样本,并生成t统计量和p值的元组。
例如:
查找给定值v1和v2是否来自同一分布:import numpy as np
from scipy.stats import ttest_ind
v1 = np.random.normal(size=100)
v2 = np.random.normal(size=100)
res = ttest_ind(v1, v2)
print(res)
Result:Ttest_indResult(statistic=0.40833510339674095, pvalue=0.68346891833752133)
如果只想返回p值,请使用pvalue属性:
例如:import numpy as np
from scipy.stats import ttest_ind
v1 = np.random.normal(size=100)
v2 = np.random.normal(size=100)
res = ttest_ind(v1, v2).pvalue
print(res)
Result:
0.68346891833752133
3、KS-Test
KS测试用于检查给定值是否遵循分布。
该函数将要测试的值和CDF作为两个参数。
CDF可以是返回概率的字符串或可调用函数。
它可以用作一尾或二尾测试。
默认情况下,它是两个尾部的。我们可以将参数Alternative传递为两侧,较小或较大之一的字符串。
例如:
查找给定值是否遵循正态分布:import numpy as np
from scipy.stats import kstest
v = np.random.normal(size=100)
res = kstest(v, 'norm')
print(res)
Result:
KstestResult(statistic=0.047798701221956841, pvalue=0.97630967161777515)
4、数据的统计描述
为了查看数组中值的摘要,我们可以使用describe()函数。
它返回以下描述:number of observations (nobs)
minimum and maximum values = minmax
mean
variance
skewness
kurtosis
例如:
显示数组中值的统计描述:import numpy as np
from scipy.stats import describe
v = np.random.normal(size=100)
res = describe(v)
print(res)
Result:
DescribeResult(
nobs=100,
minmax=(-2.0991855456740121, 2.1304142707414964),
mean=0.11503747689121079,
variance=0.99418092655064605,
skewness=0.013953400984243667,
kurtosis=-0.671060517912661
)
5、正态性检验(Skewness和Kurtosis)
正态性检验基于偏态和峰度。
normaltest()函数为原假设返回p值:
“ x来自正态分布”。
Skewness(偏态):
数据对称性的度量。
对于正态分布,该值为0。
如果为负,则表示数据向左倾斜。
如果为正,则表示数据偏斜正确。
Kurtosis(峰度):
衡量数据是重还是轻尾到正态分布的度量。
正峰度意味着尾巴很重。
负峰度意味着轻微拖尾。
例如:
查找数组中值的偏度和峰度:import numpy as np
from scipy.stats import skew, kurtosis
v = np.random.normal(size=100)
print(skew(v))
print(kurtosis(v))
Result:0.11168446328610283
-0.1879320563260931
例如:
查找数据是否来自正态分布:import numpy as np
from scipy.stats import normaltest
v = np.random.normal(size=100)
print(normaltest(v))
Result:NormaltestResult(statistic=4.4783745697002848, pvalue=0.10654505998635538)
python 显著性检验_Python SciPy 统计显著性检验(Statistical Significance Tests)相关推荐
- 二十一、Python中的Scipy统计库
@Author : By Runsen @Written Date:2019/04/24 @modified Date:2020/5/14 作者介绍:Runsen目前大三下学期,专业化学工程与工艺,大 ...
- ks检验python代码_python scipy stats.kstest用法及代码示例
进行Kolmogorov-Smirnov测试是否合身. 这将针对给定的分布G(x)对观察到的随机变量的分布F(x)进行测试.在原假设下,两个分布相同,F(x)= G(x).替代假设可以是" ...
- gamma分布python代码_python scipy stats.gamma用法及代码示例
伽玛连续随机变量. 作为一个实例rv_continuous类,gamma对象从中继承了通用方法的集合(完整列表请参见下文),并使用特定于此特定发行版的详细信息来完善它们. 注意: 的概率密度函数gam ...
- python奇异值分解_python scipy 奇异值分解 SVD
svd函数返回三个分解部分u,s,vh,由于s是一个对角矩阵,因此s是一个一维数组,保存对角线上的非零值 s中的每个值与vh的行向量以及u中的列向量对应,默认按照从大到小的顺序排列,他表示与其对应向量 ...
- About Significance Tests
After completing this tutorial, you will know: The Student's t-test for quantifying the difference b ...
- python 显著性差异_比萨斜塔——统计显著性检验
Dataset 比萨斜塔是意大利最大的旅游景点之一.几百年来这座塔慢慢靠向一边,最终达到5.5度的倾斜角度,在顶端水平偏离了近3米.年度数据pisa.csv文件记录了从1975年到1987年测量塔的倾 ...
- [转载] python查看的统计量_python 描述性统计_Python中的基本统计:描述性统计
参考链接: Python中的统计函数 1(中位数和平均值的度量) python 描述性统计 The field of statistics is often misunderstood, but it ...
- python软件设计数据分析统计服_Python 和 R 数据分析/挖掘工具互查
写在前面 在此总结一些在数据分析/挖掘中可能用到的功能,方便大家索引或者从一种语言迁移到另一种.当然,这篇博客还会随时更新(不会另起一篇,为了方便大家索引),请大家如果有需要收藏到书签中. 如果大家还 ...
- python中的scipy基础知识_python中SciPy是什么?
python中Numpy常用于计算二维数组计算,而python的另一个库SciPy库与Numpy有着密切的关系,是需要通过Numpy为基础,同时也是通过Numpy数据来操控科学计算.常见的是插值运算. ...
- python统计元素个数_python怎么统计列表中元素的个数
python统计列表中元素的个数的方法:可以通过count()方法来实现.该方法可以统计字符串中某个字符出现的次数,并返回子字符串在字符串中出现的次数.具体用法如:[count=List.count( ...
最新文章
- Struts2自定义拦截器实例—登陆权限验证
- vi编辑器基本使用方法
- Java-Class-C:java.util.Date
- P3600-随机数生成器【dp,数学期望】
- c 语言中随机数填充数组,c – 生成唯一随机数的数组
- ElasticSearch索引
- php中json字符串转json对象数组对象,php – 将JSON字符串解析为数组,而不是对象
- python编程软件哪个好-来 看看谁最适合学Python编程
- Mysql 定时备份操作
- matlab连续信号傅里叶变换,连续信号的傅里叶变换及matlab显示
- QGraphicsView 如何实现百度地图按照鼠标点进行放大缩小效果
- 四川眉山中院宣判两起特大跨国电信诈骗案
- 1.3、操作系统的发展和分类
- 创建自己的人脸识别程序
- Web网站模板-教育培训响应式网站模板(HTML+CSS+JavaScript)
- 未来教育计算机三级数据库演示大题,2019年计算机三级数据库考试强化试题及答案003...
- Oracle 将多列合并成一列
- 2021漳州一中历年高考成绩查询,2021漳州一中录取分数线预测
- 关于uniapp的下拉刷新,上拉加载的使用
- 级联H桥逆变器的单矢量模型预测控制Simulink仿真