数据不满足正态分布,方差齐性怎么办?

实验数据的分布情况(服从正态分布)和变异情况(方差齐性)是以统计假设参数的前提条件的方式提出来的。大都认为数据不服从正态分布,或不满足方差齐性,就不能进行有关的检验(方差分析、Z检验、t检验)。

什么是服从正态分布?

所谓的样本均数是服从正态分布是指每组数据来自正态分布的总体,而所有的样本数据也绝对不可能满足正态分布,但只要通过正态分布拟合检验就可以了。

什么是方差齐性?

所谓方差齐性,即所比较的各族样本来自总体的方差相等,是通过样本方差比较来判断的。显然各组样本的方差不会绝对相等,但只要彼此相差不过于悬殊,就可以认为“方差齐性”基本满足,严格地说这就是“方差齐性检验”。实际上只要何种样本方差之间的差别在统计学上无显著性差异,就认为已满足方差齐性的条件,就可以进行统计学的参数检验了,否则就认为比较的各族样本来自总体“方差不齐”。
为什么要满足正态分布和方差齐性?

然而,对于为什么统计假设的参数检验必须要满足正态分布和方差齐性条件?不满足正态分布或不满足方差齐性将意味着什么?大都未能给予充分的解释。由于这些条件根本上是来自中心极限定理所要求的,许多对统计学原理不了解的学习者和研究者,在进行统计假设的参数检验时,也缺少对“正态分布”和“方差齐性”条件的正确认识。有的人认为方差齐性不满不能直接进行统计假设检验。有的人需要对统计量进行转换,选择另外一个变换后的统计量进行参数检验。

数据正态化转换方法有哪些?

了解决数据的正态性问题,数学家们总结了很多转化方法,但是没有百事通,都需要对症下药,根据数据的实际分布情况,选择合适的转化方法。

计算数据的峰度和偏度,根据数据的分布性状和参数,是否决定做正态性转换。

(1)偏度检验
偏度:完全对称偏度=0(正态分布),值<0,则为负偏态;值>0,为正偏态,可通过画图判断。

(2)峰度检验

是判断曲线陡峭或平缓的指标,如果峰度=0,说明该变量分布合适(常峰态,但罕见);如果峰度>0,说明该变量的分布陡峭(尖峰态);反之,如果峰度<0,说明变量的分布平缓(低峰态)。峰度也需要通过显著检验来判断与正态分布是否有显著差别。我们可能可以通过转换来达到或接近正态分布。

3)根据变量分布形状,确定相应的转换方法

(正偏态的数据可考虑直接使用以下方法,如果呈负偏态的数据,需要先做反向转换后再进行以下转换操作。)

1、中度偏态:偏度标准误差()的2~3倍,可考虑取根号来转换,n为样本量,SPSS指令:sqrt

2、高度偏态:偏度标准误差()大于3倍以上,可考虑取对数,自然对数和以10为底的对数(力度较强),看情况而定,SPSS指令:Ln,Lg10


3、对于服从二项分布的率或百分比资料,可考虑使用平方根正弦变换,SPSS指令:Sqrt;

4、常用的还有Box-Cox转换,bootstraps法等,Box-Cox转换常见与是解决连续性变量(线性回归)不满足正态分布的情况。

SPSS上没有,在R语言中,可以使用car包中的power Transform()函数进行转换;

疑问集锦:

(1)不是所有的数据都需要正态性转换,一般适用于小样本的数据,较大样本我们可以认为近似正态分布;

(2)非正态的数据经过转换后一定为服从正态分布吗?不一定所有的数据经过转换后都能通过正态性检验,非正态性的数据也可以采用非参数检验进行比较;

(3)在进行统计描述的时候,是描述转换后的变量情况,还是转换前的?转换前的为宜,可与其他人的研究进行横向比较。

(4)如果转换一次后仍然不满足正态分布怎么办?在结果的基础上再次检验其分布形态,从头做起,直到达到目的。

(5)什么是反向转换?简单来说就是,最大的变成最小的,最小的变成最大的。

https://zhuanlan.zhihu.com/p/125583862

数据不满足正态分布,方差齐性怎么办?相关推荐

  1. python 方差齐性检验_Python数据科学:正态分布与t检验

    昨天介绍了两连续变量的相关分析,今天来说说连续变量与分类变量(二分)之间的检验. 通俗的来讲,就是去发现变量间的关系. 连续变量数量为一个,分类变量数量为两个. 总体:包含所有研究个体的集合. 样本: ...

  2. python 检验数据正态分布程度_python 实现检验33品种数据是否是正态分布

    我就废话不多说了,直接上代码吧! # -*- coding: utf-8 -*- """ Created on Thu Jun 22 17:03:16 2017 @aut ...

  3. R语言使用caret包的preProcess函数进行数据预处理:对所有的数据列进行YeoJohnson变换(将非正态分布数据列转换为正态分布数据、可以处理负数)、设置参数为YeoJohnson

    R语言使用caret包的preProcess函数进行数据预处理:对所有的数据列进行YeoJohnson变换(将非正态分布数据列转换为正态分布数据.可以处理负数).设置method参数为YeoJohns ...

  4. c语言如何判断数据是否符合正态分布_统计学里的数据正态性检验

    在前面的文章中讲过,很多模型的假设条件都是数据是服从正态分布的.这篇文章主要讲讲如何判断数据是否符合正态分布.主要分为两种方法:描述统计方法和统计检验方法. 01.描述统计方法 描述统计就是用描述的数 ...

  5. 数据不是正态分布能做结构方程模型吗?

    在结构方程模型数据分析中,如果数据是非正态分布,且是很严重的非正态分布,我们该如何处理?一个方法是采用对数转换等方法将非正态分布转换为正态分布,之后再分析.然而,对这个问题很多学者不建议转换,因为转换 ...

  6. python正态性检验:检验数据是否服从正态分布

    文章目录 夏皮罗一威尔克检验法(Shapiro-Wilk test) kstest see also 推荐两种检验方法:1.夏皮罗一威尔克检验法(Shapiro-Wilk test):2.kstest ...

  7. 如何判断一组数据是否符合正态分布呢?

    在很多模型及假设检验中都需要满足一个假设条件:数据需服从正态分布.这篇文章主要讲讲如何判断数据是否符合正态分布.主要分为两种方法:描述统计方法和统计检验方法. 判断一组数据是否为正态分布的方法 描述统 ...

  8. 正态分布具有很多好的性质,很多模型假设数据服从正态分布。但是如果数据不服从正态分布怎么办?

    数据整体服从正态分布,那样本均值和方差则相互独立.正太分布具有很多好的性质,很多模型假设数据服从正态分布.例如线性回归(linear regression),它假设误差服从正态分布,从而每个样本点出现 ...

  9. matlab 用Q-Q图检验某组数据是否服从正态分布 qqplot

    文章目录 任务 解决方案 任务 要使用某个模型,而这个模型的假设之一是数据服从正太分布. 需要先检验手上的数据是否服从正太分布. 解决方案 matlab的Q-Q图能检验数据是否服从正态分布,或者近似正 ...

最新文章

  1. P1083 借教室(标记永久化线段树/二分+前缀和)难度⭐⭐⭐★
  2. .htaccess详解
  3. 广度优先搜索——奇怪的电梯(洛谷 P1135)
  4. 鸿蒙开发者测评,看了下鸿蒙开发者测试版本
  5. Rect 的相关操作
  6. 九、索引与执行计划、索引的分类
  7. php求两个数组的差值,数组计算差值及项的小计,该如何处理
  8. 关于C++的建议,仅仅为了规范代码(一)
  9. JPA-update方法使用踩坑记
  10. 常见显示接口对比(LVDS eDP MIPI V-by-One HS)
  11. 英语之脆弱的,易受伤的
  12. canvas实现简单的画图功能
  13. 简述分布式锁的3种实现方式
  14. 别让用户发呆—设计中的防呆策略[转]
  15. i.MX8QM环境搭建
  16. 项目管理绝版秘籍——IT项目管理全套127个表格文档
  17. refresh matlab path,Matlab 习惯常用命令收集 转
  18. PDF转换软件测试工程师,软件测试工程师精选.pdf
  19. 向量几何在游戏编程中的使用1
  20. Vocus将在澳大利亚部署XGS-PON解决方案

热门文章

  1. csdn博客文章设置为隐私模式发布之后看不到的问题
  2. matlab sisotool工具DEMO
  3. scratch编程密室逃脱
  4. 微信公众号开发,报错{errcode:41005,errmsg:media data missing hint:}的解决办法---亲测有效
  5. python用turtle画小猪佩奇_python 用turtle 画小猪佩奇
  6. 云队友丨在注意力稀缺的时代,专注是你成败的关键筹码
  7. STM32L475 SPI驱动LCD ST7789V2详解
  8. Dapp 众筹项目1 合约代码编写
  9. Sql语句将两列合并成一列
  10. BootStrap详细应用-小bai前端框架进阶秘籍