spss正态性检验_SPSS和R中的正态分布的确定和几何均值的计算
一般数据处理中中我们经常遇到数据求几何均值(GM)的情况,因此需要判断数据是否是正态分布或者对数正态分布。SPSS和R都可以用来检验数据的正态性。相比较而言,SPSS更接近于windows下的操作方式,更容易理解,因此下面就介绍一下在SPSS和R中正态性的检验和几何均值的计算。
1. SPSS
先用R生成100个随机数,设定种子为1(set.seed,为了可重复)
set.seed(1)mydata1 > head(mydata1)[1] 0.1206386 2.5509300 -0.5068858 6.7858424 2.9885233 -0.4614052> plot(mydata1, mydata1)
在SPSS,分析-描述统计-探索-绘制,勾选“带检验的正态图”,得到结果,如图
其中,KS检验和SW检验都是检验正态性的方法,一般来说,大样本量看KS,小样本量看SW检验。具体大样本小样本的分界线,有说50,有说2000,暂时没有找到比较确信的说法。一般来说应该看SW结果就可以了。当Sig >0.5 时,服从原假设,即数据正态分布。
SPSS 规定:当样本含量3 ≤n ≤5000 时,结果以Shapiro - Wilk (W 检验) 为准,当样本含量n > 5000 结果以Kolmogorov - Smirnov 为准。
SAS 规定:当样本含量n ≤2000 时,结果以Shapiro - Wilk (W 检验) 为准,当样本含量n >2000 时,结果以Kolmogorov - Smirnov (D 检验) 为准。
2. R
在R中使用SW检验,只需要用shapiro.test函数即可,如下
> shapiro.test(mydata1)
Shapiro-Wilk normality test
data: mydata1W = 0.9956, p-value = 0.9876
如果样本量大,用KS检验,函数为lillie.test (需要安装package,nortest)
注意:在R中使用lillefors检验,就相当于在SPSS探索分析中的正态性检验的Kolmogorov-Smirnov的lilliefors的修正值,二者结果是相同的。
> library(nortest)> lillie.test(mydata1)
Lilliefors (Kolmogorov-Smirnov) normality test
data: mydata1D = 0.047014, p-value = 0.8479
3. 拟合正态分布的数据
R中,对于正态分布的数据,在R中拟合时,使用mass包的fitdistr进行拟合
> fitdistr(mydata1,"normal") mean sd 2.3266621 2.6810912 (0.2681091) (0.1895818)
SPSS中的结果
SPSS-分析-描述统计-描述
4. 对数正态分布求几何均值
对于R中的对数正态分布数据,有两种方法进行拟合,一种是,先对原始数据取对数,然后求得取对数后的数据求算术均值,算术均值就是原始数据的几何均值。另一种是直接使用R中的函数(fitdistr,mass包),对呈对数正态分布数据进行拟合,得到几何均值。
> head(mydata2)#构建mydata2,是原始数据的指数次[1] 1.1282171 12.8190196 0.6023685 885.2254926 19.8563393 0.6303972> head(mydata1)[1] 0.1206386 2.5509300 -0.5068858 6.7858424 2.9885233 -0.4614052> fitdistr(mydata2, "log-normal") meanlog sdlog 2.3266621 2.6810912 (0.2681091) (0.1895818)
参考:
1. mamicode.com/info-detai
2. 杨斌. 正态性检验的几种方法比较[J]. 统计与决策, 2015(14):72-74.
3. http://tiramisutes.github.io/2015/10/08/ANOVA.html
4. https://bbs.pinggu.org/thread-2245925-1-1.html
spss正态性检验_SPSS和R中的正态分布的确定和几何均值的计算相关推荐
- 聚类分析在SPSS、Matlab与R中的实现(转载: Liu Xuhua 机会的数学 )
原文:https://mp.weixin.qq.com/s/1aBlwX11cBxw0sxONaHJRQ 笔记:修改后代码 ① a<-scan() 7.90 39.77 8.49 12.94 ...
- 大数据分析R中泊松回归模型实例
如果您知道如何以及何时使用泊松回归,它可能是一个非常有用的工具.在大数据分析R中泊松回归模型实例中,我们将深入研究泊松回归,它是什么以及R程序员如何在现实世界中使用它. 具体来说,我们将介绍: 1)泊 ...
- 主成分分析结果成分不显著_spss、R做出来的主成分分析因子载荷和得分结果不同...
spss.R做出来的主成分分析因子载荷和得分结果不同 同样一组数据,我用spss.matlab.R中的princomp函数和vegan程序包中的rda函数多种计算方法做主成分分析,结果竟然不一样.我仔 ...
- 在R中统计数据的频数或者密度分布并图形化
在进行数据分析之前,我们往往要首先对数据有一个大致的了解.对于统计性的数据,最好首先看看数据是如何分布,并把分布图示化,可以帮助我们确定后续的分析策略.现在,以R中著名的iris数据为例来计算其中一组 ...
- Meta系列(二): 在R中如何计算效应值
Meta系列(二): 在R中如何计算效应值 1 简介 在上一篇文章中,我们介绍了meta分析中有哪些效应值,以及什么是随机效应模型和混合效应模型.下面我们就继续来看看这些效应值的函数在R中如何计算和运 ...
- 学java要学spss吗_将SPSS文件读入R中
回答(14) 2 years ago 我有一个类似的问题,并在 read.spss 帮助中提示后解决了这个问题 . 使用包 memisc ,您可以导入 portable SPSS文件,如下所示: da ...
- 简单介绍一下R中的几种统计分布及常用模型
统计学上分布有很多,在R中基本都有描述.因能力有限,我们就挑选几个常用的.比较重要的简单介绍一下每种分布的定义,公式,以及在R中的展示. 统计分布每一种分布有四个函数:d――density(密度函数) ...
- ⅰcp经济模型_简单介绍一下R中的几种统计分布及常用模型
统计学上分布有很多,在R中基本都有描述.因能力有限,我们就挑选几个常用的.比较重要的简单介绍一下每种分布的定义,公式,以及在R中的展示. 统计分布每一种分布有四个函数:d――density(密度函数) ...
- R中多分组多变量分析计算的问题
背景与问题 在数据分析中最常用的的参数方法,都需要先进行正态性.方差齐性检验.然而R中Shapiro-Wilk(夏皮罗)W正态性检验[命令shapiro.test()].Kolmogorov-Smir ...
最新文章
- uniapp H5 JSSDK封装使用
- less及编译工具介绍
- 如何通过简化标题来提升核心关键词排名?
- python的编程模式-举例讲解Python设计模式编程中的访问者与观察者模式
- 高级交叉报表例子程序(C#)中明细列统计数据错误改正!
- map和hash_map
- 计算机缺少fixos.dll,fix_toolbox.dll
- OpenShift 4 - Fedora CoreOS (2) - 准备 Fedora CoreOS 安装环境的三个工具
- Android:Service通知Activity更新界面
- es6.0 java,es6.0.0源码idea启动问题
- c++ vector向量
- 如何制作媲美memz的炫酷特效恶搞程序
- 围棋人机大战属于计算机在什么方面的应用,新华社评围棋人机大战:不怕电脑记性好 就怕爱学习...
- java超链接大全_JavaFX超链接
- 决定一台计算机运行速度快慢的配件是什么,电脑运行慢换什么配件
- 如何下载哔哩哔哩里的视频
- deb文件怎么安装(deb文件怎么安装到Cydia)
- 包饺子、看表演、逛庙会 中外居民北京“过大年”
- unity 5.x android发布注意事项
- 女人爱与不爱你的表现
热门文章
- .两个windowsform之间的值传递
- (25):Silverlight 2 综合实例之Live Search
- 使用Android DataBinding BindingAdapter和Dagger 2
- HDU1754 —— I Hate It 线段树 单点修改及区间最大值
- 51nod 1274 最长递增路径(DP)
- IBM AppScan 安全漏洞问题修复(.net)
- 第二章 在HTML页面里使用javaScript
- Entity Framework默认值字段不起作用解决方法
- 如何自定义一个异常类
- 【报告分享】后疫情时代第一个消费狂欢:品牌如何转型与突围.pdf(附下载链接)...