R语言连续变量正态性检验
在医学统计分析中,对于连续变量我们总是需要了解数据的分布状态,是正态分布数据还是偏态分布数据,只有了解了数据的分布状态才可以进行后续的统计分析工作。
正态性检验方法主要包括图示法和假设检验法两大类。图示法包括直方图or核密度图和QQ图orP-P图;常用的假设检验法主要包括Shapiro-Wilk检验(Shapiro检验)和Kolmogorov-Smirnov检验。
判断数据是否分布正态,我们通常先做出直方图或者核密度图来整体评估数据是否是正态分布,若数据分布偏态严重或者尖峰,可认为数据不符合正态分布;如果从图形上不容易判断数据的分布状态,再利用其它检验方法对数据进行正态性检验。我们通常会结合多个方法来综合判断数据是否是正态分布。
一、图示法
1、直方图
直方图(histogram)是用于展示分组数据分布的一种图形,它是用矩形的宽度和高度(即面积)来表示频数分布的。绘制该图时,在平面直角坐标系中,用横轴表示数据分组,纵轴表示频数或频率,这样就形成了一个矩形(即直方图)。
直方图实现代码:
hist(x)
2、Q-Q图
Q-Q图实现代码:
seed(100)x<-rnorm(100)library(car)qqnorm(x)qqline(x)
结果大致呈现出一条直线,可判断数据大致符合正态分布。
二、假设检验法
当图形法不能准确判断数据是否正态分布资料时,可采用假设检验的方法来判断。正态性检验方法的选择和样本量有关:在医学统计分析中我们常常以50为分界点,对于50以内的样本量我们常采用Shapiro-Wilk检验分析,对于样本量大于等于50的数据,常采用Kolmogorov-Smirnov检验分析。(在SPSS常以5000为分界点,在SAS中常以2000为分界点,但在医学研究中50例就算是较大样本了。)
1、当样本量大于等于50时,采用kolmogorov-Smirnov检验;
> ks.test(x,"pnorm") #样本量大于等于50One-sample Kolmogorov-Smirnov testdata: x
D = 0.073373, p-value = 0.6546
alternative hypothesis: two-sided
2、当样本量小于50时,采用Shapiro-Wilk检验。
> shapiro.test(x) #样本量小于50Shapiro-Wilk normality testdata: x
W = 0.98836, p-value = 0.535
值得注意的是,检验结果P值>0.05时,我们认为数据是正态分布资料,P值<0.05时数据是偏态分布资料。
R语言连续变量正态性检验相关推荐
- R语言连续变量等级划分
R语言连续变量等级划分 ###################等级划分######################数据读取dat <- read.csv("F:/Desktop/ccv ...
- 基于R语言的正态性检验
正态W检验方法 Shapiro–Wilk shapiro.test(x) 其中x是由数据构成的向量,长度在3-500之间 经验分布的Kolmogorov-Smirnov检验方法 ks.test(x, ...
- R语言数据分析笔记——t检验(含正态性检验和方差齐性检验在SPSS和R语言中的操作t检验(单样本、双独立样本、配对样本)在Excel、SPSS、R语言中的操作)
前言:本文为个人学习笔记,为各大网站上的教学内容之综合整理,综合整理了①假设分析的基础知识.②正态性检验和方差齐性检验在SPSS和R语言中的操作.③t检验(单样本.双独立样本.配对样本)在Excel. ...
- R语言DALEX包的model_profile函数对caret包生成的多个算法模型的连续变量进行分析、使用Acumulated Local Effects (ALE)方法解释某个连续特征和目标值关系
R语言使用DALEX包的model_profile函数对caret包生成的多个算法模型的连续变量进行分析.使用Acumulated Local Effects (ALE)方法解释某个连续特征和目标值y ...
- R语言ggplot2可视化:自定义设置连续变量图例(legend)宽度(width)、自定义设置连续变量图例位置(position)、自定义设置连续变量图例连续渐变
R语言ggplot2可视化:自定义设置连续变量图例(legend)宽度(width).自定义设置连续变量图例位置(position).自定义设置连续变量图例连续渐变 #初始示例(图例互相分离.图例细线 ...
- R语言Kolmogorov-Smirnov假设检验(正态性检验):检验数据的正态性
R语言Kolmogorov-Smirnov假设检验(正态性检验):检验数据的正态性 目录 R语言Kolmogorov-Smirnov假设检验(正态性检验):检验数据的正态性
- R语言与Shapiro正态性检验
学习笔记 参考书目:<统计学:从数据到结论>-吴喜之: 关于正态性检验问题 利用QQ图进行正态性检验 关于检测正态性的直观方法为正态QQ图,它绘制样本数据的分位与理论正态分布的分位图形.如 ...
- R语言使用cph函数和rcs函数构建限制性立方样条cox回归模型、使用anova函数进行方差分析通过p值确认指定连续变量和风险值HR之间是否存在非线性关系
R语言使用cph函数和rcs函数构建限制性立方样条cox回归模型.使用anova函数进行方差分析通过p值确认指定连续变量和风险值HR之间是否存在非线性关系 目录
- R语言使用cph函数和rcs函数构建限制性立方样条cox回归模型、使用rms包的Predict函数计算指定连续变量和风险比HR值的关系、可视化连续变量和风险值HR的关系
R语言使用cph函数和rcs函数构建限制性立方样条cox回归模型.使用rms包的Predict函数计算指定连续变量和风险比HR值的关系.可视化连续变量和风险值HR的关系 目录
- R语言使用cph函数和rcs函数构建限制性立方样条cox回归模型、使用rms包的Predict函数计算指定连续变量在不同分组变量下和风险比HR值的关系、使用ggplot2可视化变量与风险值HR的关系
↵ R语言使用cph函数和rcs函数构建限制性立方样条cox回归模型.使用rms包的Predict函数计算指定连续变量在不同分组变量下和风险比HR值的关系.使用ggplot2可视化连续变量在不同分组变 ...
最新文章
- 清除扇区和低格哪个好_C++入门篇(四十五),结点删除与链表的清除
- C++高级程序员基本技能你都具备吗?
- 201771010119穷吉第八周
- 8 MyBatis动态SQL
- R软件中 文本分析安装包 Rjava 和 Rwordseg 傻瓜式安装方法四部曲
- JavaScript运算符的优先级(案例讲解)
- linux swing 字体颜色,Linux 下 java Swing 中文字体变成方框的问题解决
- Windows直接获取文件的哈希值
- webpack配置路径问题 1
- 《嵌入式 – GD32开发实战指南》第8章 PWM输出
- WinRunner:强大的企业级自动化测试工具
- 神州信息盘活农村三资,以金融科技服务三农助推乡村振兴
- 三相异步电机----电机公式(三)
- 布法罗纽约州立大学计算机排名,2019年QS世界大学排名纽约州立大学布法罗分校排名第313...
- OVM虚拟化开启公测,支持Docker全新体验!
- pr电影幕布开场模式怎么做?快来看看这里!
- 大麦人脸识别系统,如何支撑马拉松赛事?
- python二级选择题及答案_转载 |python二级选择题与分析(6)
- 7-41 最佳情侣身高差
- 浅论WBS分解在软件项目中的应用