r语言平均值显著性检验_R语言与显著性检验学习笔记
一、何为显著性检验
显著性检验的思想十分的简单,就是认为小概率事件不可能发生。虽然概率论中我们一直强调小概率事件必然发生,但显著性检验还是相信了小概率事件在我做的这一次检验中没有发生。
显著性检验即用于实验处理组与对照组或两种不同处理的效应之间是否有差异,以及这种差异是否显著的方法。
常把一个要检验的假设记作H0,称为原假设(或零假设),与H0对立的假设记作H1,称为备择假设。
⑴在原假设为真时,决定放弃原假设,称为第一类错误,其出现的概率通常记作α;
⑵在原假设不真时,决定接受原假设,称为第二类错误,其出现的概率通常记作β。
通常只限定犯第一类错误的最大概率α,不考虑犯第二类错误的概率β。这样的假设检验又称为显著性检验,概率α称为显著性水平。
我们常用的显著性检验有t检验,卡方检验,相关性检验等,在做这一些检验时,有什么需要注意的呢?
二、正态性与P值
t检验,卡方检验,相关性检验中的pearson方法都是建立在正态样本的假设下的,所以在假设检验开始时,一般都会做正态性分析。在R中可以使用shapiro.test()。来作正态性检验。当然在norm.test包中还提供了许多其他的方法供我们选择。
P值是可以拒绝原假设的最小水平值。
三、四个重要的量
综合前面的叙述,我们知道研究显著性检验有四个十分重要的量:样本大小,显著性水平,功效,效应值。
样本大小:这个显然,样本越多,对样本的把握显然越准确,但是鉴于我们不可能拥有无限制的样本,那么多少个样本可以达到要求?今天的分享中我们可以通过R来找到答案。
显著性水平:犯第一类错误的概率,这个在做检验前我们会提前约定,最后根据P值来决定取舍。
功效:这个是在显著性检验中一般不提及但实际十分有用的量。它衡量真实事件发生的概率。也就是说功效越大,第二类错误越不可能发生。虽然显著性假设检验不提及它,但衡量假设检验的好坏的重要指标便是两类错误尽可能小。
效应值:备择假设下效应的量
四、用pwr包做功效分析
Pwr包中提供了以下函数:
下面我们来介绍以上一些函数的用法。
1、 t检验
调用格式:
pwr.t.test(n = NULL, d = NULL, sig.level =0.05, power =
NULL, type =c("two.sample", "one.sample",
"paired"),alternative = c("two.sided", "less","greater"))
参数说明:
N:样本大小
D:t检验的统计量
Sig.level:显著性水平
Power:功效水平
Type:检验类型,这里默认是两样本,且样本量相同
Alternative:统计检验是双侧还是单侧,这里默认为双侧
举例说明:已知样本量为60,单一样本t检验的统计量的值为0.2(这个可以通过t.test(data)$statistic取出来),显著水平α=0.1,那么功效是多少呢?
R中输入命令:
[plain] view plain copy
pwr.t.test(d=0.2,n=60,sig.level=0.10,type="one.sample",alternative="two.sided")
得到结果:
One-sample t test power calculation
n = 60
d = 0.2
sig.level = 0.1
power = 0.4555818
alternative = two.sided
我们可以看到,犯第二类错误的概率在50%以上,我们应该相信这个结果吗(无论根据P值来看是拒绝还是接受)?显然不行,那么需要多少个样本才能把第二类错误降低到10%呢?
在R中输入:
[plain] view plain copy
pwr.t.test(d=0.2,power=0.9,sig.level=0.10,type="one.sample",alternative="two.sided") 得到结果:
One-sample t test power calculation
n = 215.4542
d = 0.2
sig.level = 0.1
power = 0.9
r语言平均值显著性检验_R语言与显著性检验学习笔记相关推荐
- r语言清除变量_R语言(1)初识与数据结构
点击上方蓝字,记得关注我们! a picture is worth a thousand words! 一,R语言简介 1,R语言的发展 上世纪90年代初,新西兰奥克兰大学 Ross Ihaka 和 ...
- r - 求平均成绩_R语言 从零开始的笔记(一)
R是用于统计分析.绘图的语言和操作环境.R是属于GNU系统的一个自由.免费.源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具. R语言于生物学分析中的应用越来越广泛,在其他领域的统计绘图应用 ...
- r语言清除变量_R语言:结构方程模型、潜变量分析
原文链接: R语言:结构方程模型.潜变量分析tecdat.cn 结构方程模型入门 介绍 对于熟悉线性回归拟合结构方程模型的分析师来说,在R环境中,拟合结构方程模型涉及学习新的建模语法,新的绘图语法以 ...
- R语言JAVA对比_R语言统计分析应用与SAS、SPSS的比较
能够用来做统计分析的软件和程序很多,目前应用比较广泛的包括:SPSS, SAS.R语言,Matlab,S-PLUS,S-Miner等.下面我们来看一下各应用的特点: SPSS: 最简单的,都是菜单操作 ...
- r语言平均值显著性检验_R语言入门:检验相关性的显著性
一.问题 计算两个变量的相关性,但不知道相关性在统计上是否足够显著. 二.解决方案 cor.test函数不仅可以计算P值,还可以算出相关性的可信区间.如果变量来自正态分布总体,可以用默认的相关性定义, ...
- r语言平均值显著性检验_R语言:常用统计检验方法
转自http://blog.sciencenet.cn/home.php?mod=space&uid=255662&do=blog&id=240107 正态总体均值的假设检验 ...
- r语言 线性回归 相关系数_R语言系列第四期:R语言简单相关与回归
这一系列里前面的三个部分都是用于比较组间差异的各种方法. 在这个部分里,我们会为大家介绍如何使用R进行基础回归和相关分析,以及模型作图.置信区间的预估和展示. A. 简单线性回归 我们使用数据集thu ...
- r语言electricity数据集_R语言学习10-查看数据
当我们处理一个新的数据集的时候,第一件事就是要对数据做一个了解.数据的格式是什么?数据的维度是多少?变量名是什么? 变量如何存储? 是否缺少数据? 数据中是否有任何缺陷? 本次课将学习如何使用R的内置 ...
- r k-means 分类结果_R语言信用评分卡:数据分箱(binning)
作者:黄天元,复旦大学博士在读,热爱数据科学与R,热衷推广R在工业界与学术界的应用.邮箱:huang.tian-yuan@qq.com.欢迎合作交流 library(knitr) opts_chunk ...
- r语言 断轴 画图_R语言作图——Density plot
原创: 黄小仙 上次分享了小提琴曲线(violin plot)的作图方法,今天小仙同学给大家介绍一下如何用R画出漂亮的密度图(density plot). Step1. 绘图数据的准备 首先还是要把你 ...
最新文章
- 2019-2020 Google研究资助奖(Faculty Research Award)获奖出炉!185人上榜
- 存在多个不同注册中心的时候,如何平滑的统一注册中心?
- BERT Word Embeddings Tutorial
- ARM多寄存器加载/存储指令
- Jam's balance HDU - 5616 (01背包基础题)
- 【python】urllib和urllib3,requests 简要概括---笔记
- 你单身,其实是个科学问题……
- UnhookWindowsHookEx
- JavaFx 实现画图工具
- qt5中服务器文件传输,POST在Qt5中发送JSON文件的请求
- 实验十:图形用户界面设计
- WPF 之 鼠标双击事件
- php删除数组中相同的元素,只保留一个相同元素
- Linux终端登QQ,Linux下登录腾讯QQ的方法
- ActionForm详解
- 工业互联网体系架构、类型及应用
- 计算机病毒中的后门病毒,国家计算机病毒中心发现恶意后门程序新变种
- android 限制后台进程,Android O Preview 相关-后台执行限制
- C语言:变量存储类别
- [悦读] 让听得见炮声的人来决策——《赋能》读书笔记