参数检验和非参数检验(结合SPSS分析)
文章目录
- 假设检验
- 参数检验
- 平均值检验
- 单样本t检验
- 两独立样本t检验
- 配对样本t检验
- 非参数检验
- 卡方检验
- 单样本K-S检验
- 两独立样本的非参数检验
- 多个独立样本的非参数检验
- 两配对样本检验
- 多匹配样本的非参数检验
假设检验
概念:是一种根据样本数据来推断总体的分布或均值、方差等总体统计参数的方法。
根据样本来推断总体的原因:
总体数据不可能全部收集到。如:质量检测问题
收集到总体全部数据要耗费大量的人力和财力
假设检验包括:
参数检验
非参数检验
基本原理:利用小概率原理进行反证明。小概率事件在一次实验中不可能发生。
基本步骤:
根据检验的目标,对有待推断的总体参数或分布作一个零假设H0H_0H0
构造检验统计量,且该统计量服从某种已知分布.(卡方分布、t分布、F分布)
利用收集到的样本数据和基本假设计算检验统计量的值,并得到相应的相伴概率P值,即:检验统计量在某个特定的极端区域取值在H0H_0H0成立时的概率.
给定显著性水平,如果概率P值小于用户给定的显著性水平α\alphaα(一般取0.05或0.01),则拒绝零假设H0H_0H0而接受备择假设 。否则,不拒绝零假设H0H_0H0 (类似一种反证法)。显著性水平指的是零假设正确却被错误拒绝的概率,一般取0.01或0.05,即零假设正确且正确接受的概率为99%或95%
参数检验
参数检验方法
- 平均值检验
- 单样本t检验
- 两独立样本t检验
- 两配对样本t检验
平均值检验
计算一个或多个自变量类别中因变量的子组平均值与相关的单变量统计,也可以通过比较两个样本的均值来判断两个总体的均值是否相等。零假设:两个样本的均值,没有显著差异。
实例
问题:判断男女生数学成绩的均值是否具有显著差异
操作:
点击>分析>比较平均值>平均值
将性别拖到自变量列表,数学成绩拖到因变量列表。
点击选项按钮,勾选Anova表和eta、线性相关度检验
(如果自变量的个数少于3或者含有字符串,则无法进行线性相关度检验,因此此选项也可不必勾选)
分析结果:
从ANOVA表中可以看出,显著性为0.36,大于0.05,说明男生和女生之间的数学成绩均值没有显著差异。
从相关性测量表中看出Eta的平方为0.02
单样本t检验
H0H_0H0:u=u0u=u_0u=u0,总体均值与检验值之间不存在显著差异.
构造检验统计量.从样本均值的分布出发,即:~N(u0,σ2/n)N(u_0,\sigma^2/n)N(u0,σ2/n).于是:
总体方差未知时构造t统计量t=D‾S/nt=\frac{\overline D}{S/\sqrt{n}}t=S/nD
D=X−u0D=X- u_0D=X−u0
t统计量服从n-1个自由度的t分布
计算t统计量和对应的相伴概率P(绝对值大于等于α\alphaα的双侧概率)
结论:P≤αP\leq\alphaP≤α,则拒绝H0H_0H0,认为总体均值与检验值之间有显著差异.P>αP>\alphaP>α,不能拒绝H0H_0H0,认为总体均值与检验值之间没有显著差异
两独立样本t检验
含义: 在两个样本相互独立的前提下,检验两个样本的总体均值是否存在显著差异。零假设:两个样本数据的均值不存在显著差异。
例如:男生和女生的计算机平均成绩有显著差异吗?
要求:
两样本必须相互独立,即:抽取其中一批样本对抽取另一批样本没有任何影响.(如:北京周岁儿童与上海儿童的平均身高)
两总体服从正态分布
基本思路:
零假设H0:u1−u2=0H_0:u_1-u_2=0H0:u1−u2=0,两总体均值无显著差异。
构造检验统计量.从两样本均值差的分布出发,即:~N(u1−u2,σx1−x22).N(u_1-u_2,\sigma^2_{x_1-x_2} ).N(u1−u2,σx1−x22).于是两总体均方差未知时构造t统计量:
两总体均值差的抽样分布标准差:
- 方差相等:用合并方差
- 方差不等:
- 计算t统计量和对应的相伴概率P (绝对值大于等于该值的双侧概率)
利用方差齐性(Levene)F检验确定两总体方差是否齐性。给定零假设H0H_0H0:两总体方差无显著差异。
首先计算每个个案与所属组均值之差并取绝对值.然后对其进行单因素方差分析.
如果已假设方差齐性行 F检验的P≤αP\leq\alphaP≤α,则拒绝F检验的H0H_0H0,认为方差不齐性;其次看未假设方差齐性(Unequal)行的t检验概率.如果≤α\leq\alpha≤α,则拒绝t检验的H0H_0H0,认为两总体均值有显著差异;如果>α>\alpha>α,则不拒绝t检验的H0H_0H0
如果F检验的P>αP >\alphaP>α,则不能拒绝F检验的H0H_0H0,认为方差齐性;其次看已假设方差齐性(equal)行的t检验概率,t检验概率如果≤α\leq\alpha≤α,则拒绝t检验的H0H_0H0,认为两总体均值有显著差异;如果>α>\alpha>α,则不拒绝t检验的H0H_0H0
实例:
问题:判断男女生数学成绩是否具有显著差异
SPSS操作:
点击>分析>比较平均值>独立样本T检验
点击>定义组
分析结果:
在“列表方差相等性检验”框中,显著性为0.256,大于0.05,两组的总体方差齐性,则选择“已假设方差齐性”这一行的t检验结果。在“平均值相等性的t检验”中显著性(双尾)为0.346,大于0.05,说明两组数据的均值不存在显著差异。
配对样本t检验
含义: 根据配对样本对两总体均值是否有显著差异进行推断。零假设:两个配对样本数据的均值不存在显著差异。
例如: 某种减肥茶是否有效
要求:
两样本数据必须两两配对,即:样本个数相同,个案顺序相同.如:减肥茶的效果、不同广告形式对销售额的影响.(控制了个案自身的影响)
两总体服从正态分布
非参数检验
卡方检验
目的:通过样本数据的分布来检验总体分布与期望分布或某一理论是否一致,零假设是样本的总体与期望没有显著差异。
基本思想:如果从一个随机变量X中随机抽取若干个样本均值,当这些样本落在XXX的kkk个互不相关的子集中的观察频数服从一个多项分布,当k趋于无穷时,这个多项分布服从卡方分布。
卡方检验的零假设是:两个变量之间没有显著差异。若两种检验(皮尔逊卡方、似然比)的渐进显著性水平(双向)都小于0.05,则拒绝零假设,若两种检验的双向显著性水平都大于0.05,则不能拒绝零假设。
即:若卡方的渐进显著性小于0.05,表明变量之间有显著差异,若卡方的渐进显著性大于0.05,表明变量之间没有显著差异。
基本方法:
根据已知总体的构成比计算出样本中各类别的期望频数,计算实际观察频数与期望频数的差距,即:计算卡方值χ2=∑i=1k(观测频数−预测频数)2预测频数\chi^2=\sum_{i=1}^{k}\frac{(\text{观测频数}-\text{预测频数})^2}{\text{预测频数}}χ2=∑i=1k预测频数(观测频数−预测频数)2
卡方值越小,则实际频数和期望频数相差越小.如果P大于显著性水平α\alphaα,不能拒绝H0H_0H0,认为总体分布与已知分布无显著差异。
单样本K-S检验
**目的:**利用样本数据推断总体是否服从某个理论分布(正态分布、均匀分布、指数分布和泊松分布)。
例如:周岁儿童的身高是否服从正态分布
基本假设: H0H_0H0:总体分布与指定的理论分布无显著差异(总体服从指定的分布)
基本方法:
根据用户指定检验的总体分布,构造出一理论的频数分布,并计算相应的累计频率.
与样本在相同点的累计频率进行比较.如果相差较小,则认为样本所代表的总体符合指定的总体分布.
实例:
问题:判断班里语文成绩是否服从正态分布或泊松分布
SPSS操作:
点击>分析>非参数检验>旧对话框>1-样本K-S检验
勾选常规、泊松按钮
(如下图所示:常规是指正态分布,相等是指均匀分布)
分析结果:
正态分布检验统计量为0.051,渐进显著性为0.009,小于0.05,拒绝零假设,认为班上语文成绩不服从正态分布。
泊松分布检验统计量为0.038,渐进显著性为0.560,大于0.05,不能拒绝零假设,认为班上以为成绩服从泊松分布。
两独立样本的非参数检验
目的:由独立样本数据推断两总体的分布是否存在显著差异(或两样本是否来自同一总体)。
例如:两种不同生产工艺产品使用寿命分布的差异性
基本假设:H0H_0H0:两总体分布无显著差异(两样本来自同一总体)
基本方法:
- 曼-惠特尼U检验(Mann-Whitney U):平均秩检验
将两样本数据混合并按升序排序
求出其秩
对两样本的秩分别求平均
如果两样本的平均秩大致相同,则认为两总体分布无显著差异
- k-s检验(保证有较大的样本数)
将两样本混合并按升序排序
分别计算两个样本在相同点上的累计频数和累计频率
两个累计频率相减
如果差距较小,则认为两总体分布无显著差异
- 游程检验(Wald-Wolfowitz runs)
将两样本混合并按升序排序
计算分组标志序列的游程数
如果游程数较大,则说明是由于两类样本数据充分混合的结果,即:认为两总体分布无显著差异.
如果两样本中有相同的样本值,则会使游程数发生变化.系统会作出提示.
多个独立样本的非参数检验
目的:检验多个独立样本之间是否具有相同分布,零假设是多个独立样本来自的总体分布无显著差异
基本方法:
- Kruskal-Wallis H检验(推广的平均秩检验)
将多个样本数混合并按升序排序,求出其秩
对多个样本的秩分别求平均秩序
如果各样本的平均秩大致相等,渐进显著性大于0.05,则认为多个总体分布无显著差异
- 相同中位数检验(median)
判断多个总体是否是具有相同的中位数
将多个样本数混合并按升序排序
求出混合样本序列的中位数
如果各独立样本中大于此中位数的个案数和小于此中位数的个案数大致相同,渐进显著性大于0.05,则认为总体有相同的中位数。
- Jonckheere-Terpstra检验(适用于行和列皆有序的R*C列联表)
- 计算统计量的值J
- 跟读统计量J值得到p值
- 将p值与给定的显著性水平进行比较。若p值小于显著性水平,则拒绝零假设,接受备择假设。
两配对样本检验
基本方法:
- 变化显著性检验(McNemar)(要求数据只能是二分值)
将研究对象作为自身的对照者检验其“前后”的变化是否显著
- 例如:领导培训前后,群众对他们的评价
关心的是发生变化的两格中的频数变化.如果频数变化相当,则认为无显著变化.
- 正负符号检验(sign)
将样本2的各样本值减去样本1的各样本值.如果差值为正,则记为正号;如果差值为负,则记为负号
如果正号的个数与负号的个数相当,则认为无显著变化.否则,认为有显著变化
例如:采用新训练方法前后的最好成绩比较
3.符号平均秩检验(wilcoxon)
正负符号检验只考虑了两总体数据变化的性质,而没有注意其变化的程度.符号平均秩检验注意到了这点
将样本2的各样本值减去样本1的各样本值.如果差值为正,则记为正号;如果差值为负,则记为负号.
将差值按升序排序,并求其秩.分别计算正号秩和负号秩总和
如果正秩和负秩相当,认为正负变化程度相当,两总体无显著差异.
多匹配样本的非参数检验
基本方法
- 推广的平均秩检验(双向Friedman检验)
将每个个案的变量值数据按升序排序,并求其秩
求各样本的平均秩
如果平均秩相当,则认为各总体分布无显著差异
2.谐同系数检验(Kendall W检验)
谐同系数检验方法与推广的平均秩检验方法相同
主要用在分析评判者的评判标准是否一致和公平
通过谐同系数W进行判定.W表示了横向各样本数据之间相关的强弱程度,取值在0和1之间.越接近1,则表示相关性越强,即:评判者的评判标准一致
参考书目:
《SPSS22.0统计分析·从入门到精通》
参数检验和非参数检验(结合SPSS分析)相关推荐
- SPSS分析技术(导航页)
版本号:20171027 直接点击蓝色文章名称即可阅读! 持续更新,获取最新版本请前往[分析软件]-[SPSS]! 平台学习指南 1 如何通过"SPSS生活统计学"微信公众号学习数 ...
- 医学论文用SPSS分析数据如何选择方法,医学数据如何录入到SPSS分析统计软件!
听说很多小伙伴医学毕业论文卡在了数据分析上,听到SPSS分析就找不着北了,所以导致论文迟迟没有进展. 可医学论文需要数据来论证观点,每当此时,都会从各种途径寻找数据,如果实在找不到的话就会用一个问卷形 ...
- spss分析方法-生存分析(转载)
spss分析方法-生存分析(转载) 生存分析,是一种将生存时间和生存结果综合起来对数据进行分析的一种统计分析方法.主要用于对涉及一定时间发生和持续长度的时间数据的分析. 下面我们主要从下面四个方面来解 ...
- 如何用SPSS分析调节效应
如何用SPSS分析调节效应 用回归,回归也有两种方法来检验调节效应,看下面的两个方程,y是因变量,x是自变量,m是调节变量,mx是调节变量和自变量的交互项,系数是a b c c'.检验两个方程的R方该 ...
- SPSS分析:Bootstrap
SPSS分析:Bootstrap 一.原理: 非参数统计中一种重要的估计统计量方差进而进行区间估计的统计方法,也称为自助法.其核心思想和基本步骤如下: 1.采用重抽样技术从原始样本中抽取一定数量(自己 ...
- 运放电路分析_运放参数的详细解释和分析part4运放噪声
点击上方蓝字 获取更多电子硬件知识 本文主要分析一下运放电路的噪声组成以及计算时应该要注意的地方.另外给出了一些关于运放噪声的参考资料和计算工具.后台回复 下载|004 下载 运放噪声及其计算 运 ...
- SPSS分析技术:多元方差分析
SPSS分析技术:多元方差分析 下面要介绍多元方差分析的内容,多元方差分析是研究多个自变量与多个因变量相互关系的一种统计理论方法,又称多变量分析.多元方差分析实质上是单因变量方差分析(包括单因素和多因 ...
- 运放输入偏置电流方向_连载 | 运放参数的详细解释和分析part2如何测量输入偏置电流Ib和输入失调电流Ios...
点击上方蓝字 获取更多电子硬件知识 对第part1中的的概念作出声明:Ib-,Ib+为运放两输入端的偏置电流,也可以叫做偏置电流.而我们所说的运放输入偏置电流通常为两者的平均值,运放输入失调电流为 ...
- spss分析方法-对应分析(转载)
spss分析方法-对应分析(转载) 对应分析也称关联分析.R-Q型因子分析,通过分析由定性变量构成的交互汇总表来揭示变量间的联系.对应分析法是在R型和Q型因子分析的基础上发展起来的一种多元统计分析方法 ...
- 基于R语言、MaxEnt模型融合技术的物种分布模拟、参数优化方法、结果分析制图与论文写作
详情链接 :基于R语言.MaxEnt模型融合技术的物种分布模拟.参数优化方法.结果分析制图与论文写作 内容介绍: 第一章 .理论篇 以问题导入的方式,深入掌握原理基础 : 什么是MaxEnt模型? ...
最新文章
- KonaJDK 助力微服务国密算法使用特性一览
- 福利 | 给你个机会与俞士纶(Philip S. Yu)面对面交流 !(附俞教授论文合集资源)...
- 你也可以玩转Skype -- 基于Skype API开发外壳程序入门
- Linux 查看命令路径 以及相关信息
- 基于Nginx的https服务
- Java并发-ThreadLocal
- “直播带货”还能火多久?
- 方法~作用于对象~失败_消息三:ActiveMQ Topic 消息失败重发
- (50)流式布局—京东移动端首页制作案例
- string与stream互相转换
- pandas -读取文件时,加入列索引
- ASP.NET编程的十大技巧
- 20191127每日一句
- aiml java_AIML实现智能聊天机器人
- H3C交换机关闭STP生成树协议的方法
- 解析淘口令获取商品id,包含有效时间
- 用wvdial和ppp轻松上网
- 语法练习:left2
- ACM-NEFU新生训练2-排序和CMP
- 一、C语言的具体结构
热门文章
- Labwindows_cvi基于C语言程控矢量网络分析仪
- 怎么批量将多个 PDF 转换为 jpeg、png、bmp 图片
- 国外服务器有什么作用,网站放在国外服务器好吗?有什么优势?
- P2906 [USACO08OPEN]牛的街区Cow Neighborhoods
- android支持wifi11ad,不得不知道的WIFI标准:802.11ad、ah、af
- 数据库设计(一、二、三及BCNF范式)
- JavaSE基础——异常机制
- win7网络打印机重启后脱机的问题
- 继承QPushButton重写MouseEvent后按钮clicked信号不响应
- Android 设置屏幕亮度