第5章 Stata非参数检验
目录
5.1单样本正态分布检验
案例延伸
5.2两独立样本检验
5.3两相关样本检验
5.4多独立样本检验
5.5游程检验
案例延伸
一般情况下,参数检验方法假设统计总体的具体分布为已知,但是我们往往会遇到一些总体分布不能用有限个实参数来描述或者不考虑被研究的对象为何种分布,以及无法合理假设总体分布形式的情形,这时我们就需要放弃对总体分布参数的依赖,从而去寻求更多来自样本的信息,基于这种思路的统计检验方法被成为非参数检验。常用的非参数检验包括单样本正态分布检验,两独立样本检验,多独立样本检验,游程检验等。
5.1单样本正态分布检验
单样本正态分布检验本质上属于一种拟合优度检验,基本功能是通过检验样本特征来探索总体是否服从正态分布。Stata的单样本正态分布检验有很多种,常用的包括偏度-峰度检验、Wilks Shapiro两种。
数据(案例5.1)是山东财经大学某专业60名男生的百米速度。试用单样本正态分布检验方法研究其是否服从正态分布。
sktest speed #本命令的模式是对speed变量使用偏度-峰度检验方式进行单样本正态分布检验
swilk speed #本命令的含义是对speed变量使用Wilks-Shapiro检验方式进行单样本正态分布检验
通过观察分析,我们可以看到两种检验方法的检验结果是一致的。一共有60各有效样本参与了假设检验,P值远小于0.05,所以拒绝了原假设,也就是说这个变量不服从正态分布。
案例延伸
只针对speed大于15的进行检验
swilk speed if speed>15
5.2两独立样本检验
基本功能是可以判断两个独立样本是否来自相同分布的总体。这种检验过程是通过分析两个独立样本的拘束、中位数、离散趋势、偏度等描述性统计变量之间的差异来实现的。
数据(案例5.2)给出了广东省东北部和西北部主要年份的年降雨量。试用两独立样本检验方法判断两个地区的年降雨量是否存在显著差异。
ranksum sum ,by(group)
通过观察分析我们可以看出24个有效样本参与了假设检验,Prob > |Z|=0.3556,远大于0.05,所以需要接受原假设,也就是说,两个地区的年降雨量存在显著差异。
5.3两相关样本检验
基本功能时可以判断两个相关的样本是否来自相同分布的总体。
数据(案例5.3)是为分析一种新药的效果,特地选取了52名病人进行实验,数据给出了用药前后的血红蛋白数量。试用两相关样本检验方法判断该药是否能引起患者体内血红蛋白数量的显著变化。
signtest qian=hou
检验结果包括符号检验、单侧检验、双侧检验三部分,符号检验(sign test)的原理是通过用配对的两组数据做差,原假设是两组数据不存在显著差别,所里两组数据做差的结果应该是正数、负数大体相当。在本例中期望值是有26个正数和26个负数,然而师级的观察值却是38个证书,所以两组数据存在明显差异。也就是说该药引起了患者体内的显著变化。单侧检验和双侧检验的结果解读在前面章节多有涉及,这里不再赘述。
5.4多独立样本检验
用于判断多个独立的样本是否来自相同分布的总体。
数据(案例5.4)是某公司招聘的一批员工毕业于4所不同的高校,并且来源于4所不同高校的员工构成了4个独立样本。待到实习期结束后,高管对这些新员工进行考察打分。试用多独立样本检验方法分析毕业于不同高校的员工在工作上的表现是否有显著的差异。
kwallis goal,by(school)
从上图我们可以看到有4组,每组15个,共60个有效样本参与了假设检验,P值远小于0.05,所以需要拒绝假设,也就是说毕业于不同高校的员工在工作上的表现有显著差异。
5.5游程检验
基本功能是:可以判断样本序列是否为随机序列。这种检验过程是通过分析游程的总个数来实现的。
数据(案例5.5)给出了某纺织厂连续15田通过实验得出的28号梳棉棉条的棉结杂志粒数的数据。试用游程检验方法研究该纺织厂的生产情况是否正常。
runtest number
我们可以看出P值=0.84远大于0.05,所以接受原假设,数据的生产是随机的,不存在自相关现象,该纺织厂的生产情况正常。
案例延伸
上述游程检验默认采用中位数作为参考值,如果设定均值作为参考值呢?
runtest number,mean
结果不再过多赘述。
第5章 Stata非参数检验相关推荐
- 计量经济学及Stata应用 第二章 Stata入门
第二章 Stata入门 2.3 Stata操作实例 打开数据文件 use file_path,clear (clear用于清空内存中的数据) 审视数据 观看数据集中的变量名.标签等 describe ...
- stata:stata软件教程(人大十八讲)(1) 第一章 stata入门
第一章 stata入门 1.1 安装 1.2 启用和退出 1.3 打开和查看数据 1.4 寻求帮助与网络资源 1.4.1 获取帮助的命令 1.4.2 几个主要网站 1.5 命令示例 1.5.1 进行四 ...
- 第12章 Stata非线性回归分析
目录 12.1非参数回归分析 案例延伸 延伸1:设定散点图被分成垂直等宽波段的数量 延伸2:设定修匀的波段宽度 12.2转换变量回归分析 12.3非线性回归 案例延伸 延伸1:设定非线性回归模型中被估 ...
- 第15章Stata时间序列分析
目录 15.1时间序列的基本操作 案例延伸 延伸1:清除数据的时间序列格式 延伸2:关于数据处理的一般说明 延伸3:关于时间序列运算的有关说明 15.2单位根检验 1.ADF检验 2.PP检验 案例延 ...
- 第1章 Stata管理变量与数据
1.1创建和替代变量 数据(案例1.2) 例1.2是我国2009年各地区的就业人口以及工资总额数据.请使用Stata命令进行操作:(1)试着生成新的变量来描述各地区的平均工资情况:(2)试着生成平均工 ...
- 第7章 Stata相关性分析
目录 7.1简单相关分析 7.2偏相关分析 在得到相关数据资料后,我们要对这些数据进行分析,研究各个变量之间的关系.相关分析是应用非常广泛的一种方法.它是不考虑变量之间的因果关系而只研究分析变量之间的 ...
- 第4章 Stata参数检验
目录 4.1单一样本T检验 案例延伸 4.2独立样本T检验 案例延伸 1.改变置信水平 2.在异方差假定条件下进行假设检验 4.3配对样本T检验 案例延伸 1.改变置信水平 4.4单一样本方差的假设检 ...
- 计算机软件及应用stata,蒙特卡洛模拟及其Stata应用实现
蒙特卡洛模拟及其Stata应用实现 出版时间:2015年版 丛编项:海南大学经济管理系列丛书 内容简介 <蒙特卡洛模拟及其Stata应用实现>的第1章是Stata软件基础,主要介绍了Sta ...
- stata怎么画分类图_stata如何画分布图
Stata中的图形制作(绝对自己总结)_数学_自然科学_专业资料.. 第三章 Stata 中的图形制作 1.菜单操作 Plots 选择横.纵坐标所代表的变量 Titles 标题 Title( )... ...
- 计量经济学 (2 第2章)
第 2 章 Stata 2.1 为什么使用Stata 1.操作简单且功能强大: 2.留有"用户接口",允许用户自己编写命令与函数, 并上传到网上实现共享--"非官方命令 ...
最新文章
- 基于SSM实现校友录管理平台
- 重温一遍数据结构之单链表(golang版)
- OpenCASCADE:使用扩展数据交换 XDE之读写 STEP 或 IGES
- 宏FUSION_MAKE用法的测试程序
- 深度学习数学相关知识
- Android启动(Booting)
- linux安装python库报错pywin32_完美解决pyinstaller打包报错找不到依赖pypiwin32或pywin32-ctypes的错误...
- Java后台与VUE跨域交接
- 打印1-400以内 能同时被5和9 整数的数将这些数放入一个列表中,再输出这个列表
- PSPNet网络要点
- RocketMQ源码解析-Consumer启动(2)
- jquery 文件上传 触发两次_点击三次input按钮,前两次不选择任何文件,第三次选择一个文件,结果上传了3个文件,即发生了三次请求...
- Java 基础系列之volatile变量(一)
- 重新编译hadoop-2.7.2-src的native以支持Snappy解压压缩库
- c语言求ab的最大公约数,C语言中如何调用函数求最大公约数和最小公倍数
- CCF CSP 中国计算机学会-CCF计算机软件能力认证(计算机水平测试)-简介-详情
- String Shifting(今日头条2017秋招真题)
- SkinSharp(Skin#)软件换肤库!
- NEERC 2014 D题 Damage Assessment
- “啪”一炮就通!管道疏通神器终于诞生,马桶、下水道再也不怕堵!