实验十—基本统计分析(三)
实验10 基本统计分析(三)
1.调查某大学学生每周学习时间与得分的平均等级之间的关系,现抽查10个学生的资料如student.data文件所示。其中等级10表示最好,1表示最差,试用秩相关检验(Spearman检验和Kendall检验)分析学习时间和学习等级有无关系。(相关性检验)
提出假设:
H0:学习时间和学习等级无关系
H1:学习时间和学习等级有关系
得出结论:
使用 spearman 方法,p=0.09279>0.05,接收原假设,学习时间和学习等级无关系。
使用 kendall 方法,p=0.03114<0.05,拒绝原假设,学习时间和学习等级有关系。
2.文件score.data中的数据列出某高中18名学生某门课程的高考成绩和模拟考试成绩,这组数据能否说明高考成绩与模拟考试成绩是相关的?(相关性检验)
提出假设:
H0:不能说明高考成绩与模拟考试成绩是相关的
H1:能说明高考成绩与模拟考试成绩是相关的
P= 0.02817<0.05 ,拒绝原假设,即高考成绩与模拟考试成绩是相关的。
3.为比较两种工艺对产品的质量是否有影响,对其产品进行抽样检查,其结果如表所示,试分析两种工艺对产品质量是否有显著差异?
合格 | 不合格 | 合计 | |
---|---|---|---|
工艺1 | 3 | 4 | 7 |
工艺2 | 6 | 4 | 10 |
合计 | 9 | 8 | 17 |
提出假设:
H0:两种工艺对产品的质量没有显著性差异
H1:两种工艺对产品的质量有显著性差异
P=0.6372>0.05,接收原假设,即两种工艺对产品的质量没有显著性差异。
4.为研究分娩过程中使用胎儿电子检测仪对剖妇产率有无影响,对5824例分娩的产妇进行回顾性调查,结果如表所示,试分析。
H0:分娩过程中使用胎儿电子监测仪对剖腹产率无影响
H1:分娩过程中使用胎儿电子监测仪对剖腹产率有影响
p=9.552e-10<0.05,拒绝原假设,所以分娩过程中使用胎儿电子监测仪对剖腹产率有影响
5.Mendel用豌豆的两对相对性状进行杂交实验,黄色圆滑种子与绿色皱缩种子的豌豆杂交后,第二代根据自由组合规律,理论分离比为:
黄圆:黄皱:绿圆:绿皱=9/16:3/16:3/16:1/16
实际实验值为:黄圆315 黄皱 101 绿圆 108 绿皱 32 ,共556粒。问此结果是否符合自由组合规律?
进行假设:
H0: 黄圆:黄皱:绿圆:绿皱=9/16:3/16:3/16:1/16
H1: 黄圆:黄皱:绿圆:绿皱≠9/16:3/16:3/16:1/16
p=0.9254>0.05,接收原假设,即结果符合自由组合定律。
6.在某养鱼塘中,根据过去经验,鱼的长度的中位数为14.6cm,现对鱼塘中鱼的长度进行一次估测,随机地从鱼塘中取出10条鱼,长度数据保存在fish.data中,用Wilcoxon符号秩检验,试分析该鱼塘中鱼的长度是在中位数之上,还是在中位数之下?
提出假设:
H0:中位数大于或者等于14.6
H1:中位数小于14.6
p=0.01087<0.05,拒绝原假设,即该鱼塘中鱼的长度在中位数之下。
7.请撰写报告,阐述统计学三大相关性系数(pearson、spearman、kendall)的区别
总的来讲,三个相关性系数(pearson, spearman, kendall)反应的都是两个变量之间变化趋势的方向以及程度,其值范围为-1到+1,0表示两个变量不相关,正值表示正相关,负值表示负相关,值越大表示相关性越强
person correlation coefficient(皮尔森相关性系数-r)
方差是表示一个变量的波动情况,方差越小表示数据越集中,越大表示数据越离散;
标准差:等于(或近似等于)方差的开根号;
协方差:可以理解成两个变量之间的方差,其取值可以是负无穷到正无穷,它可以表示两个变量之间的变化趋势,但是不能表示它们之间的程度
局限性:
- ==实验数据通常假设是成对的来自于正态分布的总体。==为啥通常会假设为正态分布呢?因为我们在求皮尔森相关性系数以后,通常还会用t检验之类的方法来进行皮尔森相关性系数检验。
- 实验数据之间的差距不能太大,或者说皮尔森相关性系数受异常值的影响比较大。因为根据公式可以看到是直接是用x,y的值进行计算。相对应的spearman correlation对异常值不敏感,因为它是属于rank test,具体见下面介绍。
spearman correlation coefficient(斯皮尔曼相关性系数-p)
- 获得秩次:记下原始X Y值得排序位置(X’, Y’),(X’, Y’)的值就称为秩次
- 对两个变量(X, Y)的数据进行排序
- 计算两个变量秩次的差值,也就是上面公式中的di,n就是变量中数据的个数
- 最后带入公式就可求解结果。
举个例子吧,假设我们实验的数据如下:
- 即便在变量值没有变化的情况下,也不会出现像皮尔森系数那样分母为0而无法计算的情况。
- 即使出现异常值,由于异常值的秩次通常不会有明显的变化(比如过大或者过小,那要么排第一,要么排最后),所以对斯皮尔曼相关性系数的影响也非常小
- 斯皮尔曼相关性系数没有那些数据条件要求,适用的范围广
pearson和spearman都是衡量连续型变量间的相关性,那么如果是分类变量呢?
kendall correlation coefficient(肯德尔相关性系数-k)
例子:比如评委对选手的评分(优、中、差等),我们想看两个(或者多个)评委对几位选手的评价标准是否一致;或者医院的尿糖化验报告,想检验各个医院对尿糖的化验结果是否一致,这时候就可以使用肯德尔相关性系数进行衡量。
实验十—基本统计分析(三)相关推荐
- 汇编语言(第三版)王爽著(实验十)编写子程序
实验内容.程序清单及运行结果 显示字符串: 问题: 显示字符串是现实工作中经常要用到的功能,应该编写一个通用的子程序来实现这个功能.我们应该提供灵活的调用接口,使调用者可以决定显示的位置(行.列).内 ...
- 实验十四 团队项目评审课程学习总结
项目 内容 这个作业属于哪个课程? 2016级计算机科学与工程学院软件工程(西北师范大学) 这个作业的要求在哪里? 实验四 软件工程结对项目 作业学习目标是? (1)掌握软件项目评审会流程:(2)反思 ...
- pyqt tcp通信_实验十 基于PyQt界面的TCP通信程序(一).doc_学小易找答案
[简答题]请同学们找一个目前已学的知识点,出一个题目上传,不能是上课讲的程序和上机的题目 [简答题]请拍照模块五完成情况 [简答题]请拍照模块六完成情况 [计算题]书本80页,3-7;3-8;3-9; ...
- 实验十四 课程学习总结
一.结合本学期课程学习内容,对比<实验一 软件工程准备>的任务5你所提的问题(给出提问博客链接),尝试对提出问题进行解答,并阐明是如何通过学习/实践/讨论弄清楚的:学习中是否产生了新的问题 ...
- 虚拟机dhcp服务器怎么检验,实验十二虚拟机上DHCP服务器的配置和验证.doc
实验十二 虚拟机上DHCP服务器的配置与验证 一.实验目的 了解DHCP的基本概念和服务器的新特性 掌握DHCP服务器的安装与配置 掌握DHCP的运行方式 掌握DHCP客户机的设置 掌握ipconfi ...
- 201671010456-张琼 实验十四 团队项目评审课程学习总结
博文简要信息表 项目 内容 这个作业属于哪个课程 http://www.cnblogs.com/nwnu-daizh/ 这个作业的要求在哪里 https://www.cnblogs.com/nwnu- ...
- 【黑金原创教程】【FPGA那些事儿-驱动篇I 】实验十八:SDRAM模块① — 单字读写...
实验十八:SDRAM模块① - 单字读写 笔者与SDRAM有段不短的孽缘,它作为冤魂日夜不断纠缠笔者.笔者尝试过许多方法将其退散,不过屡试屡败的笔者,最终心情像橘子一样橙.<整合篇>之际, ...
- 201671030111 李蓉 实验十四 团队项目评审课程学习总结
项目 内容 这个作业属于哪个课程 软件工程 这个作业的要求在哪里 实验十四 团队项目评审&课程学习总结 作业学习目标 掌握软件项目评审会流程,反思总结课程学习内容. 任务一:结合本学期课程学习 ...
- 201671010417 金振兴 实验十四 团队项目评审课程学习总结
项目 内容 软件工程 https://www.cnblogs.com/nwnu-daizh/ 作业要求 https://www.cnblogs.com/sunmiaokun/p/11095027.ht ...
最新文章
- spring上下文是什么意思_Java程序员只会CRUD连Spring事务传播机制都不懂?
- JetBrains打造的开发神器,一套代码适应多端!
- 百度云Java三面,面试题及答案!
- 机器学习Sklearn实战——梯度提升树二分类原理
- php内核函数手册,深入理解PHP内核(五)函数的内部结构,深入理解内部结构
- Visual Studio 2005中C++的变化
- 用C语言写PHP扩展 linux
- qprocess 最小化启动外部程序_安川机器人预约启动功能
- sql server版本 性能_迁移到高版本 SQL 数据库后,性能变差了
- 建立一个Shape类,有Circle(圆形)和Rect(矩形)子类
- JAVA GUI界面组件学习
- java.lang.UnsatisfiedLinkError: Library not loaded: @rpath/libo.dylib Reason: image not found
- 金庸笔下人物名字的来历和意义
- grubbs准则 matlab_MATLAB-格拉布斯准则(MATLAB-Grubbs-criterion)-M
- 知识图谱构建流程详解
- 如何彻底卸载3dmax2020_3DMax如何才能彻底卸载干净啊?
- 程序员记录之人性弱点
- 苹果电脑上不错的五款视频调色应用
- 【JZOJ4178】【NOI2015模拟YDC】游戏(阶梯nim游戏)
- webpack、sass-loader、npm audit fix、npm audit fix --force兼容性问题