实验八—基本统计分析(一)
实验8 基本统计分析(一)
1.基础性实验
R自带的数据集Titanic记录了泰坦尼克号上乘客的生存和死亡信息,该数据集包含船舱等级(class)、性别 (sex)、年龄(age)、生存状态(survived)四个类别变量。根据该数据集,生成以下频数分布表。
a) 生成sex和survived两个变量的二维列联表,并为列联表添加边际和
b) 生成class, sex, age和 survived四个变量的多维列联表
c) 将问题b)生成的列联表转化为带有类别频数的数据框
> data<-data.frame(Titanic)
> xtabs(Freq~Sex+Survived,data = data)
> addmargins(xtabs(Freq~Sex+Survived,data = data))
> tab<-xtabs(Freq~Class+Sex+Age+Survived,data = data)
> tab
> as.data.frame.array(tab)
2.验证性实验
代码清单7-3
library(Hmisc)
myvars <- c("mpg", "hp", "wt")
describe(mtcars[myvars])
代码清单7-4
library(pastecs)
myvars <- c("mpg", "hp", "wt")
stat.desc(mtcars[myvars])
代码清单7-11
library(grid)
library(vcd)
mytable <- xtabs(~ Treatment+Sex+Improved, data=Arthritis)
mytable
ftable(mytable)
margin.table(mytable, 1)
margin.table(mytable, 2)
margin.table(mytable, 3)
margin.table(mytable, c(1,3))
ftable(prop.table(mytable, c(1,2)))
ftable(addmargins(prop.table(mytable, c(1, 2)), 3))
3.设计性实验
生成如下数据框df,数据的范围[1,20],并设定y2的第3个和第8个值为缺失值。调用Hmisc包中的describe()对数据框生成描述性统计量,观察实验结果。
> y1<-round(runif(10,1,20))
> y2<-round(runif(10,1,20))
> y2[c(3,8)]<-NA
> y3<-round(runif(10,1,20))
> df<-data.frame(y1,y2,y3)
> library(Hmisc)
> describe(df)
df 3 Variables 10 Observations
-----------------------------------------------------------------------------------------------------------------------------
y1 n missing distinct Info Mean Gmd 10 0 6 0.964 9.3 4.867 lowest : 2 5 7 8 11, highest: 5 7 8 11 15Value 2 5 7 8 11 15
Frequency 1 1 1 2 3 2
Proportion 0.1 0.1 0.1 0.2 0.3 0.2
-----------------------------------------------------------------------------------------------------------------------------
y2 n missing distinct Info Mean Gmd 8 2 6 0.952 10.12 6.607 lowest : 4 5 7 16 17, highest: 5 7 16 17 18Value 4 5 7 16 17 18
Frequency 1 1 3 1 1 1
Proportion 0.125 0.125 0.375 0.125 0.125 0.125
-------------------------------------------------------------------------------------------
y3 n missing distinct Info Mean Gmd 10 0 8 0.988 13.4 7.511 lowest : 2 6 7 11 14, highest: 11 14 18 19 20Value 2 6 7 11 14 18 19 20
Frequency 1 1 1 1 1 2 2 1
Proportion 0.1 0.1 0.1 0.1 0.1 0.2 0.2 0.1
-------------------------------------------------------------------------------------------
4.设计性实验
今测得10名非铅作业工人和7名铅作业工人的血铅值,如下表所示。试用Wilcoxon秩和检验分析两组工人血铅值有无差异。
> x<-c(24,26,29,34,43,58,63)
> y<-c(82,87,97,121,164,208,213)
> wilcox.test(x,y,alternative = "less",exact = FALSE,correct = FALSE)
H0:两组工人血铅值没有差异
H1:两组工人血铅值有差异
p=0.0008726<0.05,原假设不成立,备择假设成立,即两组工人血铅值有差异
5.将下表生成雷达图,雷达图形式不限。
数据集表示的含义为:7种比较算法的三种评价指标(AE of Best, AE of Mean, AE of worst)
a<-c(0.106,0.16,0.135)
b<-c(0.065,0.177,0.103)
c<-c(0.076,0.11,0.096)
d<-c(0.235,0.293,0.271)
e<-c(0.187,0.248,0.222)
f<-c(0.119,0.169,0.134)
g<-c(0.091,0.129,0.108)
df<-data.frame(a,b,c,d,e,f,g)
rownames(df)<-c("AE of Best","AE of Mean","AE of Worst")
colnames(df)<-c("MS","HLMS","BIWOA","BMMVO","BSCA","BHHA","BSSA")
library(fmsb)
max<-c(0.3)
min<-c(0.05)
df<-data.frame(rbind(max,min,df))
radarchart(df=df,seg = 7,axistype = 1,pcol = c("#00AFBB", "#E7B800","#3401c9"),cglcol = "grey",plty = 1,plwd = 2,pty = c(16,18),cglty = 1,cglwd = 0.8,axislabcol = "grey",vlcex = 0.7,caxislabels = c(0,0.05,0.1,0.15,0.2,0.25,0.3))
legend(x = "bottomleft",legend =rownames(df)[3:5] , horiz = TRUE,bty = "n", pch = 20 , col = c("#00AFBB", "#E7B800","#3401c9"),text.col = "black", cex = 1, pt.cex = 1.5
)
输出结果为:
实验八—基本统计分析(一)相关推荐
- python上机实验报告读取文件_Python程序设计实验报告:实验八 文件
安徽工程大学 Python程序设计 实验报告 班级 物流192姓名陶俊 学号3190505235 成绩 日期 2020.6.3 指导老师修宇 实验八 文件 [实验目的] 掌握读写文本文件或 CSV 文 ...
- 实验八 接口与实现接口的类
实验八 接口与实现接口的类 一.程序代码 public class yuanzhui extends Rectangle implements Area,Volume { private double ...
- 实验八 《Coderxiaoban团队》团队作业4:基于原型的团队项目需求调研与分析
实验八 <Coderxiaoban团队>团队作业4:基于原型的团队项目需求调研与分析 项目 内容 这个作业属于哪个课程 任课教师博客主页链接 这个作业的要求在哪里 实验八 团队作业4:基于 ...
- 20155235 《网络攻防》 实验八 Web基础
20155235 <网络攻防> 实验八 Web基础 实验内容 Web前端HTML(0.5分) 能正常安装.启停Apache.理解HTML,理解表单,理解GET与POST方法,编写一个含有表 ...
- matlab实验8数据分析与多项式计算,hashidamatlab实验八数据处理与多项式计算.doc
实验八电子二班张秀云 一.实验目的 [据处理与多项式计算 1.掌握数据统计和分析的方法 2.掌握数值插值与曲线拟合的方法及其应用 3.掌握多项式的常用运算 二.实验内容 1.利用MATLAB提供的ra ...
- 山东大学 2020级数据库系统 实验八、九
What's more 山东大学 2020级数据库系统 实验一 山东大学 2020级数据库系统 实验二 山东大学 2020级数据库系统 实验三 山东大学 2020级数据库系统 实验四 山东大学 202 ...
- 实验八 java多线程操作_20182310实验八实验报告
20182310 2019-2020 <数据结构与面向对象程序设计>实验八 树报告 课程:<程序设计与数据结构> 班级: 1823 姓名: 周烔 学号:20182310 实验教 ...
- c语言程序设计实验8,C语言程序设计实验八结构体.doc
C语言程序设计实验八结构体 C语言程序设计实验八:结构体 请求用户输入若干个学生的基本情况,其中包括每位学生的学号.姓名和两门课(C语言.数学)的成绩.然后用下面的格式输出学生的成绩列表. 格式描述如 ...
- python上机实验报告读取文件_Python程序设计实验八:文件
安徽工程大学 Python程序设计实验报告 班级:物流192 姓名:李心悦 学号:3190505218成绩: 日期:2020.6.3 指导教师:修宇 [实验名称]实验八 文件 [实验目的] 掌握读写文 ...
最新文章
- Spring Hello World
- python相对路径找不到文件_Python相对路径从子文件夹导入
- 解决pl/sql devloper 中数据库操作语句中文乱码的问题
- appweb ejs_EJS部分
- android layout引入活动,Android 开发入门-活动的基本用法
- 5G 来了,需要更换 SIM 卡吗?
- SpringBoot之RabbitMQ的使用
- Java中的锁 | JDK6 关于锁的优化
- 陕西省计算机中考模拟试题软件,中学信息技术考试练习系统——陕西省版
- 玻尔原子模型中各轨道半径、轨道能量公式推导
- 期权定价公式的推导(欧式)
- 对接支付宝、微信、第三方支付,超详细讲解+demo演示
- 如何用python处理文件(图文详解)
- 医用红外线灯的全球与中国市场2022-2028年:技术、参与者、趋势、市场规模及占有率研究报告
- 乐视max2卡刷安卓9.0流畅运行
- 计算机在职研是不是双证,计算机双证在职研究生好考吗?
- linux avi 转mp4,怎么把视频avi格式怎么转换成mp4格式
- 卡耐基人性的弱点目录
- linux下c/c++读取txt文件,多行文件,且每行都用逗号隔开
- mysql slap_mysqlslap压力测试介绍
热门文章
- Markdown转Html应用与实践
- PPT、Word、Excel模板免费下载
- 恢复系统设置或计算机无法点击进入,怎么恢复系统,电脑蓝屏了怎么一键还原...
- aac转化为mp3,详细转换步骤
- inteli211网卡linux驱动,Intel i211网卡在server2016中无驱动的解决方案
- 【深度学习】目标检测的性能评价指标,mAP_0.5,mAP_0.5,0.95,0.05
- 《仙剑7》发售在即、《古剑4》立项,可国产Unity还要多久?
- 【附源码】计算机毕业设计SSM面向智慧城市的智慧农业管理系统
- 模块化 — 高效重构
- qrcode生成二维码微信长按无法识别问题