R语言案例分析:多元数据的基本统计分析
R语言案例分析:多元数据的基本统计分析
来自《多元统计分析与R语言建模》 第四版
数据集下载
我们利用该数据集中的Case1来完成下面的R语言操作:
options(digits = 4) #输出结果位数
par(mar=c(4, 4, 2, 1) + 0.1, cex=0.8) # 图形修饰
case1 <- read.csv("clipboard", header=T, sep = "\t") #复制表中的数据,直接创建case1
head(case1)
地区 性别 教育程度 观点 年龄 月收入 月支出
1 A 女 中 不支持 55 2299 1423
2 A 女 低 不支持 39 3378 2022
3 A 女 中 支持 33 3460 1868
4 B 男 高 支持 41 4564 1918
5 B 女 高 不支持 55 3206 1906
6 A 女 中 不支持 48 4043 2233
summary(case1)
地区 性别 教育程度 观点 年龄 月收入 月支出
A:204 男:603 低:319 不支持:628 Min. : 6.0 Min. : 637 Min. : 797
B:401 女:597 高:303 支持 :568 1st Qu.:34.0 1st Qu.:2388 1st Qu.:1722
C:384 中:578 NA's : 4 Median :40.0 Median :2978 Median :1993
D:211 Mean :40.1 Mean :3006 Mean :1997
3rd Qu.:47.0 3rd Qu.:3624 3rd Qu.:2262
Max. :72.0 Max. :6239 Max. :3385
# 定性分析
attach(case1) #绑定数据
T1 <- table(地区)
T1
A B C D 204 401 384 211
barplot(T1) #绘制条形图
# 定量分析
f <- hist(月收入) #直方图
# 定性定量分析
boxplot(月收入~性别) #箱线图
t.test(月收入~性别) #t检验
Welch Two Sample t-test data: 月收入 by 性别 t = 0.51, df = 1200, p-value = 0.6 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -75.43 128.49 sample estimates: mean in group 男 mean in group 女 3019 2993
# 接受男女的月收入无显著差异的假设(p>0.5)
# 二维列联表分析
T2 <- table(性别, 观点)
T2
观点 性别 不支持 支持 男 319 282 女 309 286
barplot(T2, beside = TRUE) # 条形图
barplot(T2, beside = F) # 条形图
# beside=T表示绘制分组条形图,beside=F表示绘制堆叠条形图
# 多维列联表分析
T3 <- ftable(性别, 教育程度, 观点) # 创建一个紧凑的"平铺"式列联表
T3
观点 不支持 支持 性别 教育程度 男 低 81 88 高 78 66 中 160 128 女 低 82 68 高 86 72 中 141 146
barplot(T3, beside = TRUE, col = 3:4) #条形图
T4 <- ftable(教育程度, 性别, 观点)
T4
观点 不支持 支持 教育程度 性别 低 男 81 88 女 82 68 高 男 78 66 女 86 72 中 男 160 128 女 141 146
barplot(T4, beside = TRUE, col = 3:4) #条形图
detach(case1) #解除绑定
R语言案例分析:多元数据的基本统计分析相关推荐
- R语言案例分析:财政收入的多元相关与回归分析
R语言案例分析:财政收入的多元相关与回归分析 数据集下载 (mvcase3.xls)中的表Case3. y:财政收入 x1:国内生产总值 x2:能源消费总量 x3:从业人员总数 x4:全社会固 ...
- R语言生存分析数据分析可视化案例
目标 本文的目的是对如何在R中进行生存分析进行简短而全面的评估.关于该主题的文献很广泛,仅涉及有限数量的(常见)问题.最近我们被客户要求撰写关于生存分析的研究报告,包括一些图形和统计输出. 可用的R包 ...
- R语言淮河流域水库水质数据相关性分析、地理可视化、广义相加模型GAM调查报告...
采样地点:淮河流域一带,昭平台水库.白龟山水库.燕山水库.石漫滩水库.板桥水库.宿鸭湖水库.博山水库.南湾水库.石山口水库.五岳水库.泼河水库.鲶鱼山水库(点击文末"阅读原文"获取 ...
- R语言生存分析寿命表(life table)实战案例:比较两种药物治疗感染患者的生存时间
R语言生存分析寿命表(life table)实战案例:比较两种药物治疗感染患者的生存时间 目录
- R语言生存分析COX回归分析实战:以乳腺癌数据为例
R语言生存分析COX回归分析实战:以乳腺癌数据为例 目录
- 【视频】线性回归中的贝叶斯推断与R语言预测工人工资数据|数据分享
最近我们被客户要求撰写关于线性回归的研究报告,包括一些图形和统计输出. 在这个视频中,我们转向简单线性回归中的贝叶斯推断. 我们将使用一个参照先验分布,它提供了频率主义解决方案和贝叶斯答案之间的联系. ...
- R语言生存分析可视化分析
生存分析指的是一系列用来探究所感兴趣的事件的发生的时间的统计方法. 生存分析被用于各种领域,例如: 癌症研究为患者生存时间分析, "事件历史分析"的社会学 在工程的"故障 ...
- r语言和python的区别-Python和R语言之分析对比
在Python中调用R或在R中调用Python,为什么是"和"而不是"或"? 在互联网中,关于"R和Python"的文章,排名前十的搜索结果 ...
- r语言python对比_Python和R语言之分析对比
在Python中调用R或在R中调用Python,为什么是"和"而不是"或"? 在互联网中,关于"R和Python"的文章,排名前十的搜索结果 ...
最新文章
- FAILED BINDER TRANSACTION
- [MySQL优化案例]系列 -- 试用TCMalloc
- centos下git clone报401错误解决办法
- java大数据组件Zookeeper
- arraylist删除指定元素_揭开ArrayList的外衣看本质
- 合格前端系列第九弹-前端面试那些事
- c语言的基本数据类型和表达式,C语言–基本数据类型和表达式.ppt
- Hadoop2.2.0--Hadoop Federation、Automatic HA、Yarn完全分布式集群结构
- 哪些报表工具提供了移动端功能?
- [年度总结]我的ACM2013
- 计算机常用的启动方法有,加快电脑开机、运行的常用手段
- 新冠死亡率居高不下,为什么偏偏是意大利?
- 单模光纤与多模光纤的实际使用
- NVDIMM的应用场景
- 【WebAPI 验证】给 webapi加上token 验证(包括上传文件方法)
- 转: RGB565、RGB888互相转换原理和代码
- Android 10 添加 lunch
- selenium下Edge()配置错误问题
- 共阳数码管段码表_正点原子开拓者FPGA开发板资料连载第十一章 静态数码管显示实验...
- html span box shadow,box-shadow用法
热门文章
- Python序列 数据类型 创建方式 Tuple元组 Str字符串 List列表 dict字典 Set集合 range,zip,map,enumerate
- 计算机网络知识点总结——第三章数据链路层
- Java中beimage_GitHub - beconf/ImageBlurring: Android 中通过 Java 与 JNI 分别进行图片模糊;并且进行比较其运算速度。...
- 初步了解3dmax建模方式和多边形建模
- 开源搜索引擎排名第一,Elasticearch是如何做到的?
- Java必知必会的问题
- 招银网络科技杭州 java_招银网络科技_杭州Java后端_视频一、二面,HR面
- 第2关:Pandas创建透视表和交叉表
- emmc、Nand flash、Nor flash之间的区别
- [WDS]Disconnected!