R语言实现描述性统计
# 01分布
a<- runif(20)
a
- 0.0534173720516264
- 0.0381318787112832
- 0.253885793266818
- 0.851638266118243
- 0.356620342005044
- 0.175922254333273
- 0.270358079113066
- 0.421792675741017
- 0.675487545551732
- 0.139561568852514
- 0.649348761420697
- 0.0383495420683175
- 0.673801982775331
- 0.131142142694443
- 0.241756724659353
- 0.205821343231946
- 0.826634412631392
- 0.827650502324104
- 0.48426380334422
- 0.385196640854701
# 算术平均数
mean(a)
0.385039081587456
# 几何平均数
exp(mean(log(a)))
0.269715541826603
# 中位数
median(a)
0.313489210559055
b <- sort(a)
(b[10]+b[11])/2
0.313489210559055
# 产生0到10的20个数round取整
c <- round(runif(20,0,10))
c
- 6
- 1
- 10
- 9
- 6
- 9
- 3
- 10
- 6
- 3
- 4
- 4
- 7
- 2
- 3
- 3
- 5
- 9
- 2
- 0
# 众数 table 统计出现的次数
x <- table(c)
x
c0 1 2 3 4 5 6 7 9 10 1 1 2 4 2 1 3 1 3 2
# 取出次数最多的
names(x)[x==max(x)]
‘3’
a <- round(runif(100,1,10))
table(a)
a1 2 3 4 5 6 7 8 9 10 4 8 11 7 16 10 11 8 14 11
stem(a)
The decimal point is at the |1 | 00002 | 000000003 | 000000000004 | 00000005 | 00000000000000006 | 00000000007 | 000000000008 | 000000009 | 0000000000000010 | 00000000000
hist(a)
hist(a,breaks=50)
a<- rnorm(100,0,1)
hist(a)
# 协方差与相关系数
x<-runif(20)
y<-runif(20)
cov(x,y)
0.00322176575114672
e<- runif(20,0,0.1)
z<- x*3+e
cov(x,z)
0.191163714793349
#与相关系数
cor(x,z)
0.999193595914862
# 一元线性回归|
x<- runif(10)
y<- 3*x +5+ runif(10,0,0.5)
plot(x,y)
# 线性模型
lm(y~x)
Call:
lm(formula = y ~ x)Coefficients:
(Intercept) x 5.349 2.780
plot(x,y)
abline(lm(y~x),col="red")
# 多元回归
x1<- runif(10)
x2 <- runif(10)
y <- 3*x1+5*x2+2+runif(10,0,0.1)
lc<- lm(y~x1+x2)
summary(lc)
Call:
lm(formula = y ~ x1 + x2)Residuals:Min 1Q Median 3Q Max
-0.04436 -0.02495 0.00357 0.02298 0.04432 Coefficients:Estimate Std. Error t value Pr(>|t|)
(Intercept) 2.08064 0.03958 52.56 2.36e-10 ***
x1 2.97190 0.03884 76.51 1.71e-11 ***
x2 4.97719 0.04625 107.61 1.58e-12 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1Residual standard error: 0.03303 on 7 degrees of freedom
Multiple R-squared: 0.9995, Adjusted R-squared: 0.9993
F-statistic: 6916 on 2 and 7 DF, p-value: 2.91e-12
R语言实现描述性统计相关推荐
- R语言数据描述性统计(Descriptive statistics)实战:数据全局描述信息、数值数据的描述性统计(Numerical data)、离散型数据的描述性统计(Categorical)
R语言数据描述性统计(Descriptive statistics)实战:数据全局描述信息.数值数据的描述性统计(Numerical data).离散型数据的描述性统计(Categorical) 目录
- R语言入门—描述性统计(一)
1.数据下载 国家统计局,注册账号,下载自己感兴趣的数据(csv格式).本文下载5种甲乙类传染病的发病人数及死亡人数,网址:国家数据 国家数据 2.练习任务及目的 使用R语言进行数据描述性统计(平均数 ...
- R语言Wilcoxon Signed-rank统计分布函数(dsignrank, psignrank, qsignrank rsignrank )实战
R语言Wilcoxon Signed-rank统计分布函数(dsignrank, psignrank, qsignrank & rsignrank )实战 目录 R语言Wilcoxon Sig ...
- R语言nchar函数统计字符串中字符个数实战
R语言nchar函数统计字符串中字符个数实战 目录 R语言nchar函数统计字符串中字符个数实战 #基础语法
- R语言的各种统计分布函数
转载自品略图书馆 http://www.pinlue.com/article/2018/09/1613/487222559948.html R语言的各种统计分布函数 1.二项分布Binomial di ...
- 用R语言做词频统计_R语言 | 词频统计
Python网络爬虫与文本数据分析 本章内容 导入停用词 读数据,分词 剔除停用词 导入停用词表 library(dplyr) ## [1] "?" "." & ...
- 二元置信椭圆r语言_医学统计与R语言:圆形树状图(circular dendrogram)
微信公众号:医学统计与R语言如果你觉得对你有帮助,欢迎转发 输入1: "ggraph") 结果1: name 输入2: <- graph_from_data_frame(my ...
- 二元置信椭圆r语言_医学统计与R语言:多分类logistic回归HosmerLemeshow拟合优度检验...
微信公众号:医学统计与R语言如果你觉得对你有帮助,欢迎转发 输入1:multinominal logistic regression "nnet") 结果1: test (mult ...
- R语言 导入其他统计软件文件
使用R中的foreign包可以较方便地读取其他统计软件的数据文件,比如SPSS.SAS等数据文件等 函数 描述 read.arff 从ARFF文件中读取文件,著名的数据挖掘开源软件weka的数据就是这 ...
最新文章
- 【译】Construction of a Plasma Chain 0x1
- bzoj2161 布娃娃
- Robberies HDU - 2955
- 如何在Java中同步ArrayList?
- mysql 索引 测试_mysql的索引测试
- linux ns机制,Linux内核API ns_to_timespec
- Java servlet ajax
- XNA 如何使用字体绘制文字,Windows Phone 游戏开发
- 海康威视视频监控客户端开发实践
- Linux安装Zabbix
- 回文数字 观察数字:12321,123321都有一个共同的特征,无论从左到右读还是从右向左读;都是相同的。这样的数字叫做: 回文数字。 本题要求你找到一些5位或6位的十进制数字。满足要求: 该数字
- 软通动力华为外包_软通动力外包到百度?
- 为什么《百家讲坛》上的中学教师收视率最高?
- 简洁的桌面整理工具(Coodesker)
- 学术篇 | 面向分类的脑电接口Fuzzy-Rough特征选择
- 基于STM32F103的液晶显示电子钟
- 做自媒体,宝妈萌娃类视频尤其要注意,越好的视频越有节奏感
- android 反编译解析.
- 「 周末去哪儿」安卓版免费下载 - 豌豆荚
- win7无线热点_电脑小技巧电脑做无线热点