#创建新变量并保存到原有数据框
#way 1
d = data.frame(x1=1:4,x2=2:5)
d$sum = d$x1+d$x2
#way 2
d= transform(d,sum=x1+x2,meanx=(x1+x2)/2)#变量的重编码
d = within(d,{x1Less2 = NAx1Less2[x1<=2] = "y"x1Less2[x1>2] = "n"
})#变量的重命名
fix(d)
names(d)[c(3,4)] = c("sumX","menaX")#缺失值
y = c(1:3,NA)
is.na(y)
sum(y,na.rm=TRUE)
na.omit(y)#日期值
mydate = as.Date(c("2007-06-22","2004-02-13"))
mydate
class(mydate)
strDates = c("01/05/1965","08/16/1975")
dates = as.Date(strDates,"%m/%d/%T")
dates
today = Sys.Date()
format(today,format="%m %d %Y")
format(today,format="%A %a %B %b %Y %y")
date()
startdate = as.Date("1993-08-22")
days = today-startdate
days
difftime(today,startdate,units="weeks")#类型转换
is.numeric
is.character
is.factor
is.logical
is.vector#数据排序
d = data.frame(c1=rep(1:3,imes=3),c2=seq(1,9))
index = order(d$c1,d$c2)
index
d[index,]#数据集的合并
##添加列
total = merge(dA,dB,by="id")
total = cbind(a,b)
#添加行
total = rbind(a,b)#数据集取子集
d = head(airquality)
#保留变量
d[,c(2,3)]
d[c(2,3)]
d[c("Solar.R","Wind")]
#丢弃变量
d[c(-2,-3)]
d[! names(d) %in% c("Solar.R", "Wind")]
d$Solar.R = d$Wind = NULL
#选入观测
d[which(d$Ozone==41),]
#subset函数
subset(d,Ozone>20 | Day==4,select=Wind:Day)
#随机抽样
d[sample(1:nrow(d),5,replace=FALSE),]
#使用sql语句操纵数据框
install.packages("sqldf")
library(sqldf)
newdf = sqldf("select * from mtcars where carb=1 order by mpg",row.names=TRUE)
sqldf("select avg(mpg) as avg_mpg, avg(disp) as avg_disp, gearfrom mtcars where cyl in (4,6) group by gear")

R语言_基本数据管理相关推荐

  1. R语言_高级数据管理

    #数值处理函数 #数学函数 abs sqrt ceiling floor round(x,digits=n) #舍入为指定位的小数 signif #舍入为指定位的有效数字 log(x,base=n) ...

  2. 泰尔指数r语言_还在用Excel算区位基尼系数?用geo.gini吧!

    区域经济研究中,经常需要测度产业空间集中的程度,常用的指标有区位基尼系数(Locational GiniCoefficient).泰尔指数(Theil Index)和EG指数等.这一期先讲区位基尼系数 ...

  3. 更新r语言_【R语言学习最佳资料之一】R小抄速查表精简更新版

    下午午睡起来,右边后脑勺痛,没有办法集中精神去思考问题,干脆就把五月份整理的R语言小抄整理了一遍,分享给大家. 我选择了我认为比较重内容进行整理,并且重新整理目录,方便大家查阅学习.小伙伴们可以自己下 ...

  4. multinorm r语言_与心理学数据分析相关的R工具包

    为下周末的R语言会议热个身,写下自己收集的心理学研究的数据分析相关的R包. R语言做统计已经慢慢成为(国际)心理学的主流了,国内由于盗版SPSS的长期存在,严重阻碍了心理学研究者使用R的步伐.当然,考 ...

  5. 二元置信椭圆r语言_医学统计与R语言:圆形树状图(circular dendrogram)

    微信公众号:医学统计与R语言如果你觉得对你有帮助,欢迎转发 输入1: "ggraph") 结果1: name 输入2: <- graph_from_data_frame(my ...

  6. 数据科学r语言_您应该为数据科学学习哪些语言?

    数据科学r语言 Data science is an exciting field to work in, combining advanced statistical and quantitativ ...

  7. 二元置信椭圆r语言_医学统计与R语言:多分类logistic回归HosmerLemeshow拟合优度检验...

    微信公众号:医学统计与R语言如果你觉得对你有帮助,欢迎转发 输入1:multinominal logistic regression "nnet") 结果1: test (mult ...

  8. pycharm中配置r语言_【R语言】R语言中的循环

    编程中减少代码重复的两个工具,一是循环,一是函数. 循环,用来处理对多个同类输入做相同事情(即迭代),如对不同列做相同操作.对不同数据集做相同操作. R语言有三种方式实现循环: (1)for循环.wh ...

  9. 2线性模型 r语言_多层线性模型在R语言上的实现(三)

    终于有时间写新的一篇HLM在R语言的实现,有读者私信我,说写文章幅度比较小.我这里要说明下我主要想采用"小步快走"的思维给大家展示这个过程,如果一篇文章篇幅太大,我相信很多人也是看 ...

最新文章

  1. 矩形面积交(蓝桥杯)
  2. ref out的用法
  3. vscode php 不进断点,php – Docker和XDebug没有读取断点VSCode
  4. android 内存分析工具_Android Camera内存问题剖析
  5. 嵌入式系统——软件开发模型
  6. [洛谷1533] 可怜的狗狗
  7. 解决 googel 无法直接跳转网页打开搜索结果
  8. 关于伺服驱动控制的课本_伺服电机的PLC控制详解
  9. matlab 传函将s换为jw,2010MATLAB及控制系统仿真_总复习.ppt
  10. 灰色页面,HTML灰色页面
  11. vs行尾不一致,是否将行尾标准化的问题
  12. 微服务理论与实践[1]-什么是微服务
  13. 开源许可证 GPL、BSD、MIT、Mozilla、Apache和LGPL的区别。
  14. SSL双向认证的证书详解
  15. C语言项目实战——学生成绩系统管理
  16. mysql 跳过事务 gtid
  17. php下单免单,淘客免单新玩法
  18. restart和reload的区别
  19. 【python计算机二级】python论语文本提纯-计算机二级操作题
  20. 全球及中国咳嗽和感冒药行业竞争趋势及需求规模预测报告(2022-2027)

热门文章

  1. 基于视觉和惯性传感器的移动机器人手遥操作系统
  2. 入门NLP最优解:从项目实践轻松入手!
  3. 基于深度学习方式的点云处理算法汇总
  4. 非线性优化:徒手实现LM算法
  5. ICML2020 | 基于贝叶斯元学习在关系图上进行小样本关系抽取
  6. Analytical Chemistry | 深度学习实现高分辨率LC-MS数据中的精确峰检测
  7. 差异表达基因-火山图和聚类图解释
  8. 初探Django2.1:Win10+Python3.6.6环境下安装Django
  9. CentOS 7下安装UCSF Chimera
  10. Java文件的状态_java中文件的状态