目录

一、数据框操作

1.读取线圈检测器数据样例:Detector_sample.csv, 输出总记录数

2.统计流量一列的缺失个数.

3.对包含缺失值的行进行剔除,输出剔除后记录数.

4.统计冗余记录数,如有需剔除. (参考函数:duplicated())

5.计算流量、速度、占有率的平均值、方差、25%、50%和75%分位数

二、日期时间处理

2.1 处理

6.对数据框按照时间列进行排序.

7.分别提取日期时间列的小时、分钟、秒,新增为DAY、MINUTE、SECOND列.

2.2 绘图

8.绘制流量、速度、占有率的直方图

9.绘制流量-速度散点图.


一、数据框操作

1.读取线圈检测器数据样例:Detector_sample.csv, 输出总记录数

代码:

data<-read.csv("F:\\data\\Detector_sample_update.csv")View(data)

输出结果(篇幅所限,仅截图首尾,中间略):

2.统计流量一列的缺失个数.

代码:

table(is.na(data[3]))

输出结果:

即缺失个数为3

3.对包含缺失值的行进行剔除,输出剔除后记录数.

代码:

na_omit_data<-na.omit(data)print(nrow(na_omit_data))

输出结果:

即剔除后记录数为4323

4.统计冗余记录数,如有需剔除. (参考函数:duplicated())

代码:

table(duplicated(na_omit_data))dupicated_data<-na_omit_data[!duplicated(na_omit_data),]

输出结果:

 即冗余记录数为6条

5.计算流量、速度、占有率的平均值、方差、25%、50%和75%分位数

代码:

summary(dupicated_data)var(dupicated_data[3])var(dupicated_data[4])var(dupicated_data[5])

输出结果:

即:

流量平均值为7.51,方差为15.77452,25%分位数为4.00,50%分位数为9.00,75%分位数为11.00。

速度平均值为51.23,方差为348.3788,25%分位数为38.00,50%分位数为48.00,75%分位数为66.00。

占有率平均值为15.79,方差为124.3895,25%分位数为5.00,50%分位数为16.00,75%分位数为25.00。

二、日期时间处理

2.1 处理

6.对数据框按照时间列进行排序.

代码:

order_data<-dupicated_data[order(dupicated_data$FDT_TIME),]View(order_data)

输出结果:

7.分别提取日期时间列的小时、分钟、秒,新增为DAY、MINUTE、SECOND列.

代码:

library(lubridate)datatime<-as.POSIXlt(order_data$FDT_TIME)order_data$HOUR <- c(hour(datatime))order_data$MINUTE <- c(minute(datatime))order_data$SECOND <- c(second(datatime))

2.2 绘图

8.绘制流量、速度、占有率的直方图

代码:

输出结果:

9.绘制流量-速度散点图.

代码

输出结果

r语言作业:出租车数据基础数据分析、时间处理等相关推荐

  1. R语言实现金融数据的时间序列分析及建模

    R语言实现金融数据的时间序列分析及建模 一 移动平均    移动平均能消除数据中的季节变动和不规则变动.若序列中存在周期变动,则通常以周期为移动平均项数.移动平均法可以通过数据显示出数据长期趋势的变动 ...

  2. R语言作业:1.mpg数据的cty(城市燃油效率)和hwy(高速公路燃油效率)之间有什么关系? 请制作x轴是cty,y轴是hwy的算点图。 请把图片储存起来上传

    这是一份R语言作业: 1.mpg数据的cty(城市燃油效率)和hwy(高速公路燃油效率)之间有什么关系? 请制作x轴是cty,y轴是hwy的算点图. 请把图片储存起来上传 了解哪些公司生产的" ...

  3. r语言用行名称提取数据框信息显示na_学会这些R语言技巧至少可以节省半年时间...

    ubuntu备忘定期清空回收站 扩增子数据牢记 r ubuntu 相关技巧和备忘待解决问题1:phyloseq有一篇文章案例使用输入和输出文件相同的文件名,无法执行 待解决问题2: 待解决问题3:样品 ...

  4. R语言基本介绍 | 数据科学、Rstudio介绍、快捷键操作、R代码常见命令、数据类型、示例代码等等

    一.数据科学 数据科学:计算和统计技术的综合应用,用于解决一些真实世界中的问题. 计算:获得结果 统计:分析和建模 真实世界:机器学习.AI 数据科学Data Science = 统计+数据处理+机器 ...

  5. R语言兵器谱:数据科学家的十八般武艺

    在过去一年的数据科学的实践中,总有人问我平时如何学习R语言的,被问的次数多了,多少有点有感而发,刚好前段时间Mark了一个资料说有哪些R包是数据科学家的必备武器,就打算结合自己的学习经验谈谈如何学习R ...

  6. python和r语言哪个入门容易-R语言 vs Python对比:数据分析哪家强?

    什么是R语言? R语言,一种自由软件编程语言与操作环境,主要用于统计分析.绘图.数据挖掘.R本来是由来自新西兰奥克兰大学的罗斯·伊哈卡和罗伯特·杰特曼开发(也因此称为R),现在由"R开发核心 ...

  7. R语言seq函数生成数据序列实战

    R语言seq函数生成数据序列实战 目录 R语言seq函数生成数据序列实战 #基本语法 #seq函数的基础应用

  8. R语言将向量数据按照行方式转化为矩阵数据(设置参数byrow为TRUE)、计算矩阵数据的特征值(eigenvalue)

    R语言将向量数据按照行方式转化为矩阵数据(设置参数byrow为TRUE).计算矩阵数据的特征值(eigenvalue) 目录 R语言将向量数据按照行方式转化为矩阵数据(设置参数byrow为TRUE). ...

  9. R语言处理缺失数据的5个常用包

    R语言处理缺失数据的5个常用包 1.常用缺失数据处理包 2. MICE 包 2.1基本介绍 2.2 实例展示 3.Amelia包 3.1基本介绍 3.2实例展示 4.missForest包 4.1基本 ...

  10. r语言 读服务器数据,R语言数据实战 | 安装R语言

    原标题:R语言数据实战 | 安装R语言 1.R的获取和安装 获取和安装R很容易(这也是它"亲民"的地方),具体步骤如下: Step 1: 登陆R语言官方网站https://www. ...

最新文章

  1. 快排递归非递归python_Python递归神经网络终极指南
  2. 摊牌了!国内首个基于结构光投影三维重建系列视频课程
  3. AWS — 重塑混合云
  4. cout的输出格式初探2
  5. 笔记-信息系统开发基础-信息系统开发方法
  6. Web服务安全性和SOA路线图的人为维度
  7. OpenKG 祝大家元宵节快乐!
  8. 51单片机 驱动步进电机 C语言 lcd,51单片机红外遥控控制步进电机的LCD显示源程序...
  9. 操作系统原理(四)死锁和进程调度
  10. ResNet50及其Keras实现
  11. 开源dns软件PowerDNS BIND9 mydns
  12. 天翼云技术B卷编程题
  13. 游戏开发工程师岗位要求
  14. 完美解决:error: failed to push some refs to 'https://github.com/xxxx.git'
  15. 线条边框简笔画图片大全_每天学一幅简笔画生活小物简笔画图片大全!
  16. 手机变速齿轮_变速齿轮神途官方版下载-变速齿轮神途手游官方版下载 v2.20190828-114手机乐园...
  17. node.js学习-第一章节
  18. python爬虫学习_junior
  19. 第一章 MUD:创造世界的巫师
  20. 北京系列10——返程

热门文章

  1. TensorFlow之Numpy(3)
  2. 记一次YUV图像分析(二)
  3. HTTP请求报文格式与HTTP2.0
  4. CentOS7 Debian 8 安装VMware-tools
  5. CORS(跨域资源共享) 的配置
  6. FPGA BCD计数器(多位)
  7. faster RCNN 与 fast RCNN 一分钟回忆图
  8. Qt 点击任意子控件,背景选中 选中背景
  9. 安卓笔记:去除顶部的bar(安卓5.1)
  10. windows环境下zookeeper做成服务并启动