R语言是一门好语言,但很多人在读取文件中数据时会遇到问题。比如我遇到的问题就是从文件中读取数据后,数据无法用于画图。

检索了N篇博文(抱歉我实在无法一一列举30+篇博文)后,终于看到曙光,事实告诉我学任何一门语言都需要至少投资一本教材(譬如《R语言编程艺术》(美)Norman Matloff著,陈堰平、邱怡轩、潘岚锋 等译)。

下面展示一个栗子:

D市每日接电话报警数已知,求何时警情比较集中?

这明摆着是个统计问题,频数分布直方图就能完美解决。

鉴于并不是所有Office软件都支持直接画频数分布直方图,我想到了大学时代刘苗老师教我们的现代统计软件课——没错,就是R。

R语言在于短小精悍且图形优美,感觉就是统计软件界的python嘛!

下面开始:

1.数据清洗

为了便于技术分享,我将数据脱敏。去掉接报警详细内容,只保留接报警时间一列:

图片只截取了一部分,日期是从2023-05-01到2023-05-31的,我们统计的是每日接报警集中情况,所以应将日期元素清洗掉。该怎么办呢?

这里康妮猫用了一个比较讨巧的做法:分列

是的,就是WPS自带的分列功能,可以将每一行“日期+时间”的数据拆分开。得到下图:(左列40000多是用WPS自带的格式转换为数据后得到的,右边是我们提取的时间数据)

将无用的左列删掉,再用WPS自带的格式转换将时间数据转换为小数。

2.数据读取

getwd()#获取工作空间地址
setwd("D:/data")#设置工作空间地址times=read.table("ds2023May.txt")#把WPS里的数据复制粘贴到记事本,读取
typeof(times)#检验数据类型,发现是“list”times=as.numeric(unlist(times))#这一步非常重要,接下来就可以操作咯

一定要用unlist()函数,否则读取的数据无法用于画图。发现其他方式的小伙伴一定要留言告诉我!

3.画图

hist(times)#这句虽然能出图,但横坐标不对,我们来个操作
hist(times*24)hist(times*24,xlab="h",ylab="人次",main="XX区5月电话报警峰谷图",sub="制图:Connie",xlim=c(0,25),ylim=c(0,500),col="blue",xaxt="n",yaxt="n")#这句出来个没坐标的图

执行代码,画出无坐标的图(因为我们要个性化坐标: ))

 hist(times*24,xlab="h",ylab="人次",main="X区5月电话报警峰谷图",sub="制图:Connie",xlim=c(0,25),ylim=c(0,500),col="blue",xaxt="n",yaxt="n")#
axis(1,a)
axis(2,b)

如图所示,每日接报警情自6时起至8时不断增加,到中午12至13时有所下降,后上升至19时达到最高后又逐步下降。(我这个分析= =#仅供参考)

4.总结

a.前期数据清洗很重要。不然就会困死在一条代码上拔不出来。要灵活利用WPS自带的功能为我们减少工作负担~(别问我自动化水平降低怎么破,那是大神们的事)

b.画图要循序渐进,不要指望一条代码就解决整张图。

c.unlist()函数很重要,如果实在不知道数据类型就用typeof()查一查,秒懂!

好啦今天的分享就到这里,热爱Coding的你们,再会!

WPS数据清洗+R语言读取文件画频数分布直方图相关推荐

  1. R语言读取 文件 中文乱码,R语言画图 中文不显示

    R语言 读入excel文件:用openxlsx install.packages(openxlsx) library(openxlsx) a<-read.xlsx("exercise1 ...

  2. R语言读取文件乱码的处理

    文章目录 R语言read.csv乱码问题UTF-8 BOM X.U.FEFF R语言read.csv乱码问题UTF-8 BOM X.U.FEFF 可参考: https://blog.csdn.net/ ...

  3. r读取文件夹下的所有csv文件_[R语言]读取文件夹下所有子文件夹中的excel文件,并根据分类合并。...

    解决的问题:需要读取某个大文件夹下所有子文件夹中的excel文件,并汇总,汇总文件中需要包含的2部分的信息:1.该条数据来源于哪个子文件夹:2.该条数据来源于哪个excel文件.最终,按照子文件夹单独 ...

  4. R语言读取文件报错之二:Error in read.table(“xxxx.txt“, header = TRUE) : 列的数目比列的名字要多

    错误界面: 如果去掉header=T,不报错,打印结果如下: 然而,我的txt文件是这样的: 对于这个问题,搜索有说复制到Excel中,然后再粘贴回来,但是问题没有解决. 最终发现是编码的问题:加了f ...

  5. R语言09-单变量绘图(频数分布直方图/折线图)

    使用ggplot绘图系统 运用qplot/ggplot两种方式进行单变量绘图示例: 直方图 qplot:系统默认柱状图 library(ggplot2) qplot(x = dob_day,data= ...

  6. R语言读取excel文件实战(read.xlsx函数、read_excel函数、read.xlsx函数、Write函数)

    R语言读取excel文件实战(read.xlsx函数.read_excel函数.read.xlsx函数.Write函数) 目录 R语言读取excel文件实战(read.xlsx函数.read_exce ...

  7. r语言读取excel数据_R语言 | 更快的表格文件读取方法!

    友情提示:蓝色下划线字体为引文,请保持警惕! 使用R语言读取 Affymetrix Human Exon 1.0 ST Array 芯片平台探针注释文件: https://www.affymetrix ...

  8. R语言将文件写入CSV,并读取

    R语言将文件写入CSV,并读取 # 写入文件 write.csv(data,file = "mydata.csv",row.names = F) # 读文件 data_handle ...

  9. r语言读取C盘的csv文件,R语言开发之CSV文件的读写操作实现

    在R中,我们可以从存储在R环境外部的文件读取数据,还可以将数据写入由操作系统存储和访问的文件.这个csv文件应该存在于当前工作目录中,以方便R可以读取它, 当然,也可以设置自己的目录,并从那里读取文件 ...

最新文章

  1. C#单例---饿汉式和懒汉式
  2. 软考(6)--数据库
  3. mybatis 注解的方式批量插入,更新数据
  4. 关键词组合工具-免费在线关键词标题组合工具
  5. AutoJs 4.1.1 实战教程
  6. 设置火狐 账号服务器,Firefox 账号问答
  7. 如何设计出令人惊叹的关卡:来自策划、美术与程序的标准
  8. 荔枝派Zero 全志V3s,NORFlash xt25f128b的移植
  9. 万能计算机在线应用,万能计算器在线使用技巧,快点学习吧
  10. 计算机免费证件照,完全免费!一键替换证件照背景色,再也不用花钱重新拍了...
  11. Pipeline快速入门
  12. linux centos中使用cp命令复制文件的时候出现omitting directory报错如何解决
  13. Android记录5--关于Android云测试的小思考
  14. 室内设计——海市蜃楼售楼部室内设计(包含预览图jpg和.psd文件)
  15. matlab清除所有变量,但是除了某些变量
  16. 2021贵州江口中学高考成绩查询,2020铜仁江口县中考分数线 江口县高中录取分数线 江口县中考成绩查询_中考_3773考试网...
  17. 写一个判别素数的函数,在主函数中输入一个整数,输出是否为素数的信息。
  18. 机器人介绍、应用、前景
  19. 2 REST framework -- 上
  20. 机房防雷,以下七点需谨记!

热门文章

  1. 24V升±160V/±280V/360V双输出高压脉冲电源,直流电源模块
  2. 2014年大学生创业项目大全
  3. 转:一个老站长的22条军规
  4. linux软件测试报告,软件测试实习报告_测试报告.doc
  5. Redis Geospatial 地理位置 类型
  6. vs 警告当前源代码跟内置的版本不一致解决办法
  7. Android歌词秀设计思路(8)后记
  8. HELLO一:如何开始DSP的学习
  9. 习题难度预测(英语阅读题)-Question Difficulty Prediction for READING Problems in Standard Tests
  10. iPhone将图片导入到 Mac