WPS数据清洗+R语言读取文件画频数分布直方图
R语言是一门好语言,但很多人在读取文件中数据时会遇到问题。比如我遇到的问题就是从文件中读取数据后,数据无法用于画图。
检索了N篇博文(抱歉我实在无法一一列举30+篇博文)后,终于看到曙光,事实告诉我学任何一门语言都需要至少投资一本教材(譬如《R语言编程艺术》(美)Norman Matloff著,陈堰平、邱怡轩、潘岚锋 等译)。
下面展示一个栗子:
D市每日接电话报警数已知,求何时警情比较集中?
这明摆着是个统计问题,频数分布直方图就能完美解决。
鉴于并不是所有Office软件都支持直接画频数分布直方图,我想到了大学时代刘苗老师教我们的现代统计软件课——没错,就是R。
R语言在于短小精悍且图形优美,感觉就是统计软件界的python嘛!
下面开始:
1.数据清洗
为了便于技术分享,我将数据脱敏。去掉接报警详细内容,只保留接报警时间一列:
图片只截取了一部分,日期是从2023-05-01到2023-05-31的,我们统计的是每日接报警集中情况,所以应将日期元素清洗掉。该怎么办呢?
这里康妮猫用了一个比较讨巧的做法:分列
是的,就是WPS自带的分列功能,可以将每一行“日期+时间”的数据拆分开。得到下图:(左列40000多是用WPS自带的格式转换为数据后得到的,右边是我们提取的时间数据)
将无用的左列删掉,再用WPS自带的格式转换将时间数据转换为小数。
2.数据读取
getwd()#获取工作空间地址
setwd("D:/data")#设置工作空间地址times=read.table("ds2023May.txt")#把WPS里的数据复制粘贴到记事本,读取
typeof(times)#检验数据类型,发现是“list”times=as.numeric(unlist(times))#这一步非常重要,接下来就可以操作咯
一定要用unlist()函数,否则读取的数据无法用于画图。发现其他方式的小伙伴一定要留言告诉我!
3.画图
hist(times)#这句虽然能出图,但横坐标不对,我们来个操作
hist(times*24)hist(times*24,xlab="h",ylab="人次",main="XX区5月电话报警峰谷图",sub="制图:Connie",xlim=c(0,25),ylim=c(0,500),col="blue",xaxt="n",yaxt="n")#这句出来个没坐标的图
执行代码,画出无坐标的图(因为我们要个性化坐标: ))
hist(times*24,xlab="h",ylab="人次",main="X区5月电话报警峰谷图",sub="制图:Connie",xlim=c(0,25),ylim=c(0,500),col="blue",xaxt="n",yaxt="n")#
axis(1,a)
axis(2,b)
如图所示,每日接报警情自6时起至8时不断增加,到中午12至13时有所下降,后上升至19时达到最高后又逐步下降。(我这个分析= =#仅供参考)
4.总结
a.前期数据清洗很重要。不然就会困死在一条代码上拔不出来。要灵活利用WPS自带的功能为我们减少工作负担~(别问我自动化水平降低怎么破,那是大神们的事)
b.画图要循序渐进,不要指望一条代码就解决整张图。
c.unlist()函数很重要,如果实在不知道数据类型就用typeof()查一查,秒懂!
好啦今天的分享就到这里,热爱Coding的你们,再会!
WPS数据清洗+R语言读取文件画频数分布直方图相关推荐
- R语言读取 文件 中文乱码,R语言画图 中文不显示
R语言 读入excel文件:用openxlsx install.packages(openxlsx) library(openxlsx) a<-read.xlsx("exercise1 ...
- R语言读取文件乱码的处理
文章目录 R语言read.csv乱码问题UTF-8 BOM X.U.FEFF R语言read.csv乱码问题UTF-8 BOM X.U.FEFF 可参考: https://blog.csdn.net/ ...
- r读取文件夹下的所有csv文件_[R语言]读取文件夹下所有子文件夹中的excel文件,并根据分类合并。...
解决的问题:需要读取某个大文件夹下所有子文件夹中的excel文件,并汇总,汇总文件中需要包含的2部分的信息:1.该条数据来源于哪个子文件夹:2.该条数据来源于哪个excel文件.最终,按照子文件夹单独 ...
- R语言读取文件报错之二:Error in read.table(“xxxx.txt“, header = TRUE) : 列的数目比列的名字要多
错误界面: 如果去掉header=T,不报错,打印结果如下: 然而,我的txt文件是这样的: 对于这个问题,搜索有说复制到Excel中,然后再粘贴回来,但是问题没有解决. 最终发现是编码的问题:加了f ...
- R语言09-单变量绘图(频数分布直方图/折线图)
使用ggplot绘图系统 运用qplot/ggplot两种方式进行单变量绘图示例: 直方图 qplot:系统默认柱状图 library(ggplot2) qplot(x = dob_day,data= ...
- R语言读取excel文件实战(read.xlsx函数、read_excel函数、read.xlsx函数、Write函数)
R语言读取excel文件实战(read.xlsx函数.read_excel函数.read.xlsx函数.Write函数) 目录 R语言读取excel文件实战(read.xlsx函数.read_exce ...
- r语言读取excel数据_R语言 | 更快的表格文件读取方法!
友情提示:蓝色下划线字体为引文,请保持警惕! 使用R语言读取 Affymetrix Human Exon 1.0 ST Array 芯片平台探针注释文件: https://www.affymetrix ...
- R语言将文件写入CSV,并读取
R语言将文件写入CSV,并读取 # 写入文件 write.csv(data,file = "mydata.csv",row.names = F) # 读文件 data_handle ...
- r语言读取C盘的csv文件,R语言开发之CSV文件的读写操作实现
在R中,我们可以从存储在R环境外部的文件读取数据,还可以将数据写入由操作系统存储和访问的文件.这个csv文件应该存在于当前工作目录中,以方便R可以读取它, 当然,也可以设置自己的目录,并从那里读取文件 ...
最新文章
- C#单例---饿汉式和懒汉式
- 软考(6)--数据库
- mybatis 注解的方式批量插入,更新数据
- 关键词组合工具-免费在线关键词标题组合工具
- AutoJs 4.1.1 实战教程
- 设置火狐 账号服务器,Firefox 账号问答
- 如何设计出令人惊叹的关卡:来自策划、美术与程序的标准
- 荔枝派Zero 全志V3s,NORFlash xt25f128b的移植
- 万能计算机在线应用,万能计算器在线使用技巧,快点学习吧
- 计算机免费证件照,完全免费!一键替换证件照背景色,再也不用花钱重新拍了...
- Pipeline快速入门
- linux centos中使用cp命令复制文件的时候出现omitting directory报错如何解决
- Android记录5--关于Android云测试的小思考
- 室内设计——海市蜃楼售楼部室内设计(包含预览图jpg和.psd文件)
- matlab清除所有变量,但是除了某些变量
- 2021贵州江口中学高考成绩查询,2020铜仁江口县中考分数线 江口县高中录取分数线 江口县中考成绩查询_中考_3773考试网...
- 写一个判别素数的函数,在主函数中输入一个整数,输出是否为素数的信息。
- 机器人介绍、应用、前景
- 2 REST framework -- 上
- 机房防雷,以下七点需谨记!
热门文章
- 24V升±160V/±280V/360V双输出高压脉冲电源,直流电源模块
- 2014年大学生创业项目大全
- 转:一个老站长的22条军规
- linux软件测试报告,软件测试实习报告_测试报告.doc
- Redis Geospatial 地理位置 类型
- vs 警告当前源代码跟内置的版本不一致解决办法
- Android歌词秀设计思路(8)后记
- HELLO一:如何开始DSP的学习
- 习题难度预测(英语阅读题)-Question Difficulty Prediction for READING Problems in Standard Tests
- iPhone将图片导入到 Mac