R语言快速读取数据方法
我们使用大小为2.2G的一个CSV文件。
一、data.table包下的fread(各种帖子均说此方法最快,我们来比较下)
library(data.table)
start <- Sys.time()
dtc <- fread("C:/Users/10530/Desktop/DTc/DtcDrugTargetInteractions.csv", sep = ",", stringsAsFactors = F, na.strings = "", data.table = T)
end <- Sys.time()
print(end-start)
fread还会有读取进度条, 运行时间1.423824 分
二、read.方法(这里我们以read.csv函数为例)
start <- Sys.time()
dtc <- read.csv("C:/Users/10530/Desktop/DTc/DtcDrugTargetInteractions.csv", sep = ",", stringsAsFactors = F, na.strings = "")
end <- Sys.time()
print(end-start)
运行时间2.003878 分
三、有人提到,保存为Rdata之后,在再次导入速度会快很多,我们试试
save(dtc, file = "dtc.Rdata")
start <- Sys.time()
load("dtc.Rdata")
end <- Sys.time()
print(end-start)
运行时间6.042526 秒
总结,fread确实是初始导入数据最快的方法,不过在导入后的数据,若以.Rdata文件储存,再次导入时,大大节省时间。另外,fread什么都好,就是不能读取excel数据文件。
END
R语言快速读取数据方法相关推荐
- 如何在R语言中读取数据
读取数据有以下几种方式: 1.最常用的是采用读取表格数据的函数 read.table()以及read.csv()..这些函数读取一种以行列的格式存储数据的文本文件,然后在R中返回一个数据框. 2.re ...
- R语言 循环读取数据文件 循环读取csv tsv xlsx数据
读取数据,XLSX 或者 TSV 或者 CSV [1]先读取一个试下,确认能正确读取进去 下面三种格式提供参考 data <- read_excel("C:/XXX/1.xlsx&qu ...
- R语言-批量读取数据文件以及提取字符串中的数字
#第一部分 #先将当前文件夹下的所有以csv结尾的文件名读进来 filelist <- list.files(pattern=".*.csv") #文件个数 m<-le ...
- R语言在读取数据的时候自动加上X. 检查列名的有效性
最近在用R代码进行长宽数据转换的时候出现了X.问题,经过一番搜索才发现是R会检查列名的有效性. 使用read.Table或者read.csv系列函数的时候有一个参数check.names参数,默认为T ...
- 掌握R语言文件读取方法
目标 掌握 R语言文件读取方法 学习笔记 utils包内Date Input用法 base包内readLines用法 stringi包内stri_read_lines xlsx包内Date Input ...
- R语言进行dataframe数据内连接(Inner join):使用R原生方法、data.table、dplyr等方案
R语言进行dataframe数据内连接(Inner join):使用R原生方法.data.table.dplyr等方案 目录 R语言进行dataframe数据内连接(Inner join):使用R原生 ...
- R语言进行dataframe数据左连接(Left join):使用R原生方法、data.table、dplyr等方案
R语言进行dataframe数据左连接(Left join):使用R原生方法.data.table.dplyr等方案 目录 R语言进行dataframe数据左连接(Left join):使用R原生方法 ...
- R语言中读取xlsx文件的方法
R语言中读取xlsx文件的方法 安装包 install.packages("openxlsx") library(openxlsx) 文件名+sheet的序号 data<- ...
- R语言中读取excel数据的常用方式有哪些?
R语言中读取excel数据的常用方式有哪些? 目录 R语言中读取excel数据的常用方式有哪些? R语言是解决什么问题的? R语言中读取excel数据的常用方式有哪些? R语言是解决什么问题的? R ...
最新文章
- php cookie使用实例h5,html5实现数据存储实例代码
- 用java程序编写ip仿真器_用java 编写一个可以实现IP地址查询功能的课程设计
- pgsql动态创建table
- UVA 839 Not so Mobile
- Java 分割、合并byte数组
- PWN-PRACTICE-CTFSHOW-2
- 学霸情侣一起投身国防事业,爱情和优秀同时发生了…
- 精通ASP.NET MVC ——视图
- java ee 值范围_javaEE四大作用域(共享域)
- NSRange类详解
- 4.分布式服务架构:原理、设计与实战 --- 大数据日志系统的构建
- 解决安装WordCloud出错
- 基于matlab车牌识别算法
- 【1.Delphi基础】1.Delphi程序设计入门
- spring 源码解析
- oracle round 没有0,oracle round函数的使用方法
- 数学一年级应用题_一年级数学下册应用题大全(附带答案)
- 红黑树的深入分析和实现
- 指挥中心显示大屏类型简介
- LeetCode46:全排列(八皇后)
热门文章
- CentOS 特殊变量($0、$1、$2、 $?、 $# 、$@、 $*)
- session的removeAttribute()和invalidate()的区别
- 【嵌入式】Linux开发工具gdb及远程调试
- 【MyBatis笔记】10-多对一左连接查询分步查询(查询所有订单及订单对应的客户)
- Django 的第三方包
- 不会代码也想做酷炫大屏?30份精美可视化模板送给你
- 如何用敏捷搞垮一个IT团队?
- 帮你找到了几份非公开的大数据报告,错过再无,手慢的人抓紧
- 大数据时代下的“管理”要素数据化
- 深入浅出 数据库索引