R语言 如何合并csv文件(批量读取csv文件)
目录
- 问题描述
- 解决思路
- 代码
- 特别解释list.files()函数
问题描述
假设文件夹下有n个csv文件,需要将其合并后存入一个新的csv文件之中。
解决思路
获得文件绝对地址列表(每个元素是一个文件的绝对地址)后,循环读取csv文件,把读入数据暂存到df数据框中。之后把df追加写入的新的csv文件。在下一个循环中重置df并覆盖。这样可以实现内存数据df在每一次循环都放在外存,不会导致内存占用过多出bug。
如果要批量读取csv文件,只需对下面的代码稍加修改。
代码
library(readr)
library(data.table)dir = "……" # 搜索指定文件夹下文件,……填写为你的文件夹路径,注意使用/做目录分隔符
#获得csv文件列表
file_list = list.files(path = dir, pattern = "*.csv$",recursive = TRUE,full.names = TRUE) #获得csv文件列表
#生成新的存储地址,用于csv文件存储。为dir的上层目录,也可以自行修改paste(dir,"new.csv")部分为绝对路径
store_csv = paste(dir,"new.csv") for(i in 1:length(file_list)) #循环绝对地址的列表
{df = fread(file = file_list[i],encoding = 'UTF-8') #读取csv文件#如果不存在csv文件则创建,追加写入新csv文件write_csv(df,path = store_csv,append = TRUE, col_names = FALSE) }
特别解释list.files()函数
list.files(path = ".", pattern = NULL, all.files = FALSE,full.names = FALSE, recursive = FALSE,ignore.case = FALSE, include.dirs = FALSE, no.. = FALSE)
pattern = "*.csv$"表示搜索以.csv后缀名结束的所有文件
full.names 为True,返回全路径;反之只返回文件名
R语言 如何合并csv文件(批量读取csv文件)相关推荐
- R语言问题【已解决】读取CSV稳健出错:invalid multibyte string
读取csv文件数据的时候,因为文件编码问题,[GB18030与UTF-8不一致]导致出错. 解决方法:使用excel或者wps打开csv文件,另存为,选择 CSV UTF-8(.csv文件). 再使用 ...
- python 批量读取csv_Python Pandas批量读取csv文件到dataframe的方法
PYTHON Pandas批量读取csv文件到DATAFRAME 首先使用glob.glob获得文件路径.然后定义一个列表,读取文件后再使用concat合并读取到的数据. #读取数据 import p ...
- python 批量读取csv 文件到dataframe_python 批量读取csv_Python Pandas批量读取csv文件到dataframe的方法...
PYTHON Pandas批量读取csv文件到DATAFRAME 首先使用glob.glob获得文件路径.然后定义一个列表,读取文件后再使用concat合并读取到的数据. #读取数据 import p ...
- python批量读取csv文件-Python读取/批量读取文件
相信很多人的日常工作中,数据源除了来自数据库以外,其次就是外部文件,因此掌握读取文件的技能是相当必要的.在这里特此整理读取外部文件的方法,希望能有助你们快速解决问题.当然本文对读者的假设是有一定的py ...
- python 批量读取csv_python批量读取csv文件
请问大神怎样用python批量读取文件夹下的文件? python如何读取CSV文件一部分数据 Python如何批量读取CSV文件并写入TXT? 如何用python把多个csv文件数据处理后汇总到新cs ...
- python读取txt文件为dataframe,python批量读取txt文件为DataFrame
我们有时候会批量处理同一个文件夹下的文件,并且希望读取到一个文件里面便于我们计算操作.比方我有下图一系列的txt文件,我该如何把它们写入一个txt文件中并且读取为DataFrame格式呢? 首先我们要 ...
- python导入txt为dataframe-python批量读取txt文件为DataFrame的方法
我们有时候会批量处理同一个文件夹下的文件,并且希望读取到一个文件里面便于我们计算操作.比方我有下图一系列的txt文件,我该如何把它们写入一个txt文件中并且读取为DataFrame格式呢? 首先我们要 ...
- python读取txt为dataframe_python批量读取txt文件为DataFrame的方法
我们有时候会批量处理同一个文件夹下的文件,并且希望读取到一个文件里面便于我们计算操作.比方我有下图一系列的txt文件,我该如何把它们写入一个txt文件中并且读取为DataFrame格式呢? 首先我们要 ...
- 求问R语言 分层抽样 合并两个数据框为什么出现了空集
求问R语言 分层抽样 合并两个数据框为什么出现了空集 rbind计算不了 #分层抽样 mydata <- read.csv("dat.csv") #simsample 简单随 ...
最新文章
- 对象是空的吗? [重复]
- php xcat createadmin,php xcat update升级后出错,不知怎么弄
- java+random+oracle,oracle随机数 — dbms_random
- 软件测试 -- alpha测试和beta测试的区别
- oracle 执行sql,Oracle动态执行SQL
- 你可能需要为你的 APP 适配 iOS 11
- freeSWITCH 视频通话
- 【转帖】WEB架构师成长之路之一-走正确的路
- bzoj2436: [Noi2011]Noi嘉年华
- JavaScript cookie js cookie设置
- 遍历文件夹下的所有文件
- ruby 1.9.3 字符和asscii转换
- testbench实例 vhdl_VHDL TestBench基础(转)
- Java面试宝典2013版
- HLSL 学习笔记7 Light Mode
- JS 获取当前日期时间/时间日期格式化(时间戳 转 yyyy-MM-dd HH:mm:ss)
- 宽带码分多址系统中多径衰落与多址干扰的影响
- 怎么查看显卡算力(附nvidia显卡算力表)
- 闲鱼疯转 6800 份!大厂内部数据分析资料首次公开!
- 报告论文:程控交换技术的研究
热门文章
- 三色过人脸脚本_格灵深瞳算法团队获得NIST人脸识别竞赛全球第一
- 《黑客大曝光:移动应用安全揭秘及防护措施》一2.1 基础移动网络功能
- ios 扫码枪外设 键盘模式_想把 iPad 当笔记本电脑用?可以试试这款外接键盘
- 分销小程序功能有哪些?如何使用分销小程序实现裂变卖货?
- OpenSSL密码库算法笔记——第2.2.2章 Barrett约化的优越性
- 千里之遥看樱花,“东湖·樱园”元宇宙
- 本周总结:为图片标签<img>加上 alt属性的好处
- 在“https://money.cnn.com/data/markets/nasdaq/”抓取纳斯达克成分股数据并将数据表存到一个Excel表格中。
- React-单页面(SPA)多路由(代替多页面)
- 怎么根据快递单号批量查询物流信息?