rstudio导入txt文件_R语言 | 读写txt、csv、excel文件
前段时间看到plotnine库(封装的R语言ggplot2)作的图太美了,有点想重新拾起R语言^_^
R语言代码略带凌乱,讲真的还是更喜欢Python代码简洁。不过好几年不琢磨R语言,对R语言代码的凌乱美有些新奇,很好玩,这也许就是久别胜新欢吧。
而且R语言的文本分析生态也挺全的,Python与R结合起来,完美~
R语言读写操作
本章文件读写用到的包有
readtext
readr
readxl
writexl
其中readr、readxl均为tidyverse内的子包,做数据分析一般绕不开tidyverse
tidyverse含有的包
library(tidyverse)
tidyverse::tidyverse_packages()
## [1] "broom" "cli" "crayon" "dbplyr" "dplyr"
## [6] "forcats" "ggplot2" "haven" "hms" "httr"
## [11] "jsonlite" "lubridate" "magrittr" "modelr" "pillar"
## [16] "purrr" "readr" "readxl" "reprex" "rlang"
## [21] "rstudioapi" "rvest" "stringr" "tibble" "tidyr"
## [26] "xml2" "tidyverse"
预备知识: tibble包
tibble比R内置的数据框的易用,默认不会将字符串转化为因子型。选择tibble数据的子集,返回的结果仍是tibble类型
创建数据框: tibble()
强制转化数据框: as_tibble()
创建数据框
#tibble::tibble意识是导入tibble包的tibble函数
df
x = c(1,2,3,4),
name=c("张三", "李四", "王五", "赵六"),
age=c(25, 23, 30, 18)
)
df
colnames(df)
## [1] "x" "name" "age"
rownames(df)
## [1] "1" "2" "3" "4"
读写实战
安装
install.packages(c("readtext","readr","readxl", "writexl"))
读取文件相关操作
读取
包
代码
功能
txt
readtext
readtext()
读取txt文件
csv
readr
read_csv()
读取csv文件
excel
readxl
read_excel()
读取xls、xlsx文件
读取csv
默认csv文件为utf-8编码
#读取csv
df
#为了展示的更好看一些
df
df
读取excel文件
df2
df2
读txt
document
document
#全部显示
#document['text']
#显示前200个字符
substr(document['text'], 1, 200)
## [1] "\n------------\n\n第1章 科学边界(1)\n\n 恋上你看书网 630bookla ,最快更新三体(全集)最新章节!\n\n 汪淼觉得,来找他的这四个人是一个奇怪的组合:两名警察和两名军人,如果那两个军人是武警还算正常,但这是两名陆军军官。\n\n 汪淼第一眼就对来找他的警察没有好感。其实那名穿警服的年轻人还行,举止很有礼貌,但那位便衣就让人讨厌了。这人长得五大三粗,一脸横肉,穿"
document[['doc_id']]
## [1] "三体.txt"
#全部显示
#document[['text']]
#显示前200个字符
substr(document[['text']], 1, 200)
## [1] "\n------------\n\n第1章 科学边界(1)\n\n 恋上你看书网 630bookla ,最快更新三体(全集)最新章节!\n\n 汪淼觉得,来找他的这四个人是一个奇怪的组合:两名警察和两名军人,如果那两个军人是武警还算正常,但这是两名陆军军官。\n\n 汪淼第一眼就对来找他的警察没有好感。其实那名穿警服的年轻人还行,举止很有礼貌,但那位便衣就让人讨厌了。这人长得五大三粗,一脸横肉,穿"
导入多个txt文件
list.files() 某路径下多个文件
#获取文件列表
files
head(files)
## [1] "data/txts/三孚股份2017.txt" "data/txts/三棵树2017.txt"
## [3] "data/txts/三江购物2017.txt" "data/txts/上海九百2017.txt"
## [5] "data/txts/上海机电2017.txt" "data/txts/上海物贸2017.txt"
texts
doc_ids
for (file in files) {
document
doc_ids
texts
#texts
}
df
doc_ids=doc_ids,
texts = texts
)
head(df)
写入文件相关操作
写入
包
代码
功能
csv
readr
write_csv()
将数据写入csv文件
excel
writexl
write_excel()
将数据写入excel
存入excel
使用writexl包的write_xlsx(x, path)
x: tibble表数据
path: xlsx文件路径
#写入xlsx
writexl::write_xlsx(df, "output/reports.xlsx")
存入csv
使用readr包的write_csv(x, path)
x: tibble表数据
path: csv件路径
#写入csv
readr::write_csv(df, "output/reports.csv")
rstudio导入txt文件_R语言 | 读写txt、csv、excel文件相关推荐
- python与r语言处理excel数据_R语言 | 读写txt、csv、excel文件
前段时间看到plotnine库(封装的R语言ggplot2)作的图太美了,有点想重新拾起R语言^_^ R语言代码略带凌乱,讲真的还是更喜欢Python代码简洁.不过好几年不琢磨R语言,对R语言代码的凌 ...
- r语言x%3c-读取文件,R语言读写最灵活的文件——txt文件
星爷 R语言可以读取很多文件,其中以txt文本文件最为灵活,为什么呢,txt文件可以以任意符号作为分隔符,比如",","\t",空格,甚至`"--&a ...
- dataframe两个表合并_R语言读取多个excel文件后合并:rbind/merge/cmd合并
问题: 该文件夹下的三个文件理论上列名完全一致,但是在用rbind合并时却提示上述错误,(只能理解为列名确实是不一致导致的问题)解决如下: (1)首先,rbind和cbind()也适用于datafra ...
- R语言 | 读写txt、csv、excel文件
[更新~] Python网络爬虫与文本数据分析 前段时间看到plotnine库(封装的R语言ggplot2)作的图太美了,有点想重新拾起R语言^_^ R语言代码略带凌乱,讲真的还是更喜欢Python代 ...
- Python学习笔记4——csv/excel文件读写保存
工具包准备和设置检查 csv文件读写和保存 csv文件读写 csv文件保存 Excel工作表文件读写和保存 excel文件读写 excel文件保存 总结 附录代码 工具包准备和设置检查 相关工具包导入 ...
- Python读写与追加excel文件
读写与追加excel文件用的是 xlwt(写),xlrd(读),xlutils(操作excel)这三个包 这篇博客从以下几个方面来叙述: 三个模块的安装 读取excel文件(.xls .xlsx) 写 ...
- python处理多个excel数据_python 数据分析基础 day8-pandas读写多个excel文件
今天是读<python数据分析基础>的第8天,今天的读书笔记的内容为利用pandas读写多个excel文件,当中涉及到读写excel文件的多个工作表. 大致原理如下: glob.glob( ...
- 关于JXL读写以及修改EXCEL文件转
首先引用网上的文章,谈谈JXL与POI的区别 POI为apache公司的一个子项目,主要是提供一组操作windows文档的Java API. Java Excel俗称jxl是一开放源码项目,通过它J ...
- 获取log文件信息,并保存至Excel文件
获取log文件信息,并保存至Excel文件 日常工作中,可能需要我们从txt文件中截取海量的信息,只要寻找到这种信息的规律或者定位好信息情况,在我的txt文件中有海量的信息,而我只需要截取09/11/ ...
- Pymediainfo读取文件夹视频长度并写入Excel文件(openpyxl)
Pymediainfo读取文件夹视频长度并写入excel文件(openpyxl) 导入使用的module 路径设置以及初始化 获取全部文件名称与文件大小 获取视频详细信息并存储 时间统计并得到总秒数及 ...
最新文章
- Scrapy爬虫-必备插件
- 项目部署、配置、查错常用到的Linux命令
- xpath的数据和节点类型以及XPath中节点匹配的基本方法
- silverlight 调用默认打印机
- 史上最权威的 Activiti 框架学习
- 添加游戏到游戏浏览器中的小工具
- Linux下使用SSH连接远端服务器技术总结
- vi 和vim的区别
- windows phone 扫描二维码
- lucene全文检索包括双层PDF
- Brocade 光纤交换机级联配置
- JS中动态创建元素的三种方法
- HTML caption文字颜色,HTML caption align 属性 - HTML 颜色参考手册 - 自强学堂
- oracle logged on,ORA-01012:not logged on的解决办法
- WPS怎么外链网页上的实时数据_数据收集、整理低效繁琐?WPS表单帮你轻松解决...
- 用selenium来下载小姐姐图片并保存
- [Zookeeper] 安装and各 配置参数详解
- Android11 热点配置信息保存分析
- 前端 获取 扫码枪等扫码设备输入内容:2种方式
- C++语法——详解运算符重载