前段时间看到plotnine库(封装的R语言ggplot2)作的图太美了,有点想重新拾起R语言^_^

R语言代码略带凌乱,讲真的还是更喜欢Python代码简洁。不过好几年不琢磨R语言,对R语言代码的凌乱美有些新奇,很好玩,这也许就是久别胜新欢吧。

而且R语言的文本分析生态也挺全的,Python与R结合起来,完美~

R语言读写操作

本章文件读写用到的包有

readtext

readr

readxl

writexl

其中readr、readxl均为tidyverse内的子包,做数据分析一般绕不开tidyverse

tidyverse含有的包

library(tidyverse)

tidyverse::tidyverse_packages()

##  [1] "broom"      "cli"        "crayon"     "dbplyr"     "dplyr"

##  [6] "forcats"    "ggplot2"    "haven"      "hms"        "httr"

## [11] "jsonlite"   "lubridate"  "magrittr"   "modelr"     "pillar"

## [16] "purrr"      "readr"      "readxl"     "reprex"     "rlang"

## [21] "rstudioapi" "rvest"      "stringr"    "tibble"     "tidyr"

## [26] "xml2"       "tidyverse"

预备知识: tibble包

tibble比R内置的数据框的易用,默认不会将字符串转化为因子型。选择tibble数据的子集,返回的结果仍是tibble类型

创建数据框: tibble()

强制转化数据框: as_tibble()

创建数据框

#tibble::tibble意识是导入tibble包的tibble函数

df

x = c(1,2,3,4),

name=c("张三", "李四", "王五", "赵六"),

age=c(25, 23, 30, 18)

)

df

colnames(df)

## [1] "x"    "name" "age"

rownames(df)

## [1] "1" "2" "3" "4"

读写实战

安装

install.packages(c("readtext","readr","readxl", "writexl"))

读取文件相关操作

读取

代码

功能

txt

readtext

readtext()

读取txt文件

csv

readr

read_csv()

读取csv文件

excel

readxl

read_excel()

读取xls、xlsx文件

读取csv

默认csv文件为utf-8编码

#读取csv

df

#为了展示的更好看一些

df

df

读取excel文件

df2

df2

读txt

document

document

#全部显示

#document['text']

#显示前200个字符

substr(document['text'], 1, 200)

## [1] "\n------------\n\n第1章 科学边界(1)\n\n    恋上你看书网 630bookla ,最快更新三体(全集)最新章节!\n\n    汪淼觉得,来找他的这四个人是一个奇怪的组合:两名警察和两名军人,如果那两个军人是武警还算正常,但这是两名陆军军官。\n\n    汪淼第一眼就对来找他的警察没有好感。其实那名穿警服的年轻人还行,举止很有礼貌,但那位便衣就让人讨厌了。这人长得五大三粗,一脸横肉,穿"

document[['doc_id']]

## [1] "三体.txt"

#全部显示

#document[['text']]

#显示前200个字符

substr(document[['text']], 1, 200)

## [1] "\n------------\n\n第1章 科学边界(1)\n\n    恋上你看书网 630bookla ,最快更新三体(全集)最新章节!\n\n    汪淼觉得,来找他的这四个人是一个奇怪的组合:两名警察和两名军人,如果那两个军人是武警还算正常,但这是两名陆军军官。\n\n    汪淼第一眼就对来找他的警察没有好感。其实那名穿警服的年轻人还行,举止很有礼貌,但那位便衣就让人讨厌了。这人长得五大三粗,一脸横肉,穿"

导入多个txt文件

list.files() 某路径下多个文件

#获取文件列表

files

head(files)

## [1] "data/txts/三孚股份2017.txt" "data/txts/三棵树2017.txt"

## [3] "data/txts/三江购物2017.txt" "data/txts/上海九百2017.txt"

## [5] "data/txts/上海机电2017.txt" "data/txts/上海物贸2017.txt"

texts

doc_ids

for (file in files) {

document

doc_ids

texts

#texts

}

df

doc_ids=doc_ids,

texts = texts

)

head(df)

写入文件相关操作

写入

代码

功能

csv

readr

write_csv()

将数据写入csv文件

excel

writexl

write_excel()

将数据写入excel

存入excel

使用writexl包的write_xlsx(x, path)

x:  tibble表数据

path: xlsx文件路径

#写入xlsx

writexl::write_xlsx(df, "output/reports.xlsx")

存入csv

使用readr包的write_csv(x, path)

x:  tibble表数据

path: csv件路径

#写入csv

readr::write_csv(df, "output/reports.csv")

rstudio导入txt文件_R语言 | 读写txt、csv、excel文件相关推荐

  1. python与r语言处理excel数据_R语言 | 读写txt、csv、excel文件

    前段时间看到plotnine库(封装的R语言ggplot2)作的图太美了,有点想重新拾起R语言^_^ R语言代码略带凌乱,讲真的还是更喜欢Python代码简洁.不过好几年不琢磨R语言,对R语言代码的凌 ...

  2. r语言x%3c-读取文件,R语言读写最灵活的文件——txt文件

    星爷 R语言可以读取很多文件,其中以txt文本文件最为灵活,为什么呢,txt文件可以以任意符号作为分隔符,比如",","\t",空格,甚至`"--&a ...

  3. dataframe两个表合并_R语言读取多个excel文件后合并:rbind/merge/cmd合并

    问题: 该文件夹下的三个文件理论上列名完全一致,但是在用rbind合并时却提示上述错误,(只能理解为列名确实是不一致导致的问题)解决如下: (1)首先,rbind和cbind()也适用于datafra ...

  4. R语言 | 读写txt、csv、excel文件

    [更新~] Python网络爬虫与文本数据分析 前段时间看到plotnine库(封装的R语言ggplot2)作的图太美了,有点想重新拾起R语言^_^ R语言代码略带凌乱,讲真的还是更喜欢Python代 ...

  5. Python学习笔记4——csv/excel文件读写保存

    工具包准备和设置检查 csv文件读写和保存 csv文件读写 csv文件保存 Excel工作表文件读写和保存 excel文件读写 excel文件保存 总结 附录代码 工具包准备和设置检查 相关工具包导入 ...

  6. Python读写与追加excel文件

    读写与追加excel文件用的是 xlwt(写),xlrd(读),xlutils(操作excel)这三个包 这篇博客从以下几个方面来叙述: 三个模块的安装 读取excel文件(.xls .xlsx) 写 ...

  7. python处理多个excel数据_python 数据分析基础 day8-pandas读写多个excel文件

    今天是读<python数据分析基础>的第8天,今天的读书笔记的内容为利用pandas读写多个excel文件,当中涉及到读写excel文件的多个工作表. 大致原理如下: glob.glob( ...

  8. 关于JXL读写以及修改EXCEL文件转

    首先引用网上的文章,谈谈JXL与POI的区别 POI为apache公司的一个子项目,主要是提供一组操作windows文档的Java API.  Java Excel俗称jxl是一开放源码项目,通过它J ...

  9. 获取log文件信息,并保存至Excel文件

    获取log文件信息,并保存至Excel文件 日常工作中,可能需要我们从txt文件中截取海量的信息,只要寻找到这种信息的规律或者定位好信息情况,在我的txt文件中有海量的信息,而我只需要截取09/11/ ...

  10. Pymediainfo读取文件夹视频长度并写入Excel文件(openpyxl)

    Pymediainfo读取文件夹视频长度并写入excel文件(openpyxl) 导入使用的module 路径设置以及初始化 获取全部文件名称与文件大小 获取视频详细信息并存储 时间统计并得到总秒数及 ...

最新文章

  1. Scrapy爬虫-必备插件
  2. 项目部署、配置、查错常用到的Linux命令
  3. xpath的数据和节点类型以及XPath中节点匹配的基本方法
  4. silverlight 调用默认打印机
  5. 史上最权威的 Activiti 框架学习
  6. 添加游戏到游戏浏览器中的小工具
  7. Linux下使用SSH连接远端服务器技术总结
  8. vi 和vim的区别
  9. windows phone 扫描二维码
  10. lucene全文检索包括双层PDF
  11. Brocade 光纤交换机级联配置
  12. JS中动态创建元素的三种方法
  13. HTML caption文字颜色,HTML caption align 属性 - HTML 颜色参考手册 - 自强学堂
  14. oracle logged on,ORA-01012:not logged on的解决办法
  15. WPS怎么外链网页上的实时数据_数据收集、整理低效繁琐?WPS表单帮你轻松解决...
  16. 用selenium来下载小姐姐图片并保存
  17. [Zookeeper] 安装and各 配置参数详解
  18. Android11 热点配置信息保存分析
  19. 前端 获取 扫码枪等扫码设备输入内容:2种方式
  20. C++语法——详解运算符重载

热门文章

  1. 区块链三加一告诉你如何快速了解区块链入门技术?
  2. 干货丨3分钟了解今日头条推荐算法原理(附视频+PPT)
  3. 两种双绞线的线序568A与568B
  4. 和的区别?以及 0x0f 的含义
  5. java实现通讯录(手机版)
  6. 学习spark的网站
  7. win10计算机内存,win10系统电脑怎么升级内存?win10系统升级内存的方法
  8. 虹科新品 | 需要进行高功率,大规模的测试控制?这款5A功率高密度继电器模块你一定不能错过!
  9. 放大器的频率特性(2)-- 共源极的频率特性
  10. no version information available问题解决