python与r语言处理excel数据_R语言 | 读写txt、csv、excel文件
前段时间看到plotnine库(封装的R语言ggplot2)作的图太美了,有点想重新拾起R语言^_^
R语言代码略带凌乱,讲真的还是更喜欢Python代码简洁。不过好几年不琢磨R语言,对R语言代码的凌乱美有些新奇,很好玩,这也许就是久别胜新欢吧。
而且R语言的文本分析生态也挺全的,Python与R结合起来,完美~
R语言读写操作
本章文件读写用到的包有
readtext
readr
readxl
writexl
其中readr、readxl均为tidyverse内的子包,做数据分析一般绕不开tidyverse
tidyverse含有的包
library(tidyverse)
tidyverse::tidyverse_packages()
## [1] "broom" "cli" "crayon" "dbplyr" "dplyr"
## [6] "forcats" "ggplot2" "haven" "hms" "httr"
## [11] "jsonlite" "lubridate" "magrittr" "modelr" "pillar"
## [16] "purrr" "readr" "readxl" "reprex" "rlang"
## [21] "rstudioapi" "rvest" "stringr" "tibble" "tidyr"
## [26] "xml2" "tidyverse"
预备知识: tibble包
tibble比R内置的数据框的易用,默认不会将字符串转化为因子型。选择tibble数据的子集,返回的结果仍是tibble类型
创建数据框: tibble()
强制转化数据框: as_tibble()
创建数据框
#tibble::tibble意识是导入tibble包的tibble函数
df
x = c(1,2,3,4),
name=c("张三", "李四", "王五", "赵六"),
age=c(25, 23, 30, 18)
)
df
colnames(df)
## [1] "x" "name" "age"
rownames(df)
## [1] "1" "2" "3" "4"
读写实战
安装
install.packages(c("readtext","readr","readxl", "writexl"))
读取文件相关操作
读取
包
代码
功能
txt
readtext
readtext()
读取txt文件
csv
readr
read_csv()
读取csv文件
excel
readxl
read_excel()
读取xls、xlsx文件
读取csv
默认csv文件为utf-8编码
#读取csv
df
#为了展示的更好看一些
df
df
读取excel文件
df2
df2
读txt
document
document
#全部显示
#document['text']
#显示前200个字符
substr(document['text'], 1, 200)
## [1] "\n------------\n\n第1章 科学边界(1)\n\n 恋上你看书网 630bookla ,最快更新三体(全集)最新章节!\n\n 汪淼觉得,来找他的这四个人是一个奇怪的组合:两名警察和两名军人,如果那两个军人是武警还算正常,但这是两名陆军军官。\n\n 汪淼第一眼就对来找他的警察没有好感。其实那名穿警服的年轻人还行,举止很有礼貌,但那位便衣就让人讨厌了。这人长得五大三粗,一脸横肉,穿"
document[['doc_id']]
## [1] "三体.txt"
#全部显示
#document[['text']]
#显示前200个字符
substr(document[['text']], 1, 200)
## [1] "\n------------\n\n第1章 科学边界(1)\n\n 恋上你看书网 630bookla ,最快更新三体(全集)最新章节!\n\n 汪淼觉得,来找他的这四个人是一个奇怪的组合:两名警察和两名军人,如果那两个军人是武警还算正常,但这是两名陆军军官。\n\n 汪淼第一眼就对来找他的警察没有好感。其实那名穿警服的年轻人还行,举止很有礼貌,但那位便衣就让人讨厌了。这人长得五大三粗,一脸横肉,穿"
导入多个txt文件
list.files() 某路径下多个文件
#获取文件列表
files
head(files)
## [1] "data/txts/三孚股份2017.txt" "data/txts/三棵树2017.txt"
## [3] "data/txts/三江购物2017.txt" "data/txts/上海九百2017.txt"
## [5] "data/txts/上海机电2017.txt" "data/txts/上海物贸2017.txt"
texts
doc_ids
for (file in files) {
document
doc_ids
texts
#texts
}
df
doc_ids=doc_ids,
texts = texts
)
head(df)
写入文件相关操作
写入
包
代码
功能
csv
readr
write_csv()
将数据写入csv文件
excel
writexl
write_excel()
将数据写入excel
存入excel
使用writexl包的write_xlsx(x, path)
x: tibble表数据
path: xlsx文件路径
#写入xlsx
writexl::write_xlsx(df, "output/reports.xlsx")
存入csv
使用readr包的write_csv(x, path)
x: tibble表数据
path: csv件路径
#写入csv
readr::write_csv(df, "output/reports.csv")
python与r语言处理excel数据_R语言 | 读写txt、csv、excel文件相关推荐
- r语言读取excel数据_R语言 | 更快的表格文件读取方法!
友情提示:蓝色下划线字体为引文,请保持警惕! 使用R语言读取 Affymetrix Human Exon 1.0 ST Array 芯片平台探针注释文件: https://www.affymetrix ...
- R语言学习丨数据存储文件格式知识,CSV,EXCEL,XML,JSON,MYSQL等
今天笔记的主要学习内容是R语言里文件相关知识,包含CSV.Excel.XML.JSON.MySQL等. CSV文件 基本介绍 CSV(Comma-Separated Values,字符分隔值,分隔字符 ...
- r语言中mpg数据_R语言数据实战 | 统计检验
原标题:R语言数据实战 | 统计检验 1.单个总体均值的t检验 1. 什么是检验? 检验(test)是统计学中最重要的概念之一,在科学研究和实际业务中都有着广泛的应用.用一句话来概括就是:人们希望通过 ...
- r语言读取excel数据_R语言操纵Excel进行数据透视与批处理
作者:黄天元,复旦大学博士在读,热爱数据科学与开源工具(R),致力于利用数据科学迅速积累行业经验优势和科学知识发现,涉猎内容包括但不限于信息计量.机器学习.数据可视化.应用统计建模.知识图谱等,著有& ...
- r语言中mpg数据_R语言数据筛选整理包dplyr
dplyr软件包是R中功能最强大,最受欢迎的软件包之一.该软件包由最受欢迎的R程序员Hadley Wickham编写,他编写了许多有用的R软件包,如ggplot2,tidyr等.本文包括一些示例和如何 ...
- r语言中mpg数据_R语言数据分析系列之五
R语言数据分析系列之五 本节来讨论一下R语言的基本图形展示,先来看一张效果图吧. 这是一张用R语言生成的,虚拟的wordcloud云图,详细实现细节请參见我的github项目:https://gith ...
- r语言中mpg数据_R语言常用的数据处理的包(1)
在R中有很多的内置函数,比如transform().rbind().cbind()等函数,这些函数我们可以直接使用,除此之外,还有常见的几种包在处理数据的时候非常好用. dplyr包 dplyr包是H ...
- r语言提取cvs数据_r语言,csv数据,提取特定行
2624c 2018-08-30 21:03 刚学R不太会,用python写的把csv文件里你的要求写到一个新的csv文集里 import re input_file=open('yourfile.c ...
- php excel转数组,php将excel数据转换为3d数组(php convert excel data into 3d array)
php将excel数据转换为3d数组(php convert excel data into 3d array) 我有一个excel文件,其数据是一个3d数组. 我正在使用PHPExcel Objec ...
最新文章
- Elasticsearch性能优化实战指南
- Android开发之 adb 启动问题或是部署应用不成功,出现“The connection to adb is down, and a severe error has occured.”错误...
- 名片去噪识别-aip
- delphi if多个条件_屡试不爽!使用策略模式代替多个if条件语句
- android log system
- python解决https私密连接警告信息
- mysql运维机制_《MySQL运维内参》节选 | InnoDB日志管理机制(一)
- 【数字图像处理】C++读取、旋转和保存bmp图像文件编程实现
- (干货)五种知网文献免费下载方式
- matlab中功率因数模块,最经典的功率因数控制器设计方案
- 【实用工具】【图像处理,超大图片识别,方案篇:化繁为简】
- 【7gyy】教大家设置一个类似手机的锁屏界面
- MacBook 常用快捷键
- JavaScript中用数组实现键值对
- linux修改键盘按键
- 阿里安全潘多拉实验室首先完美越狱苹果iOS 11.2
- python绘制七巧板_CSS3制作七巧板动画
- 分级阅读网站/阅读网站.阅读系统的设计与实现
- 企业信息化建设规划大纲
- yii2框架-理解yii2的架构(一)