前段时间看到plotnine库(封装的R语言ggplot2)作的图太美了,有点想重新拾起R语言^_^

R语言代码略带凌乱,讲真的还是更喜欢Python代码简洁。不过好几年不琢磨R语言,对R语言代码的凌乱美有些新奇,很好玩,这也许就是久别胜新欢吧。

而且R语言的文本分析生态也挺全的,Python与R结合起来,完美~

R语言读写操作

本章文件读写用到的包有

readtext

readr

readxl

writexl

其中readr、readxl均为tidyverse内的子包,做数据分析一般绕不开tidyverse

tidyverse含有的包

library(tidyverse)

tidyverse::tidyverse_packages()

##  [1] "broom"      "cli"        "crayon"     "dbplyr"     "dplyr"

##  [6] "forcats"    "ggplot2"    "haven"      "hms"        "httr"

## [11] "jsonlite"   "lubridate"  "magrittr"   "modelr"     "pillar"

## [16] "purrr"      "readr"      "readxl"     "reprex"     "rlang"

## [21] "rstudioapi" "rvest"      "stringr"    "tibble"     "tidyr"

## [26] "xml2"       "tidyverse"

预备知识: tibble包

tibble比R内置的数据框的易用,默认不会将字符串转化为因子型。选择tibble数据的子集,返回的结果仍是tibble类型

创建数据框: tibble()

强制转化数据框: as_tibble()

创建数据框

#tibble::tibble意识是导入tibble包的tibble函数

df

x = c(1,2,3,4),

name=c("张三", "李四", "王五", "赵六"),

age=c(25, 23, 30, 18)

)

df

colnames(df)

## [1] "x"    "name" "age"

rownames(df)

## [1] "1" "2" "3" "4"

读写实战

安装

install.packages(c("readtext","readr","readxl", "writexl"))

读取文件相关操作

读取

代码

功能

txt

readtext

readtext()

读取txt文件

csv

readr

read_csv()

读取csv文件

excel

readxl

read_excel()

读取xls、xlsx文件

读取csv

默认csv文件为utf-8编码

#读取csv

df

#为了展示的更好看一些

df

df

读取excel文件

df2

df2

读txt

document

document

#全部显示

#document['text']

#显示前200个字符

substr(document['text'], 1, 200)

## [1] "\n------------\n\n第1章 科学边界(1)\n\n    恋上你看书网 630bookla ,最快更新三体(全集)最新章节!\n\n    汪淼觉得,来找他的这四个人是一个奇怪的组合:两名警察和两名军人,如果那两个军人是武警还算正常,但这是两名陆军军官。\n\n    汪淼第一眼就对来找他的警察没有好感。其实那名穿警服的年轻人还行,举止很有礼貌,但那位便衣就让人讨厌了。这人长得五大三粗,一脸横肉,穿"

document[['doc_id']]

## [1] "三体.txt"

#全部显示

#document[['text']]

#显示前200个字符

substr(document[['text']], 1, 200)

## [1] "\n------------\n\n第1章 科学边界(1)\n\n    恋上你看书网 630bookla ,最快更新三体(全集)最新章节!\n\n    汪淼觉得,来找他的这四个人是一个奇怪的组合:两名警察和两名军人,如果那两个军人是武警还算正常,但这是两名陆军军官。\n\n    汪淼第一眼就对来找他的警察没有好感。其实那名穿警服的年轻人还行,举止很有礼貌,但那位便衣就让人讨厌了。这人长得五大三粗,一脸横肉,穿"

导入多个txt文件

list.files() 某路径下多个文件

#获取文件列表

files

head(files)

## [1] "data/txts/三孚股份2017.txt" "data/txts/三棵树2017.txt"

## [3] "data/txts/三江购物2017.txt" "data/txts/上海九百2017.txt"

## [5] "data/txts/上海机电2017.txt" "data/txts/上海物贸2017.txt"

texts

doc_ids

for (file in files) {

document

doc_ids

texts

#texts

}

df

doc_ids=doc_ids,

texts = texts

)

head(df)

写入文件相关操作

写入

代码

功能

csv

readr

write_csv()

将数据写入csv文件

excel

writexl

write_excel()

将数据写入excel

存入excel

使用writexl包的write_xlsx(x, path)

x:  tibble表数据

path: xlsx文件路径

#写入xlsx

writexl::write_xlsx(df, "output/reports.xlsx")

存入csv

使用readr包的write_csv(x, path)

x:  tibble表数据

path: csv件路径

#写入csv

readr::write_csv(df, "output/reports.csv")

python与r语言处理excel数据_R语言 | 读写txt、csv、excel文件相关推荐

  1. r语言读取excel数据_R语言 | 更快的表格文件读取方法!

    友情提示:蓝色下划线字体为引文,请保持警惕! 使用R语言读取 Affymetrix Human Exon 1.0 ST Array 芯片平台探针注释文件: https://www.affymetrix ...

  2. R语言学习丨数据存储文件格式知识,CSV,EXCEL,XML,JSON,MYSQL等

    今天笔记的主要学习内容是R语言里文件相关知识,包含CSV.Excel.XML.JSON.MySQL等. CSV文件 基本介绍 CSV(Comma-Separated Values,字符分隔值,分隔字符 ...

  3. r语言中mpg数据_R语言数据实战 | 统计检验

    原标题:R语言数据实战 | 统计检验 1.单个总体均值的t检验 1. 什么是检验? 检验(test)是统计学中最重要的概念之一,在科学研究和实际业务中都有着广泛的应用.用一句话来概括就是:人们希望通过 ...

  4. r语言读取excel数据_R语言操纵Excel进行数据透视与批处理

    作者:黄天元,复旦大学博士在读,热爱数据科学与开源工具(R),致力于利用数据科学迅速积累行业经验优势和科学知识发现,涉猎内容包括但不限于信息计量.机器学习.数据可视化.应用统计建模.知识图谱等,著有& ...

  5. r语言中mpg数据_R语言数据筛选整理包dplyr

    dplyr软件包是R中功能最强大,最受欢迎的软件包之一.该软件包由最受欢迎的R程序员Hadley Wickham编写,他编写了许多有用的R软件包,如ggplot2,tidyr等.本文包括一些示例和如何 ...

  6. r语言中mpg数据_R语言数据分析系列之五

    R语言数据分析系列之五 本节来讨论一下R语言的基本图形展示,先来看一张效果图吧. 这是一张用R语言生成的,虚拟的wordcloud云图,详细实现细节请參见我的github项目:https://gith ...

  7. r语言中mpg数据_R语言常用的数据处理的包(1)

    在R中有很多的内置函数,比如transform().rbind().cbind()等函数,这些函数我们可以直接使用,除此之外,还有常见的几种包在处理数据的时候非常好用. dplyr包 dplyr包是H ...

  8. r语言提取cvs数据_r语言,csv数据,提取特定行

    2624c 2018-08-30 21:03 刚学R不太会,用python写的把csv文件里你的要求写到一个新的csv文集里 import re input_file=open('yourfile.c ...

  9. php excel转数组,php将excel数据转换为3d数组(php convert excel data into 3d array)

    php将excel数据转换为3d数组(php convert excel data into 3d array) 我有一个excel文件,其数据是一个3d数组. 我正在使用PHPExcel Objec ...

最新文章

  1. Elasticsearch性能优化实战指南
  2. Android开发之 adb 启动问题或是部署应用不成功,出现“The connection to adb is down, and a severe error has occured.”错误...
  3. 名片去噪识别-aip
  4. delphi if多个条件_屡试不爽!使用策略模式代替多个if条件语句
  5. android log system
  6. python解决https私密连接警告信息
  7. mysql运维机制_《MySQL运维内参》节选 | InnoDB日志管理机制(一)
  8. 【数字图像处理】C++读取、旋转和保存bmp图像文件编程实现
  9. (干货)五种知网文献免费下载方式
  10. matlab中功率因数模块,最经典的功率因数控制器设计方案
  11. 【实用工具】【图像处理,超大图片识别,方案篇:化繁为简】
  12. 【7gyy】教大家设置一个类似手机的锁屏界面
  13. MacBook 常用快捷键
  14. JavaScript中用数组实现键值对
  15. linux修改键盘按键
  16. 阿里安全潘多拉实验室首先完美越狱苹果iOS 11.2
  17. python绘制七巧板_CSS3制作七巧板动画
  18. 分级阅读网站/阅读网站.阅读系统的设计与实现
  19. 企业信息化建设规划大纲
  20. yii2框架-理解yii2的架构(一)

热门文章

  1. 少年成长篇。。。作文素材
  2. void* to ULONG
  3. 【Hack The Box】linux练习-- Ophiuchi
  4. 什么是 IT 基础架构管理
  5. (原创)暴力破解西电校园网密码
  6. NuxtJS 项目部署如何部署到nginx
  7. Nlog日志记录组件使用
  8. 先验分布、后验分布、似然估计、贝叶斯估计、最大似然估计
  9. RGB565,RGB555, RGB888,RGB32转换
  10. C语言人物复杂移动与异步输入