• 有众多的格式和文本文件标准可用于存储数据。用于存储数据的通用格式为分隔符值(即CSV或制表符分割文件)、可扩展标记语言(XML)、JavaScript对象表示法(JSON)
  • 将数据存储在文本文件中的主要优点是:他们可被几乎所有的其他数据分析软件或人读取

R语言提供丰富的函数来读取不同格式的数据,包括:

    □        文本文件(TXT文件)

    □        逗号分隔文件(CSV文件)


TXT文件——read.table()

矩形(类似电子表格的)数据通常存储在带有分隔符的文件中,特别是逗号分隔值(CSV)和制表符分隔值文件。read.table将读取这些分隔符文件,并将结果存储在一个数据框中。其格式如下:
                read.table(file,header = FALSE,sep = “”,quote = “”’",
                                  dec = “.”,numerals = c(“allow.loss”,“warn.loss”,“no.loss”),
                                  row.name,col.name,as.is = !stringsAsFactors,
                                  na.strings = “NA”,colClasses = NA,nrow = -1,
                                  skip = 0,check.names = TRUE,fill = !blank.lines.skip,
                                  strip.white = FALSE,bla nk.lines.skip = TRUE,
                                  comment.char = “#”,
                                  allowEscapes = FALSE,flush = FALSE,
                                  stringsAsFactors = default.stringsAsFactors(),
                                  fileEncoding = “”,encoding = “unknown”,text,skipNul = FALSE)

read.table 函数的常用参数描述

参数 描述
file 文件名(包含在“”内,或使用一个字符型变量),可能需要全路径(即使是在Windows下,符号 \ 也不允许包含在内,必须用 / 或者 \ \ 替换)或者一个URL(Uniform Resource Location,统一资源定位符)链接(用URL对文件远程访问)
header 一个逻辑值,用来反映这个文件的第1行是否包含变量名,为TRUE时表示文件的第1行为变量名
sep 文件中的字段分隔符,例如,对用制表符分隔的文件使用sep=“\t”
quote 指定用于包围字符型数据的字符
dec 用来标识小数点的字符
fill 如果为TRUE且所有行中的变量数目并不相同,则用空白填补
row.names 保存着行名的向量,或文件中一个变量的序号或名字,默认时行号取为1、2、3···
col.names 指定列名的字符型向量,默认值为V1、V2、V3···
encoding 若文件中包含非ASCII字符字段,则使用此参数进行设置,可确保以正确的编码方式读取,避免出现乱码

更多高级选项包括:覆盖默认的行名、列名和类,指定输入文件的字符编码,以及输入的字符串格式的列如何声明



CSV文件——read.csv()

read.csv函数可读入一个逗号分隔文件并将其保存为一个数据框,其格式如下:
read.csv(file,header = TRUE,sep = “,”,quote = “” “,dec=” . ",fill = TRUE,comment.char = " ",ecoding = "unknown ",…)

参数 描述
file 文件名(包含在“”内,或使用一个字符型变量),可能需要全路径(即使是在Windows下,符号 \ 也不允许包含在内,必须用 / 或者 \ \ 替换)或者一个URL链接(用URL对文件远程访问)
header 一个逻辑值,用来反映这个文件的第1行是否包含变量名,为TRUE时表示文件的第1行为变量名
sep 文件中的字段分隔符,CSV文件默认为sep=","
quote 指定用于包围字符型数据的字符
dec 用来标识小数点的字符
fill 如果为TRUE且所有行中的变量数目并不相同,则用空白填补
comment.char 包含单个字符或空字符串的长度为1的字符向量,以这个字符开头的行将被忽略(要禁用这个参数,可使用comment.char=""
encoding 若文件中包含非ASCII字符字段,则使用此参数进行设置,可确保以正确的编码方式读取,避免出现乱码


与此相反的任务是写入文件,write.table和write.csv分别对应着read.table和read.csv的读操作

R语言 读写带分隔符的文件相关推荐

  1. r语言x%3c-读取文件,R语言读写最灵活的文件——txt文件

    星爷 R语言可以读取很多文件,其中以txt文本文件最为灵活,为什么呢,txt文件可以以任意符号作为分隔符,比如",","\t",空格,甚至`"--&a ...

  2. R语言读写最灵活的文件——txt文件

    R语言可以读取很多文件,其中以txt文本文件最为灵活,为什么呢,txt文件可以以任意符号作为分隔符,比如",","\t",空格,甚至"--&¥ ...

  3. 【数据分析入门】R语言读写文本文件及RDATA文件

    一.读入文件 x<- read.table("input.txt") head (x) x<- read.table("input.csv") x& ...

  4. R语言 | 读写txt、csv、excel文件

    [更新~] Python网络爬虫与文本数据分析 前段时间看到plotnine库(封装的R语言ggplot2)作的图太美了,有点想重新拾起R语言^_^ R语言代码略带凌乱,讲真的还是更喜欢Python代 ...

  5. R语言绘制带聚类树的堆叠柱形图

    R语言绘制带聚类树的堆叠柱形图 聚类树与柱形图结合,即可反映样本或分组间的相似性,又能展示样本内的元素组成信息. 例如下图是一个在扩增子测序微生物群落分析中常见的统计图类型,在测序公司给的报告中通常都 ...

  6. R语言读写中文编码方式

    R语言读写数据的方法很多,这里主要是我在使用read.csv/read.table和write.csv/write.table时遇到的一些中文格式编码的问题.常见的中文编码方式两种:GBK(GB231 ...

  7. R语言list.files函数获取文件列表实战

    R语言list.files函数获取文件列表实战 目录 R语言list.files函数获取文件列表实战 #仿真数据 #基本语法

  8. R语言读写二进制文件:WriteBin()、readBin()

    R语言读写二进制文件:WriteBin().readBin() 目录 R语言读写二进制文件:WriteBin().readBin() WriteBin()和readBin()语法

  9. R语言转换并保存json文件--使用jsonlite包

    R语言转换并保存json文件--使用jsonlite包 钱亦欣 发表于 2017-07-03 00:10   2477 阅读 http://www.ituring.com.cn/article/468 ...

最新文章

  1. .NET福利集锦【持续整理中】
  2. 下一代防火墙市场高速增长,年复合增长率为13.6%
  3. docker (centOS 7) 使用笔记4 - etcd服务
  4. log4j的NDC/MDC区别与应用
  5. 万年历单片机c语言,单片机+lcd12864液晶万年历C程序
  6. rest_framework之解析器详解 05
  7. [LeetCode] Remove Duplicates from Sorted List - 链表问题
  8. solaris 命令
  9. C# 对轻量级(IoC Container)依赖注入Unity的使用
  10. python json文件传输图片
  11. Windows7 64位系统搭建Cocos2d-x 2.2.1最新版以及Android交叉编译环境(具体教程)
  12. MAG3110(可替代hmc5883l的磁力计) stm32f1xx调试心得附源代码(以后可能会陆续更新四轴相关的传感器,欢迎关注)
  13. java对excel插入水印_Java通过POI和JXL给Excel动态添加水印
  14. 两张人脸图像比对ocr技术
  15. 第四周 放大电路的分析
  16. Android 尺寸转换器(适配各种屏幕)
  17. EOJ Monthly 2020.11 Sponsored by TuSimple F题“天桥”题解
  18. python 3d绘图平面_Python的地形三维可视化Matplotlib和gdal使用示例
  19. DNS域名解析流程图(详细)
  20. Mysql快速入门 在python、java使用

热门文章

  1. android studio上的基本动画实现(第一篇)
  2. GL benchmark测试解析
  3. Android如何自定义一个心电图控件?
  4. CleanMyMac X4.10.6mac上非常强大的系统清理工具
  5. maven 项目 springMVC实现文件图片的上传下载功能详解(源码已提供,小白必看)
  6. rpm和yun的使用方法
  7. 成为测试/开发程序员,小张:现实就来了个下马威......
  8. 北京联通KD-YUN-811E改桥接
  9. maya(学习笔记)之骨骼中关节的轴向确定方法
  10. 嵌入式linux pam,Linux PAM 之cracklib模块