文章目录

  • 写在前面
  • txt文本型数据的导入
  • xlsx表格型数据的导入
  • CSV逗号分隔符型数据的导入

写在前面

最近学习R语言,常常会遇到带有中文标签的数据,这时候进行处理的话,会出现数据显示不全,甚至直接报错(例如:“Error in make.names(col.names, unique = TRUE) : 多字节字符串6有错”)等问题,这些问题主要是由数据文件本身的编码导致的。为了以后的学习方便,现在总结下R语言中含有中文的数据导入方法。

环境:

Windows10

R-x64-4.0.2

R Studio 1.3.959

txt文本型数据的导入

纯文本数据,一般是从Excel之中复制出来的,导入到R中为数据框格式,这种格式用起来还是很方便的,数据之间使用制表符(“\t”)分隔。对于文本格式,R for Win中的默认编码为ASCII格式,而一般默认编码为UTF-8格式,所以在导入时候需要加上编码,代码如下

data <- read.table("aa.txt", encoding="UTF-8")

然而,如果你不想每次导入数据都如此繁琐,那可以将数据文件用记事本打开,另存为ANSI编码格式,然后就可以完美打开了。

xlsx表格型数据的导入

对于含多个工作表的工作簿(xls文件),可以使用下面的函数,一般含有行标签和列标签的话还要加上参数rowNames=T,否则默认显示为正整数标签。参数sheet='d1.1'是待导入的工作表表名,如果知道其排序的话也可以使用工作表的序号进行索引。

P.S.这个导入方法不需要设置编码即可使中文正常显示。

openxlsx::read.xlsx("a.xlsx", sheet="d1.1", rowNames=T)

CSV逗号分隔符型数据的导入

CSV文件,本质还是文本文件,只不过数据之间不是以制表符而是以英文的逗号进行分隔。这种数据导入时候使用read.csv()函数,默认也是ANSI编码,所以导入时候含有中文的话需要设置下参数,下面是导入的命令

data <- read.csv("a.csv", encoding = "UTF-8", row.names = 1)

上面的row.names参数不是必要的,但是对于CSV文件的话,不加这个参数行索引也会默认以数字显示,这个参数的意义是以第一列为行索引,设置后在画图时每个样本数据就能正确以行索引显示了。

R语言含中文数据导入的方法相关推荐

  1. R语言入门第二集 实验一:R 语言数据结构、数据导入与数据处理

    R语言入门第二集 实验一:R 语言数据结构.数据导入与数据处理 一.资源 R语言基本数据结构练习和数据的导入和处理对象常用函数练习--东北大学大数据班R语言实训第一次作业" R(4)求解数据 ...

  2. 现提供“威力导演10极致版(多国语言含中文)+ 有效激活方法如下——

    大名鼎鼎的专业级影片剪辑制作软件"威力导演",是著名影音软件公司"讯连科技"的主打产品之一.其主要功能和特点是:1.创新10轨覆迭剪辑及炫粒特效设计,只需简单操 ...

  3. R语言XML格式数据导入与处理

    数据解析 XML是一种可扩展标记语言,它被设计用来传输和存储数据.XML是各种应用程序之间进行数据传输的最常用的工具.它与Access,Oracle和SQL Server等数据库不同,数据库提供了更强 ...

  4. R语言进行dataframe数据内连接(Inner join):使用R原生方法、data.table、dplyr等方案

    R语言进行dataframe数据内连接(Inner join):使用R原生方法.data.table.dplyr等方案 目录 R语言进行dataframe数据内连接(Inner join):使用R原生 ...

  5. R语言进行dataframe数据左连接(Left join):使用R原生方法、data.table、dplyr等方案

    R语言进行dataframe数据左连接(Left join):使用R原生方法.data.table.dplyr等方案 目录 R语言进行dataframe数据左连接(Left join):使用R原生方法 ...

  6. r语言 读服务器数据,R语言数据实战 | 安装R语言

    原标题:R语言数据实战 | 安装R语言 1.R的获取和安装 获取和安装R很容易(这也是它"亲民"的地方),具体步骤如下: Step 1: 登陆R语言官方网站https://www. ...

  7. R语言实现金融数据的时间序列分析及建模

    R语言实现金融数据的时间序列分析及建模 一 移动平均    移动平均能消除数据中的季节变动和不规则变动.若序列中存在周期变动,则通常以周期为移动平均项数.移动平均法可以通过数据显示出数据长期趋势的变动 ...

  8. R语言处理缺失数据的5个常用包

    R语言处理缺失数据的5个常用包 1.常用缺失数据处理包 2. MICE 包 2.1基本介绍 2.2 实例展示 3.Amelia包 3.1基本介绍 3.2实例展示 4.missForest包 4.1基本 ...

  9. 【R语言 | 如何计算测序数据微生物种类的生态位宽度?如何解释结果】

    R语言 | 如何计算测序数据微生物种类的生态位宽度?如何解释结果 参考见https://mp.weixin.qq.com/s/MAk7cEQNwUKCKRZ-6xFhbQ(通往学术之路公众号) 参考见 ...

最新文章

  1. java 解析证书_java 读取证书类以及key tool gui 1.7
  2. 目录服务技术介绍——ADSI(三)
  3. 设置UserAgent让电脑浏览器访问微信手机网站
  4. 为什么L1稀疏,L2平滑?
  5. android 上下扫描动画,Android扫描雷达动画
  6. 如何快速把借呗额度提高到10万?
  7. Magicodes.Sms短信库的封装和集成
  8. 依赖注入的威力,.NET Core的魅力:解决MVC视图中的中文被html编码的问题
  9. linux下修改max_user_processes和open_file的最大值
  10. xshell下载及连接Linux
  11. Python解决滑块验证,Scarpy框架采集数据到redis数据库!
  12. centos php ssl,CentOS下在Nginx中添加SSL证书以支持HTTPS协议访问
  13. 个人收集的一些库、工具、技术介绍
  14. 绘图技术采用计算机什么软件,计算机绘图好用的软件
  15. 【亲测】2022最新H5手机微商城运营源码/简约轻量版/对接支付个人免签接口/带搭建教程
  16. 淘宝客公众号京东淘宝拼多多三合一源码三级代理系统网站源码
  17. OpenG数组讲解之Remove Duplicates from 1D Array.vi
  18. e900v21e 装第三方_创维e900v21e刷机包
  19. 伪标签+html,伪标签(Pseudo-Labelling)介绍:一种半监督机器学习技术
  20. 折腾家里的龟速网络有感

热门文章

  1. Luogu1640 连续攻击游戏
  2. python opencv3 特征提取与描述 DoG SIFT hessian surf
  3. Oracle 游标使用全解(转)
  4. PAT乙级(1017 A除以B)
  5. entity framework mysql guid,c# – 自动生成不是Entity Framework中主键的GUID列
  6. 批处理等待上一条完成再执行下面的_分布式批处理实现方案
  7. python 菜鸟教程字符串反转函数_转自python的菜鸟教程---字符串相关操作
  8. LMSn没有运行在RT (real time) 模式Oracle 19c RAC?
  9. 阿里云数据库产品专家胡航丽:数据库自动驾驶平台DAS重磅助力数据库领域智能未来...
  10. 解读年度数据库性能:PostgreSQL的日志文件和数据加载