R语言含中文数据导入的方法
文章目录
- 写在前面
- txt文本型数据的导入
- xlsx表格型数据的导入
- CSV逗号分隔符型数据的导入
写在前面
最近学习R语言,常常会遇到带有中文标签的数据,这时候进行处理的话,会出现数据显示不全,甚至直接报错(例如:“Error in make.names(col.names, unique = TRUE) : 多字节字符串6有错”)等问题,这些问题主要是由数据文件本身的编码导致的。为了以后的学习方便,现在总结下R语言中含有中文的数据导入方法。
环境:
Windows10
R-x64-4.0.2
R Studio 1.3.959
txt文本型数据的导入
纯文本数据,一般是从Excel之中复制出来的,导入到R中为数据框格式,这种格式用起来还是很方便的,数据之间使用制表符(“\t”)分隔。对于文本格式,R for Win中的默认编码为ASCII格式,而一般默认编码为UTF-8格式,所以在导入时候需要加上编码,代码如下
data <- read.table("aa.txt", encoding="UTF-8")
然而,如果你不想每次导入数据都如此繁琐,那可以将数据文件用记事本打开,另存为ANSI编码格式,然后就可以完美打开了。
xlsx表格型数据的导入
对于含多个工作表的工作簿(xls文件),可以使用下面的函数,一般含有行标签和列标签的话还要加上参数rowNames=T
,否则默认显示为正整数标签。参数sheet='d1.1'
是待导入的工作表表名,如果知道其排序的话也可以使用工作表的序号进行索引。
P.S.这个导入方法不需要设置编码即可使中文正常显示。
openxlsx::read.xlsx("a.xlsx", sheet="d1.1", rowNames=T)
CSV逗号分隔符型数据的导入
CSV文件,本质还是文本文件,只不过数据之间不是以制表符而是以英文的逗号进行分隔。这种数据导入时候使用read.csv()
函数,默认也是ANSI编码,所以导入时候含有中文的话需要设置下参数,下面是导入的命令
data <- read.csv("a.csv", encoding = "UTF-8", row.names = 1)
上面的row.names
参数不是必要的,但是对于CSV文件的话,不加这个参数行索引也会默认以数字显示,这个参数的意义是以第一列为行索引,设置后在画图时每个样本数据就能正确以行索引显示了。
R语言含中文数据导入的方法相关推荐
- R语言入门第二集 实验一:R 语言数据结构、数据导入与数据处理
R语言入门第二集 实验一:R 语言数据结构.数据导入与数据处理 一.资源 R语言基本数据结构练习和数据的导入和处理对象常用函数练习--东北大学大数据班R语言实训第一次作业" R(4)求解数据 ...
- 现提供“威力导演10极致版(多国语言含中文)+ 有效激活方法如下——
大名鼎鼎的专业级影片剪辑制作软件"威力导演",是著名影音软件公司"讯连科技"的主打产品之一.其主要功能和特点是:1.创新10轨覆迭剪辑及炫粒特效设计,只需简单操 ...
- R语言XML格式数据导入与处理
数据解析 XML是一种可扩展标记语言,它被设计用来传输和存储数据.XML是各种应用程序之间进行数据传输的最常用的工具.它与Access,Oracle和SQL Server等数据库不同,数据库提供了更强 ...
- R语言进行dataframe数据内连接(Inner join):使用R原生方法、data.table、dplyr等方案
R语言进行dataframe数据内连接(Inner join):使用R原生方法.data.table.dplyr等方案 目录 R语言进行dataframe数据内连接(Inner join):使用R原生 ...
- R语言进行dataframe数据左连接(Left join):使用R原生方法、data.table、dplyr等方案
R语言进行dataframe数据左连接(Left join):使用R原生方法.data.table.dplyr等方案 目录 R语言进行dataframe数据左连接(Left join):使用R原生方法 ...
- r语言 读服务器数据,R语言数据实战 | 安装R语言
原标题:R语言数据实战 | 安装R语言 1.R的获取和安装 获取和安装R很容易(这也是它"亲民"的地方),具体步骤如下: Step 1: 登陆R语言官方网站https://www. ...
- R语言实现金融数据的时间序列分析及建模
R语言实现金融数据的时间序列分析及建模 一 移动平均 移动平均能消除数据中的季节变动和不规则变动.若序列中存在周期变动,则通常以周期为移动平均项数.移动平均法可以通过数据显示出数据长期趋势的变动 ...
- R语言处理缺失数据的5个常用包
R语言处理缺失数据的5个常用包 1.常用缺失数据处理包 2. MICE 包 2.1基本介绍 2.2 实例展示 3.Amelia包 3.1基本介绍 3.2实例展示 4.missForest包 4.1基本 ...
- 【R语言 | 如何计算测序数据微生物种类的生态位宽度?如何解释结果】
R语言 | 如何计算测序数据微生物种类的生态位宽度?如何解释结果 参考见https://mp.weixin.qq.com/s/MAk7cEQNwUKCKRZ-6xFhbQ(通往学术之路公众号) 参考见 ...
最新文章
- java 解析证书_java 读取证书类以及key tool gui 1.7
- 目录服务技术介绍——ADSI(三)
- 设置UserAgent让电脑浏览器访问微信手机网站
- 为什么L1稀疏,L2平滑?
- android 上下扫描动画,Android扫描雷达动画
- 如何快速把借呗额度提高到10万?
- Magicodes.Sms短信库的封装和集成
- 依赖注入的威力,.NET Core的魅力:解决MVC视图中的中文被html编码的问题
- linux下修改max_user_processes和open_file的最大值
- xshell下载及连接Linux
- Python解决滑块验证,Scarpy框架采集数据到redis数据库!
- centos php ssl,CentOS下在Nginx中添加SSL证书以支持HTTPS协议访问
- 个人收集的一些库、工具、技术介绍
- 绘图技术采用计算机什么软件,计算机绘图好用的软件
- 【亲测】2022最新H5手机微商城运营源码/简约轻量版/对接支付个人免签接口/带搭建教程
- 淘宝客公众号京东淘宝拼多多三合一源码三级代理系统网站源码
- OpenG数组讲解之Remove Duplicates from 1D Array.vi
- e900v21e 装第三方_创维e900v21e刷机包
- 伪标签+html,伪标签(Pseudo-Labelling)介绍:一种半监督机器学习技术
- 折腾家里的龟速网络有感
热门文章
- Luogu1640 连续攻击游戏
- python opencv3 特征提取与描述 DoG SIFT hessian surf
- Oracle 游标使用全解(转)
- PAT乙级(1017 A除以B)
- entity framework mysql guid,c# – 自动生成不是Entity Framework中主键的GUID列
- 批处理等待上一条完成再执行下面的_分布式批处理实现方案
- python 菜鸟教程字符串反转函数_转自python的菜鸟教程---字符串相关操作
- LMSn没有运行在RT (real time) 模式Oracle 19c RAC?
- 阿里云数据库产品专家胡航丽:数据库自动驾驶平台DAS重磅助力数据库领域智能未来...
- 解读年度数据库性能:PostgreSQL的日志文件和数据加载