R入门

R语言介绍

相较于其他的所有软件,R 的优势之一在于,它是专为数据分析而设计的,它是主要用于统计分析、绘图的语言和操作环境。R 是属于GNU 系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。R 语言有一系列的数据可视化包,包括ggplot21及ggplot2拓展包2、lattice、leaflet、playwith、ggvis、ggmaps。

R语言安装

R可以在CRAN(Comprehensive R Archive Network,http://cran.r-project.org)上免费下载。Linux、Mac OS X和Windows都有相应编译好的二进制版本。根据你所选择平台的安装说明进行安装即可。
R、Rtools和RStudio的安装,可以参考博文中有详细介绍。

语言编程基础

这里就简单记录一下学习笔记,适合于有其他编程基础,又快速了解R语言的读者。这里将R语言与C/C++、Python或者Matlab不同之处进行一个简单总结,其中也会包含一些相同点。

R 是一种区分字母大小写的解释性语言;
R 语句的分隔符是分号(;)或换行符。当语句结束时,可以不使用分号,R 语言会自动识别语句结束的位置。
R 语言只支持单行注释,注释由#开头,当前行出现在#之后的任何文本都会被R 解释器忽略。
R 语句由函数和赋值构成。R 使用 <-,而不是传统的 = 作为赋值符号。
R 语言的数学运算与我们平时的数学运算(加+,减-,乘*,除/)基本一致。

注意:R允许使用=为对象赋值,但是这样写的R程序并不多,因为它不是标准语法。一些情况下,用等号赋值会出现问题,R程序员可能会因此取笑你。你还可以反转赋值方向。例如,rnorm(5) -> x与上面的语句等价。使用等号赋值的做法在R中并不常见。

数据的导入与导出

数据文件的导入与导出

我们常用外部保存的数据文件来绘制图表。此时,就需要借助可以导入数据的函数导入不同格式的数据,包括CSV、TXT,以及Excel、SQL、HTML 等数据文件。有时候,我们也需要将处理好的数据从R 语言中导出保存。其中,在数据可视化中使用最多的就是前3 种格式的数据文件。
(1)CSV 格式数据的导入与导出
使用read.csv()函数,可以导入CSV 格式的数据,并存储为数据框形式。需要注意是:当
stringsAsFactors=TRUE 时,R 会自动将读入的字符型变量转换成因子,但是这样很容易导致数据只按默认字母顺序展示。在导入大批量数据时,为了提高性能,尽可能分两步走:
① 显式指定“stringsAsFactors = FALSE”;
② 依次将所需要的数据列(向量)转换为因子。

mydata<-read.csv("Data.csv",sep=",",na.strings="NA",stringsAsFactors=FALSE)

使用write.csv()函数,可以将data.frame 的数据存储为CSV 文件:

write.csv(mydata,file = "File.csv")

CSV 文件主要有以下3 个特点。
① 文件结构简单,基本上和TXT 文本的差别不大;
② 可以和Excel 进行转换,这是一个很大的优点,很容易进行查看模式转换,但是其文件的存
储大小比Excel 小。
③ 由于其简单的存储方式,一方面可以降低存储信息的容量,这样有利于网络传输及客户端的
再处理;另一方面,由于是一堆没有任何说明的数据,其具备基本的安全性。所以相比TXT 和Excel
数据文件,我们更加推荐使用CSV 格式的数据文件进行导入与导出操作。

(2)TXT 格式数据的导入与导出
使用read.table()函数不仅可以导入CSV 格式的文件数据,还可以导入TXT 格式的文件数据,并
存储为数据框数据。

mydata<-read.table("Data.txt",header = TRUE)

使用write.table()函数可以将data.frame 的数据存储为TXT 文件:
write.table(mydata, file = “File.txt”)
(3)Excel 格式数据的导入与导出
使用xlsx 包的read.xlsx()函数和read.xlsx2()函数可以导入XLSX 格式的数据文件。但是更推荐
使用CSV 格式导入数据文件。

mydata<- read.xlsx("Data.xlsx", sheetIndex=1)

也可以使用write.xlsx()函将数据文件导出为XLSX 格式:

write.xlsx(mydata, "Data.xlsx", sheetName="Sheet Name")

R是逐行执行的,这一点和Matlab很相似,可以通过运行脚本的方式一次性运行:source("wf_hpc.R")

R包

包是R函数、数据、预编译代码以一种定义完善的格式组成的集合。计算机上存储包的目录称为库(library)。函数.libPaths()能够显示库所在的位置, 函数library()则可以显示库中有哪些包。

R包的安装

如果拥有RStudio,那么最简单的方法是单击右下角写有“Packages”的选项卡,然后在弹出的
对话框中输入包的名称。或者直接在左下角的“ Console ” 控制台输入安装命令安装。例如安装包“devtools”:

install.packages("devtools")

批量安装多个包,例如:

install.packages(c("ggplot2","ElemStatLearn","mlmRev"))

有时候需要直接从Github 或BitBucket 上下载安装包,这种方法可以得到包的开发版本,但是需要使用devtools 包来完成:devtools::install_github("tidyverse/ggplot2"),tidyverse为github用户名。

从下载的R包安装:

install.packages("E:/vegan.rar")  #需要绝对路径,R将反斜杠(\)作为一个转义符。即使在Windows平台上运行R,在路径中也要使用正斜杠。

这种方式不太可取,有时候包依赖其他包,这种方式很容易安装失败。

包的加载

包安装好之后,需要加载才能使用。现在主要有两种函数可供选择:library()或者require(),比
如:library(ggplot2)
有时已经加载的包可能需要卸载。这个可以在RStudio 中的“Packages”界面取消勾选相应的复
选框,或使用detach()函数:detach("package: ggplot2")

查看R包

查看默认加载的R包

getOption("defaultPackages")

查看已加载的R包

(.packages())

查看所有已安装的R包

(.packages(all.available = T))

installed.packages()

R语言—简介、安装、包(package)的安装与加载相关推荐

  1. R语言导入数据文件(数据导入、加载、读取)、使用readr包中的read_csv函数导入逗号分割文件CSV(Comma Delimited Text File)

    R语言导入数据文件(数据导入.加载.读取).使用readr包中的read_csv函数导入逗号分割文件CSV(Comma Delimited Text File) 目录

  2. R语言导入数据文件(数据导入、加载、读取)、使用haven包的read_dta函数导入Stata中的dta格式文件

    R语言导入数据文件(数据导入.加载.读取).使用haven包的read_dta函数导入Stata中的dta格式文件 目录

  3. R语言导入数据文件(数据导入、加载、读取)、haven包的read_spss函数导入SPSS中的sav格式文件

    R语言导入数据文件(数据导入.加载.读取).haven包的read_spss函数导入SPSS中的sav格式文件 目录

  4. R语言导入数据文件(数据导入、加载、读取)、使用haven包的read_sav函数导入SPSS中的sav格式文件

    R语言导入数据文件(数据导入.加载.读取).使用haven包的read_sav函数导入SPSS中的sav格式文件 目录

  5. R语言导入数据文件(数据导入、加载、读取)、使用read.table函数导入逗号分割文件CSV(Comma Delimited Text File)

    R语言导入数据文件(数据导入.加载.读取).使用read.table函数导入逗号分割文件CSV(Comma Delimited Text File) 目录

  6. R语言导入数据文件(数据导入、加载、读取)、导入csv、excel、sav、por、dat、sas7bdat格式文件

    R语言导入数据文件(数据导入.加载.读取).导入csv.excel.sav.por.dat.sas7bdat格式文件 目录

  7. R语言的plyr包简介

    (转载地址)http://www.jianshu.com/p/bfddfe29aa39 R语言的plyr包简介 字数3040 阅读2875 评论3 喜欢7 R语言中的类SQL操作 plyr包可以进行类 ...

  8. R语言使用Rtsne包进行TSNE分析:通过数据类型筛选数值数据、scale函数进行数据标准化缩放、提取TSNE分析结果合并到原dataframe中(tSNE with Rtsne package)

    R语言使用Rtsne包进行TSNE分析:通过数据类型筛选数值数据.scale函数进行数据标准化缩放.提取TSNE分析结果合并到原dataframe中(tSNE with Rtsne package) ...

  9. Python中第三方的库(library)、模块(module),包(package)的安装方法以及ImportError: No module named...

    Python中,想要安装第三方安装包,即third library,package等,对于熟悉的人来说,很简单. 但是对于新手,至少对于之前的我,很难,往往只是安装一个很小的包,都被搞得一头雾水. 现 ...

  10. R语言交互式可视化包CanvasXpress推荐

    文章目录 1 CanvasXpress包简介 1.1 canvasXpress安装及加载 2 绘图实战 2.1 三维散点图 2.2 矩阵散点图 2.3 箱线图 2.4 交互图表导出和交互 3 更多信息 ...

最新文章

  1. 基于 gulp 的 fancybox 源码压缩
  2. C++ Opengl图形颜色源码
  3. 图文解说:Nginx+tomcat配置集群负载均衡
  4. 云安全:云访问安全代理(CASB)系统的陷阱和潜力
  5. c语言几千行代码图片,【图片】发几个C语言课程设计源代码(恭喜自己当上技术小吧主)【东华理工大学吧】_百度贴吧...
  6. C# 线程手册 第二章 .NET 中的线程 线程的优势
  7. 需要规范日志格式_Node开发的日志规范
  8. java 微信转账 ca_error_CA证书出错,请登录微信支付商户平台下载证书
  9. 我的读书笔记 -《裸猿》
  10. Java 实现十进制数转换为二进制
  11. pta中c语言编程问题答案,pta题库答案_浙大远程教育2015秋 程序设计基础C 求PTA实验代码题库liujiahai-C答案_淘题吧...
  12. cpu字长、操作系统字长和jvm中各数据类型占用的字节数关系
  13. 宝哥面试题分享(07): Java中间件面试题
  14. paper_note
  15. 小白盒子无线打印服务器,小白智慧打印 打印机顶盒WIFI盒子开箱测评
  16. PostgreSQL中的距离计算问题 ST_Length
  17. [贪心+构造]撑起信息安全“保护伞”
  18. C++ 统计输入的字符串中英文字母的个数
  19. Protocol 的用法
  20. 【Java语言基础】1.3 Java补充知识

热门文章

  1. Linux卡巴斯基杀毒(kesl)基础操作
  2. autohotkey循环
  3. 解决sql server安装挂起
  4. 诺基亚手机: 诺基亚N9将在下月19日开卖 售价4400元
  5. 潍坊学院c语言上机题库,参编学校_C语言程序设计上机指导与同步训练(刘迎春、张艳霞)_pdf_大学课件预览_高等教育资讯网...
  6. NOIP2013普及组复赛第一题《计数问题》CA代码
  7. 《数据库系统基础教程》读书笔记——第一章 数据库系统世界
  8. 富文本编辑器粘贴图片
  9. 不用媒体查询做web响应式设计-遁地龙卷风
  10. kepware odata 接口访问地址