内容过长但详细,分三篇写,总结分享也供日后参考回顾

一、什么是R语言

R是免费的,是一个全面的统计研究平台,提供了各式各样的数据分析技术,R拥有顶尖的绘图功能

二、R语言优点和缺点

优点

1、有效的数据处理和保存机制

2、拥有一整套数组和矩阵的操作运算符

3、一系列连贯而又完整的数据分析中间工具。图形统计可以对数据直接进行分析和显示,可用于多种图形设备

4、一种相当完善、简洁和高效的程序设计语言

5、R语言是彻底面向对象的统计编程语言

6、R语言和其它编程语言、数据库之间有很好的接口

7、R语言是自由软件,可以放心大胆地使用,但其功能却不比任何其它同类软件差

8、R语言具有丰富的网上资源

缺点

1、不够规范,不容易上手,需要付出大量学习成本

2、扩展包不稳定

3、扩展包多,有很多重复功能,需要很多时间找自己需要的包

三、R软件的安装

1、登陆R官网 R: The R Project for Statistical Computing (r-project.org)

2、点击

3、选个离自己近的站点,我选的中国科技大学

4、选择版本

5、这个是二进制版本的R基础软件

6、就可以下载了

7、下载完成一直下一步安装即可

四、R软件的运行和设置

桌面双击图标,进入,一般32位的都有一个图标,64位的有俩,进去里面可以看到菜单,其他选项的内容都可以在控制台输入命令完成。窗口是最重要的部分,所有的工作都主要在这个窗口完成的

不管是什么系统,R语言都有三种运行方式:交互式、R脚本、R工作空间,打开R默认就是交互式的,可以通过写字板打开配置文件

我们可以在配置文件里自定义,加上First里放些自己常用的函数,Last里放点清理操作

五、Rstudio及基本操作

Rstudio是一款第三方开发的非常好用的R语言集成环境,软件把R控制台,绘图窗口、帮助窗口集成到一个界面下,还能补齐代码。必须先安装R软件,因为Rstudio是个集成环境不包括R软件,打开界面可以看到四个窗口

  1. 设定工作目录:很重要,所有输入和输出文件的默认位置,包括读取和写入数据等

  1. getwd()显示当前目录,setwd()修改目录

  1. 工作目录设置完就可以开始操作了,无需对变量进行声明

  1. 赋值运算符 ->/<-/<<-

  1. ls()列出变量,str()列出具体内容,ls.str()组合

  1. 删除工作空间不需要的变量可以是一个或多个rm(),删除之后无法恢复,没有回收站的功能,如果想删除所有的变量需要调用list函数,rm(list=ls())

  1. history()列出历史记录,()里可以写数字代表行数

  1. 清屏ctrl+L

  1. save.image()保存工作空间

  1. q()退出

六、R包的安装

可以根据官网的Task Views浏览R包,可以根据自己研究的方向到自己需要的类目去寻找自己需要的R包,学R包比学R还难,R包很多就好像手机APP,网址:The Comprehensive R Archive Network (r-project.org),再点击Task Views右边就可以看到各种各样的R包

安装R包的方式有两种,第一种联网在线安装,第二种代码安装,推荐第一种。安装包的函数install.packages(),括号里放入需要的R包,首次使用这个函数不加参数会提示选择镜像站点,我选择了一个比较近的,选择完后会弹出这个站点里的R包,R中使用字符串都需要加上引号,要是不输入引号就会把你输入的东西当做R的对象来处理,程序找不到这个对象就会报错。

联网在线安装

通过函数我们安装一下R包

有的时候镜像站点无法访问了,需要修改默认的镜像站点,我们可以修改Rprofile.set这个文件,修改里面的set a CRAN选项,默认是自动选择,要是选择不了,可以添加一个国内比较方便的站点

使用.libPaths()函数可以显示库的位置,在线安装会默认把R包安装到这个目录下

输入函数library()可以看到R包

使用代码安装

一些服务器为了安全无法访问网络采用代码安装的方式,要去R的官网或者镜像站点去下载源代码,需要注意依赖关系问题,如果提前知道依赖关系就要将依赖包一起下载上传到服务器,我们试着去安装一个包

这个包需要依赖plotrix这个包,我们将这两个包都下载下来

输入指令可以看到两个包,然后我们用R CMD INSTALL --help查看一下帮助信息

因为我们不能安装到R默认的库文件目录,所以需要通过这个选项指定包的安装目录

我们在当前目录下创建一个lib目录不需要解压缩

直接使用R CMD INSTALL接下载的包就可以开始安装

本地安装完R包使用时同样需要library进行加载,还需要将刚才创建的lib目录添加到系统的R_LIBS文件中,使用export

使用函数格式如下可以安装多个R包,使用update.packages()可以更新R包

七、R包的使用

R包分类

R软件本身包括:base、datasets、utils、grDevices、graphics、stats、methodes、splines、stats4、tcltk提供了种类繁多的默认函数和数据集。我们在使用的时候可以看到我们需要调用的函数属于哪个包,与R基础功能相关的函数就在base包中,datasets包用来存放R内置的数据集,grDevices与绘图设备选择相关的函数都在这个包中,graphics包是基于base图形的R函数,R默认绘图函数都放在这个包中。stats中用来存放与统计相关的函数,utils包是R语言工具函数,methodes包是R对象的一

般对应方法和类,splines,stats4,tcltk都是基础包

R包加载与删除

R包其实是函数数据预编译代码以一种定义完善的格式组成的集合,计算机上存储包的目录成为库叫library,函数.libPaths()能够显示库所在的位置,函数library()不加任何参数可以显示库中有哪些软件包,如果想使用R包可以使用library函数首先载入包,或者使用require(),这个时候就不需要引号了

下面两个函数可以看包的帮助文档,文档非常详细,有些R包比R本身还要复杂,这里面有用户指导手册、代码展示、实例展示、还有这个包的相关消息等,使用ls("package:vcd")看R包中包含的函数,使用data(package="vcd")可以列出R包中包含的所有数据集,使用完一个包之后想移除加载的包就detach("package=vcd"),如果想再使用就要重新加载,想删除已安装的包使用remove.packages("vcd")就从硬盘上彻底删除了

R包的批量移植

使用installed.packages()函数,列出当前函数已安装的R包,使用下标访问数据框的第一列,将所有R包的名字保存在同一个文件中,将这个文件移到另一台设备上,可以使用下标选择第一列保存成一个文件,然后在需要移植的设备使用load函数打开这个文件,存到另外一个变量R.pack中,我们可以使用一个for循环

八、R软件如何获取帮助

R软件在安装的时候会同时安装帮助文档,如果有图形化窗口,我们可以之间点击帮助选项,也可以在控制台终端中使用help函数,在R软件会调用浏览器打开,在Rstudio中会使用帮助窗口打开。要是查看某个函数的功能可以help()括号放函数的名字,也可以?后面接函数,这种更常用。想快速了解参数可以使用args(),example()函数可以查询实例,R还内置了demo函数,会列出R的一些案例图,必须先用library函数载用之后才能用help函数,也有一种方法使用??加函数,不用加载包也可以 简介、教程文档可以通过vignette()查看,不过不是所有都有文档,help.search("helpmap")进行本地搜索,也可以简写成??helpmap,apropos()列出所有包含关键字的内容,有的时候文档太老了就可以用网络搜索RsiteSearch(),看各种博客,查搜索引擎也可以(R seek)

九、Excel与R

Excel也是非常优秀的数据分析工具,两者最大的不同就是R软件不能使用鼠标,在R中都要使用代码完成,敲代码更适合批量化自动化,R一般用于大数据

十、R中内置数据集

数据集存储在R中的datasets包中,默认已经加载了这个包,这些数据都是真收集于真实的数据,有很多经典的数据集,也有许多很古老的数据,都是西方的。data()列出数据集,直接输入数据集的名字就可以使用数据集,这些数据集的名字都是内置的,我们给变量命名的时候最好不要重复了,不然就会被置换掉,不过影响不大,我们重新data()函数加载一下这个数据集就可以了

R语言与数据分析—上(篇幅长,全)相关推荐

  1. 《R语言游戏数据分析与挖掘》一2.2 数据对象

    2.2 数据对象 R拥有许多用于存储数据的对象类型,包括向量.矩阵.数组.数据框和列表.它们在存储数据的类型.创建方式.结构复杂度,以及用于定位和访问其中个别元素的标记等方面均有所不同.多样化的数据对 ...

  2. R语言 面板数据分析 plm包实现(一) ——LSDV和固定效应模型

    系列文章 R做面板数据分析:R语言 面板数据分析 plm包实现(一) --LSDV和固定效应模型 如果想看随机效应模型怎么做,参见这篇文章 R语言 面板数据分析 plm包实现(二)--随机效应模型 如 ...

  3. 2014全球软件技术峰会WOT:R语言金融数据分析

    跨界知识聚会系列文章,"知识是用来分享和传承的",各种会议.论坛.沙龙都是分享知识的绝佳场所.我也有幸作为演讲嘉宾参加了一些国内的大型会议,向大家展示我所做的一些成果.从听众到演讲 ...

  4. 【R语言与数据分析实战】绘图

    目录 1.散点图 2.图像选项 2.1 坐标轴名称 2.2 图形标题 2.3 点的类型 2.4 点的大小 2.5 颜色 2.6 坐标轴的取值范围 2.7 图像类型 2.8 线型 2.9 图形排列 2. ...

  5. 看书标记【R语言 商务数据分析实战6】

    看书标记--关于R语言 chapter 6 6.2 任务实 [R语言 商务数据分析实战6] chapter 6 P2P信用贷款风险控制(用户逾期还款概率模型) 关于数据库的应用+数据清洗+实时数据识别 ...

  6. 【R语言与数据分析实战】数据操作(一):基于向量的处理与外部数据处理

    目录 1.R中的常用数据集 2.读写CSV文件 (1) 读写CSV文件 (2) 读写对象文件 3.合并数据框的行与列 4.apply系数函数 (1) apply (2) lapply (3) sapp ...

  7. R语言与数据分析-01-数据类型与数据输入-01-基础

    一. R语言的数据类型 原文链接 : r语言与数据分析实战1 1.1 知识描述 搞清楚我们面对的数据类型是什么,并能实现数据类型之间的转换 1.2 相关知识 需要认真学习以下函数: mode(): 用 ...

  8. R语言ggplot2可视化:使用长表数据(窄表数据)( Long Data Format)可视化多个时间序列数据、在同一个可视化图像中可视化多个时间序列数据(Multiple Time Series)

    R语言ggplot2可视化:使用长表数据(窄表数据)( Long Data Format)可视化多个时间序列数据.在同一个可视化图像中可视化多个时间序列数据(Multiple Time Series) ...

  9. R语言对数线性模型loglm函数_用R语言进行数据分析:常规和广义线性模型

    用R语言进行数据分析:常规和广义线性模型 线性模型 对于常规的多重模型(multiple model)拟合,最基本的函数是lm(). 下面是调用它的方式的一种改进版: >fitted.model ...

最新文章

  1. 在python程序中的进程操作
  2. 树莓派:django,uwsgi,nginx安装与设置
  3. python列出文件夹所有文件_python列出文件夹所有文件有哪些方法?
  4. 计算机网络基础常考简答题,计算机网络基础知识简答题
  5. nginx 替换返回请求中的字符
  6. 常用的js正则表达式
  7. SWPUACM第二次周赛
  8. 基于python 实现KNN 算法
  9. ECO生态币官网blog.sina.com.cn/ecocoin
  10. 表白神器java代码_程序员的表白神器代码
  11. DA转换器原理及应用(报告)
  12. 知乎客户端埋点流程、模型和平台技术
  13. pg_buffercache
  14. Fama-French 三因子模型
  15. 无法安装office此计算机安装了32位,在电脑上安装64位Office2013出错提示找到了32位程序如何解决...
  16. 必备技能21:正尝试在 OS 加载程序锁内执行托管代码。不要尝试在 DllMain 或映像初始化函数内运行托管代码,这样做会导致应用程序挂起。
  17. 2020全国大学生数学建模竞赛赛题
  18. ECharts2.0
  19. 产品项目分析之竞品分析
  20. 如何将excel的一列变成多列(多排表使用帮助)

热门文章

  1. 数据挖掘的10个常见问题
  2. VO,PO,BO,QO, DAO ,POJO,的概念
  3. 远程网络监视(rmon)与简单网络管理协议(snmp)之间是什么关系
  4. WM开发常用资源下载 (转自黎波老师博客)
  5. 电影人生 - 一个人的电影
  6. C++算法 | 比较大小
  7. js 中日期 转换成时间戳 例如2020-12-19 转换为时间戳
  8. 怎么修改开龙软件里服务器名称,开龙设置服务器备份
  9. Nginx stream 配置代理(Nginx TCP/UDP 负载均衡)
  10. 重启explore(桌面进程)